机器学习 | 神经网络介绍 | 概念向

news2025/4/19 21:43:49

文章目录

  • 📚从生物神经元到人工神经元
  • 📚神经网络初识
    • 🐇激活函数——让神经元“动起来”
    • 🐇权重与偏置——调整信息的重要性
    • 🐇训练神经网络——学习的过程
    • 🐇过拟合与正则化——避免“死记硬背”

👀学习参考视频

  • 从函数到神经网络【白话DeepSeek01】
  • 如何计算神经网络的参数【白话DeepSeek02】
  • 调教神经网络咋这么难?【白话DeepSeek03】

📚从生物神经元到人工神经元

  • 神经元是信息处理的基本单元
    • 生物神经元:大脑中的神经元通过电信号传递信息。当一个神经元接收到足够强的信号时,它会“激活”,将信号传递给其他神经元。
    • 人工神经元(感知机):模拟生物神经元,接受输入信号,通过计算决定是否激活。
  • 想象神经元是一个工厂里的工作站。原材料(输入信号)被送到工作站,工人(计算过程)对原材料进行初步加工(线性计算,计算输入的加权和并加上偏置),质检员(激活函数)决定是否加工这些材料,并将成品(输出信号)传递给下一个工作站。
    在这里插入图片描述

📚神经网络初识

神经网络是模仿人脑结构和功能的计算模型,由大量简单的人工神经元(节点)组成,通过连接权重传递和处理信息,能够学习数据中的模式和规律,广泛应用于图像识别、自然语言处理等领域。

🐇激活函数——让神经元“动起来”

  • 激活函数决定神经元是否传递信号。常见激活函数有Sigmoid、ReLU、Tanh。它们的核心作用是引入非线性并控制信号的传递方式,让网络能学习复杂模式。
    在这里插入图片描述

  • ⭐️激活函数像质检员。比如:

    • ReLU:如果输入值小于0,直接扔掉(输出0);如果大于0,原样通过。

    • Sigmoid:质检员会根据输入值打分(0到1之间),比如“这个包裹有70%的概率需要特殊处理”。

      在这里插入图片描述

  • 激活函数套娃实现复杂线性关系的激活,理论上可以逼近任意的线性函数,但这样表示太繁琐且麻烦——用神经元表示,每套一层相当于神经元水平方向又扩展了一层,水平扩展以后,中间的就是隐藏层,起始和末端分别是输入层和输出层。
    在这里插入图片描述
    在这里插入图片描述

    • 神经网络由输入层、隐藏层、输出层构成
    • 输入层:接收原始数据(如图像像素、文字等)。
    • 隐藏层:负责提取数据的特征(如识别图像中的边缘、颜色)。
    • 输出层:生成最终结果(如分类结果“猫”或“狗”)。
  • 虽然函数可能非常复杂,但我们的目标非常简单且明确——根据已知的一组x和y的值,猜出所有的w和b都是多少
    在这里插入图片描述

🐇权重与偏置——调整信息的重要性

  • 权重控制输入信号的影响程度,偏置调整激活阈值
    • 权重(Weights):每个输入信号乘以一个权重值,决定其重要性。权重的本质是通过线性组合放大/抑制输入信号,公式为 z = w 1 x 1 + w 2 x 2 + . . . + w n x n + b z = w_1x_1 + w_2x_2 + ... + w_nx_n + b z=w1x1+w2x2+...+wnxn+b
    • 偏置(Bias):类似“门槛”,调整神经元激活的难易程度。偏置独立于输入的常量,决定激活函数的触发难易度,公式为 输出 = f ( z ) = f ( 加权和 + b ) 输出= f(z) = f(\text{加权和} + b) 输出=f(z)=f(加权和+b)

🐇训练神经网络——学习的过程

  • 通过调整权重和偏置,让网络输出接近正确答案

    • 前向传播:数据从输入层流向输出层,生成预测结果。
      在这里插入图片描述

    • 损失函数:计算预测结果与真实答案的差距,如均方误差 M S E = 1 N ∑ i = 1 N ( y i − y ^ i ) 2 MSE= \frac{1}{N} \sum_{i=1}^{N} \left( y_i - \hat{y}_i \right)^2 MSE=N1i=1N(yiy^i)2)。
      在这里插入图片描述
      在这里插入图片描述

    • 反向传播:根据误差反向调整权重和偏置。
      在这里插入图片描述
      在这里插入图片描述

    • 优化器(如梯度下降):决定如何调整参数。
      在这里插入图片描述

  • 神经网络的训练,就是一个通过错误不断自我修正的过程,和人类学习本质上是一样的。

  • ⭐️训练神经网络像教一个新手厨师做菜

    • (前向传播)厨师按自己的菜谱(当前参数)做了一道宫保鸡丁(输出结果)→ 神经网络根据权重和偏置计算预测值
    • (损失函数)你对照标准菜谱(真实标签),逐项打分:辣度差距:-3分(少放了辣椒),甜度差距:+2分(糖放多了)→ 计算预测值与真实值的误差(如MSE)
    • (反向传播)你告诉厨师,辣椒的影响:每少放1克辣椒,辣度降低2分(梯度计算 ∂ l o s s / ∂ 辣椒 ∂loss/∂辣椒 loss/辣椒);糖的影响:每多放1克糖,甜度增加1分(梯度计算 ∂ l o s s / ∂ 糖 ∂loss/∂糖 loss/→ 通过链式法则计算每个参数的梯度
    • (优化器)厨师根据反馈调整菜谱,普通厨师:直接按误差比例调整(SGD优化器);聪明厨师:参考上次调整的效果,避免反复震荡(Adam优化器)→ 根据梯度更新权重和偏置
    • (迭代训练)厨师重复做这道菜100次(epoch),每次调整后味道越来越接近标准→ 模型通过多次迭代最小化损失函数。
    • ps:学习率 ↔ 厨师的调整幅度,如果厨师每次只敢微调0.1克盐(小学习率),学习速度慢但稳定;如果一次猛加5克盐(大学习率),可能导致味道失控(梯度爆炸)。

🐇过拟合与正则化——避免“死记硬背”

  • 防止模型在训练数据上表现太好,但泛化能力差
  • 过拟合:模型记住了训练数据的细节(如噪声),但无法处理新数据,像学生死记硬背考试题,但遇到新题就懵了
    在这里插入图片描述
  • 正则化(如L1/L2正则化、Dropout):
    • L1/L2正则化:限制模型的复杂度。通过在损失函数中添加权重惩罚项,抑制其野蛮生长。
      在这里插入图片描述
    • Dropout:随机让一部分学生缺席复习(训练时随机忽略部分神经元)。
      在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2336467.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

视频孪生重构施工逻辑:智慧工地的数字化升级

当"智慧工地"概念在2017年首次写入《建筑业发展"十三五"规划》时,行业普遍将其等同于摄像头与传感器的简单叠加。十年数字浪潮冲刷下,智慧工地的内涵已发生本质跃迁:从工具层面的信息化改造,进化为基于视频数…

六根觉性:穿透表象的清净觉知之光

在喧嚣的禅堂里,老禅师轻叩茶盏,清脆的声响划破沉寂。这声"叮"不仅震动耳膜,更叩击着修行者的心性——这正是佛教揭示的六根觉性在世间万相中的妙用。当我们凝视《楞严经》中二十五圆通法门,六根觉性犹如六道澄明之光&a…

spring:注解@Component、@Controller、@Service、@Reponsitory

背景 spring框架的一个核心功能是IOC,就是将Bean初始化加载到容器中,Bean是如何加载到容器的,可以使用spring注解方式或者spring XML配置方式。 spring注解方式直接对项目中的类进行注解,减少了配置文件内容,更加便于…

Halcon应用:九点标定-手眼标定

提示:若没有查找的算子,可以评论区留言,会尽快更新 Halcon应用:九点标定-手眼标定 前言一、Halcon应用?二、应用实战1、图形理解[eye-to-hand]:1.1、开始应用2 图形理解[eye-in-hand] 前言 本篇博文主要用…

【iOS】OC高级编程 iOS多线程与内存管理阅读笔记——自动引用计数(一)

自动引用计数 前言alloc/retain/release/dealloc实现苹果的实现 autoreleaseautorelease实现苹果的实现 总结 前言 此前,写过一遍对自动引用计数的简单学习,因此掠过其中相同的部分:引用计数初步学习 alloc/retain/release/dealloc实现 由于…

Python爬虫第15节-2025今日头条街拍美图抓取实战

目录 一、项目背景与概述 二、环境准备与工具配置 2.1 开发环境要求 2.2 辅助工具配置 三、详细抓取流程解析 3.1 页面加载机制分析 3.2 关键请求识别技巧 3.3 参数规律深度分析 四、爬虫代码实现 五、实现关键 六、法律与道德规范 一、项目概述 在当今互联网时代&a…

智慧城市像一张无形大网,如何紧密连接你我他?

智慧城市作为复杂巨系统,其核心在于通过技术创新构建无缝连接的网络,使物理空间与数字空间深度融合。这张"无形大网"由物联网感知层、城市数据中台、人工智能中枢、数字服务入口和安全信任机制五大支柱编织而成,正在重塑城市运行规…

网络安全·第四天·扫描工具Nmap的运用

今天我们要介绍网络安全中常用的一种扫描工具Nmap,它被设计用来快速扫描大型网络,主要功能包括主机探测、端口扫描以及版本检测,小编将在下文详细介绍Nmap相应的命令。 Nmap的下载安装地址为:Nmap: the Network Mapper - Free Se…

黑龙江 GPU 服务器租用:开启高效计算新征程

随着人工智能、深度学习、大数据分析等技术的广泛应用,对强大计算能力的需求日益迫切。GPU 服务器作为能够提供卓越并行计算能力的关键设备,在这一进程中发挥着至关重要的作用。对于黑龙江地区的企业、科研机构和开发者而言,选择合适的 GPU 服…

SparseDrive---论文阅读

纯视觉下的稀疏场景表示 算法动机&开创性思路 算法动机: 依赖于计算成本高昂的鸟瞰图(BEV)特征表示。预测和规划的设计过于直接,没有充分利用周围代理和自我车辆之间的高阶和双向交互。场景信息是在agent周围提取&#xff…

Unchained 内容全面上链,携手 Walrus 迈入去中心化媒体新时代

加密新闻媒体 Unchained — — 业内最受信赖的声音之一 — — 现已选择 Walrus 作为其去中心化存储解决方案,正式将其所有媒体内容(文章、播客和视频)上链存储。Walrus 将替代 Unchained 现有的中心化存储架构,接管其全部历史内容…

确保连接器后壳高性能互连的完整性

本文探讨了现代后壳技术如何促进高性能互连的电气和机械完整性,以及在规范阶段需要考虑的一些关键因素。 当今的航空航天、国防和医疗应用要求连接器能够提供高速和紧凑的互连,能够承受振动和冲击,并保持对电磁和射频干扰 (EMI/R…

C++学习Day0:c++简介

目录 一、.C语言的发展史二、C特点三、面向对象的重要术语四、面向过程和面向对象的区别?五、开发环境:六、创建文件步骤:1.点击新建项目2.在弹出的开始栏中按如下操作3.在.pro文件中添加(重要!!&#xff0…

从零开始构建 Ollama + MCP 服务器

Model Context Protocol(模型上下文协议)在过去几个月里已经霸占了大家的视野,出现了许多酷炫的集成示例。我坚信它会成为一种标准,因为它正在定义工具与代理或软件与 AI 模型之间如何集成的新方式。 我决定尝试将 Ollama 中的一…

MATLAB学习笔记(二) 控制工程会用到的

MATLAB中 控制工程会用到的 基础传递函数表达传递函数 零极点式 状态空间表达式 相互转化画响应图线根轨迹Nyquist图和bode图现控部分求约旦判能控能观极点配置和状态观测 基础 传递函数表达 % 拉普拉斯变换 syms t s a f exp(a*t) %e的a次方 l laplace(f) …

C++ 线程间通信开发从入门到精通实战

C 线程间通信开发从入门到精通实战 在现代软件开发中,多线程程序已成为提升应用性能、实现并行处理的重要手段。随着多核处理器的普及和复杂应用需求的增加,C作为一门高性能的编程语言,在多线程开发中扮演着不可或缺的角色。然而&#xff0c…

Redis原理与Windows环境部署实战指南:助力测试工程师优化Celery调试

引言 在分布式系统测试中,Celery作为异步任务队列常被用于模拟高并发场景。而Redis作为其核心消息代理,其性能和稳定性直接影响测试结果。本文将深入解析Redis的核心原理,主要讲解Windows环境部署redis,为测试工程师提供一套完整…

Go语言入门到入土——一、安装和Hello World

Go语言入门到精通——安装和Hello World 文章目录 Go语言入门到精通——安装和Hello World下载并安装让Go跑起来为你的代码启动依赖跟踪调用外部包总结 下载并安装 下载地址:https://go.dev/dl/ 下载后傻瓜式安装 查看是否安装完成 go version让Go跑起来 创建一个…

opencv函数展示

一、图像基础 I/O 与显示 1.cv2.imread() 2.cv2.imshow() 3. cv2.waitKey() 4. cv2.imwrite() 5. cv2.selectROI() 6. cv2.VideoCapture() 二、颜色空间与转换 1. cv2.cvtColor() 2. cv2.split() 三、阈值处理 1. cv2.threshold() 2. 特殊阈值方法

【vue3】vue3+express实现图片/pdf等资源文件的下载

文件资源的下载,是我们业务开发中常见的需求。作为前端开发,学习下如何自己使用node的express框架来实现资源的下载操作。 实现效果 代码实现 前端 1.封装的请求后端下载接口的方法,需求配置aixos的请求参数里面的返回数据类型为blob // 下载 export…