前向传播与反向传播涉及到的知识点

news2024/12/28 2:06:06

目录

引入:

一、神经网络(NN)复杂度

空间复杂度

时间复杂度

二、学习率

三、指数衰减学习率——解决lr的选择

1.总结经验

2.公式引入

四、激活函数

1.简单模型:最初的理解

 2.激活函数MP模型

 3.优秀的激活函数的特点

4.常见的激活函数

a)Sigmoid()函数

图像

特点

b)Tanh()函数

c)Relu()函数

d)Leaky Relu函数

五、损失函数

1.均方误差

 2.自定义

3.交叉熵

4.softmax与交叉熵结合

六、欠拟合与过拟合

1.图像直观引入

 2.欠拟合

3.过拟合

4.正则化缓解过拟合

七、优化器

1.常见的优化器

SGD(无momentum),常用的梯度下降法

SGDM(含momentum的SGD),在SGD基础上增加一阶动量

Adagrad,在SGD基础上增加二阶动量

RMSProp,SGD基础上增加二阶动量

Adam, 同时结合SGDM一阶动量和RMSProp二阶动

总结


引入:

前向传播:从输入到输出(执行方向)

反向传播:从输出到输入(优化参数)

训练过程:前向传播->反向传播->前向传播->反向传播 。。。。。->结果(不断优化直到数据用完)

一、神经网络(NN)复杂度

概念:NN复杂度:多用NN层数和NN参数的个数表示,神经网络层有:输入层和隐藏层和输出层,但输入层是不算层的,前一个输出等于后一个的输入

空间复杂度

层数 = 隐藏层的层数 + 1个输出层 左图为2层NN 

总参数 = 总w + 总b 左图3x4+4(第1层) + 4x2+2(第2层) = 26

时间复杂度

乘加运算次数 左图 3x4(第1层) + 4x2( 第2层) = 20 时间复杂度

二、学习率

作用:反向传播,根据损失函数的梯度方向,进行更新y=w*x+b中的w参数

总结经验:lr=0.001过慢,lr=0.999不收敛

三、指数衰减学习率——解决lr的选择

1.总结经验

可以先用较大的学习率,快速得到较优解,然后逐步减小学习率,使 模型在训练后期稳定。

2.公式引入

 指数衰减学习率 = 初始学习率 * 学习率衰减率( 当前轮数 / 多少轮衰减一次 )

四、激活函数

1.简单模型:最初的理解

 2.激活函数MP模型

 3.优秀的激活函数的特点

  • 非线性: 激活函数非线性时,多层神经网络可逼近所有函数
  • 可微性: 优化器大多用梯度下降更新参数 
  • 单调性: 当激活函数是单调的,能保证单层网络的损失函数是凸函数
  • 近似恒等性: f(x)≈x当参数初始化为随机小值时,神经网络更稳定

输出有限无限注意点

激活函数输出为有限值时,基于梯度的优化方法更稳定

激活函数输出为无限值时,建议调小学习率

4.常见的激活函数

a)Sigmoid()函数

图像

 

特点

特点 (1)易造成梯度消失 (2)输出非0均值,收敛慢 (3)幂运算复杂,训练时间长

b)Tanh()函数

图像

特点 (1)输出是0均值 (2)易造成梯度消失 (3)幂运算复杂,训练时间长

c)Relu()函数

 

图像

优点: (1) 解决了梯度消失问题 (在正区间) (2) 只需判断输入是否大于0,计算速度快 (3) 收敛速度远快于sigmoid和tanh

 缺点: (1) 输出非0均值,收敛慢 (2) Dead RelU问题:某些神经元可能永远不会 被激活,导致相应的参数永远不能被更新。

d)Leaky Relu函数

图像

 理论上来讲,Leaky Relu有Relu的所有优点,外加不会有Dead Relu问题,但是 在实际操作当中,并没有完全证明Leaky Relu总是好于Relu。

激活函数建议

  • 首选relu激活函数
  • 学习率设置较小值
  • 输入特征标准化,即让输入特征满足以0为均值, 1为标准差的正态分布
  • 初始参数中心化,即让随机生成的参数满足以0 为均值

五、损失函数

概念:预测值(y)与已知答案(y_)的差距

 网络优化:是的loss越来越小,反向传播是的acc更大

  • 均方误差:mse (Mean Squared Error)
  • 自定义
  • 交叉熵损失函数CE (Cross Entropy)

1.均方误差

 

 2.自定义

目的:比如买东西,货多买的少,那成本就高,货少买的多,那么利润就少,但是利润   !=成本

 乘一下权重就可以了

3.交叉熵

4.softmax与交叉熵结合

输出先过softmax函数,再计算y与y_的交叉熵损失函数。

六、欠拟合与过拟合

1.图像直观引入

 2.欠拟合

欠拟合的解决方法:

  • 增加输入特征项
  • 增加网络参数
  • 减少正则化参数

3.过拟合

过拟合的解决方法:

  • 数据清洗
  • 增大训练集 采用正则化
  • 增大正则化参数

4.正则化缓解过拟合

正则化在损失函数中引入模型复杂度指标,利用给W加权值,弱化了训练 数据的噪声(一般不正则化b)

loss = loss( y与y_ ) + REGULARIZER * loss(w)

正则化的选择

L1正则化大概率会使很多参数变为零,因此该方法可通过稀疏参数 ,即减少参数的数量,降低复杂度。

L2正则化会使参数很接近零但不为零,因此该方法可通过减小参数 值的大小降低复杂度

七、优化器

概念:待优化参数  优化器框架𝒘,损失函数𝒍ose,学习率𝒍r,每次迭代一个batch, t表示当前batch迭代的总次数:

1.常见的优化器

  • SGD(无momentum),常用的梯度下降法

  • SGDM(含momentum的SGD),在SGD基础上增加一阶动量

  • Adagrad,在SGD基础上增加二阶动量

  • RMSProp,SGD基础上增加二阶动量

  • Adam, 同时结合SGDM一阶动量和RMSProp二阶动

备注:这里就不一一解释了,每一个优化器都是在反向传播过程中与损失函数结合来优化参数的,得出更精确的数据,选择精度越高,则内存越大,精度适中,内存始终,自己来决定

作用:优化器就是在深度学习反向传播过程中,指引损失函数(目标函数)的各个参数往正确的方向更新合适的大小,使得更新后的各个参数让损失函数(目标函数)值不断逼近全局最小

总结

  • 本文主要借鉴:mooc曹健老师的《人工智能实践:Tensorflow笔记》
  • 正向传播:激活函数
  • 反向传播:损失函数、优化器
  • 欠拟合和过拟合:利用正则化来环节
  • 深度学习过程:前向传播,损失函数,优化器,反向传播更新w和b

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/928558.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

广州华锐视点:VR技术在航天教育的应用优势

VR技术在航天教育中的应用可以带来许多创新和优势,为学生和公众提供更加生动、沉浸式的航天科学学习体验。以下是VR技术在航天教育中的几个主要应用方面: 航天探索模拟:VR技术可以模拟航天探索的场景,让学生和公众身临其境地感受航…

FFmpeg<第一篇>:环境配置

1、官网地址 http://ffmpeg.org/download.html2、linux下载ffmpeg 下载: wget https://ffmpeg.org/releases/ffmpeg-snapshot.tar.bz2解压: tar xvf ffmpeg-snapshot.tar.bz23、FFmpeg ./configure编译参数汇总 解压 ffmpeg-snapshot.tar.bz2 之后&…

Vulnhub: DriftingBlues: 1靶机

kali:192.168.111.111 靶机:192.168.111.215 信息收集 端口扫描 nmap -A -sC -v -sV -T5 -p- --scripthttp-enum 192.168.111.215 80端口首页源码 访问noteforkingfish.txt,发现为Ook!加密的密文 解密后提示需要用户eric和修改hosts文件&…

【Python编程】将同一种图片分类到同一文件夹中

一、数据结构如下: 二、编程工具:Jupyter-Notebook 三、代码: import os import cv2 import shutilpath0os.getcwd()\\apple\\RGB path1os.getcwd()\\apple\\tof_confidence path2os.getcwd()\\apple\\tof_depth path3os.getcwd()\\apple\\…

教你写出高质量函数,简单又实用

在编写函数时,程序员通常需要遵循以下步骤进行: 1、确定最佳的设计逻辑是编写函数时应该考虑的重要因素。这些因素包括设计合理的数据结构、算法和逻辑封装,并且还要考虑到用户的安全因素。挑战在于确保所设计的方案既满足客户需求&#xff…

药品不良反应数据库有哪些?记住这个就够用了

药品不良反应数据库的作用是收集、记录和分析药品使用过程中可能出现的不良反应信息。这些数据库通常由医药监管机构、医药数据公司、医疗机构和科研机构等建立和维护,在监测和评估药品的安全性、发现和确认新的不良反应、支持药品监管决策、提供医学信息和警示等方…

【局部活动轮廓】使用水平集方法实现局部活动轮廓方法研究(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

会员管理系统实战开发教程04-会员开卡

我们已经用3篇篇幅介绍了会员管理的功能,接着就要开发会员的业务。通常我们开通会员之后需要给会员开通会员卡,一个会员可以有多张会员卡。 在数据源设计的时候,像这种一个会员有多张会员卡的,我们称之为一对多的关系&#xff0c…

Sentinel流量控制与熔断降级

📝 学技术、更要掌握学习的方法,一起学习,让进步发生 👩🏻 作者:一只IT攻城狮 ,关注我,不迷路 。 💐学习建议:1、养成习惯,学习java的任何一个技术…

Levels - 场景参考:山脉景观(Landscape Mountains)

一些从前的笔记的归档,记录了一些UE4资产的相关信息; 山脉景观(Landscape Mountains): 项目的地形材质比较复杂,有几个比较重要的大效果功能,一个是沉积岩的效果: 沉积岩效果的功能…

聊聊NFC技术

目录 1.什么是NFC 2.NFC技术的原理 3.NFC技术的应用 4.NFC技术对生活的影响 1.什么是NFC NFC(Near Field Communication)是一种短距离无线通信技术,可在10厘米以内进行点对点的数据传输。它是基于RFID(Radio Frequency Identif…

基于OpenCV实战(基础知识二)

目录 简介 1.ROI区域 2.边界填充 3.数值计算 4.图像融合 简介 OpenCV是一个流行的开源计算机视觉库,由英特尔公司发起发展。它提供了超过2500个优化算法和许多工具包,可用于灰度、彩色、深度、基于特征和运动跟踪等的图像处理和计算机视觉应用。Ope…

IDEA 出现问题:.gitgnore忽略文件失效解决方案

❤️作者主页:小虚竹 ❤️作者简介:大家好,我是小虚竹。Java领域优质创作者🏆,CSDN博客专家🏆,华为云享专家🏆,掘金年度人气作者🏆 ❤️技术活,该赏 ❤️点赞…

光惯混合动作捕捉系统:开启空间定位全新时代

在当今的技术前沿,光惯混合动作捕捉系统正在崭露头角,成为定位技术的新标杆,更是一项生活中不可或缺的实用工具。它是一个集光学与惯性测量技术于一体的全新定位解决方案,巧妙地融合了光学与惯性测量的优势,以其突破性…

Mars3d的历史版本api文档下载地址

说明: 1.我们一直在进步迭代新功能升级产品打造服务,但是鉴于目前依然有很多老的项目无法升级,需要维护。现提供历史版本的api文档供大家学习参考 2.建议跟随官网同步升级新版本,新功能更多,更值得大家快速上手。 3…

【速成】蓝桥杯嵌入式省一教程:(十一)UART串口通信

与I2C、SPI一样,UART是一种通信协议,设备之间依靠Rx(Receive)与Tx(Transmit)两条线进行数据传输。一个单片机通常内置有多个UART,而这些UART通常都与单片机上的USB接口连接在一起,因此只需要将单片机通过数据线与电脑相连&#xf…

CK-GW06-E03与汇川PLC的EtherNet/IP通信

准备阶段: CK-GWO6-E03网关POE交换机网线汇川PLC编程软件汇川AC801-0221-U0R0型号PLC 1.打开汇川PLC编程软件lnoProShop(V1.6.2)SP2 新建工程,选择对应的PLC型号,编程语言选择为“结构化文本(ST)语言”,然…

数据库连接池druid 的jar包官网下载-最新版下载

进入官网Central Repository: com/alibaba/druid 往下滑 找到最新版点击进入 找到该jar包 点击即可下载

树状表格父节点选择 - 在Vue.js中实现仅选择父节点的树状表格功能

功能介绍 本文介绍了如何在Vue.js框架下实现一个树状表格,其中只支持选择父节点的复选框。通过这个功能,用户可以方便地选择表格中的父节点,而无需关心子节点的选择。代码示例和详细的实现步骤将展示如何使用Vue.js的相关特性和组件实现这个功…

WPF基础入门-Class3-WPF数据模板

WPF基础入门 Class3&#xff1a;WPF数据模板 1、先在cs文件中定义一些数据 public partial class Class_4 : Window{public Class_4(){InitializeComponent();List<Color> test new List<Color>();test.Add(new Color() { Code "Yellow", Name &qu…