反向传播法(backpropagation)的基本原理

news2024/11/15 11:01:46

本文通过整理李宏毅老师的机器学习教程的内容,介绍神经网络中用于更新参数的反向传播法(backpropagation)的基本原理。

反向传播 backpropagation, 李宏毅


神经网络的结构:
神经网络的结构

loss(损失)的计算:
loss 计算
L ( θ ) = ∑ n = 1 N C n ( θ ) L(\theta) = \sum_{n=1}^{N} C^{n}(\theta) L(θ)=n=1NCn(θ)

其中,上标 n n n 表示第 n n n 条数据。

易知:网络参数的更新取决于数据的 loss 值,而更新方式即为梯度下降法(gradient descent)。

以单个神经元为例:
神经元

loss 对参数 w w w 的偏微分:
∂ L ( θ ) ∂ w = ∑ n = 1 N ∂ C n ( θ ) ∂ w \frac {\partial L(\theta)} {\partial w} = \sum_{n=1}^{N} \frac {\partial C^{n}(\theta)} {\partial w} wL(θ)=n=1NwCn(θ)

对参数 b b b 的偏微分类似。

简单地,考虑其中一条数据的 loss 值,并将 C n ( θ ) C^{n}(\theta) Cn(θ) 简记为 C C C,则:
∂ C ∂ w = ∂ z ∂ w ∂ C ∂ z \frac {\partial C} {\partial w} = \frac {\partial z} {\partial w} \frac {\partial C} {\partial z} wC=wzzC

其中,对第一项偏微分 ∂ z ∂ w \frac {\partial z} {\partial w} wz 的计算称为 forward pass,对第二项偏微分 ∂ C ∂ z \frac {\partial C} {\partial z} zC 的计算称为 backward pass,继续看下去会理解其原因。

易知:第一项偏微分其实就等于数据输入 x x x,即:
∂ z ∂ w 1 = x 1 ∂ z ∂ w 2 = x 2 \frac {\partial z} {\partial w_1} = x_1 \quad \frac {\partial z} {\partial w_2} = x_2 w1z=x1w2z=x2

而计算第二项偏微分则不太容易,因为在 z z z 后面的非线性模块之后,可能还有多个网络层:
对 z 的偏微分

于是对第二项偏微分 ∂ C ∂ z \frac {\partial C} {\partial z} zC 继续展开,得到:
∂ C ∂ z = ∂ a ∂ z ∂ C ∂ a \frac {\partial C} {\partial z} = \frac {\partial a} {\partial z} \frac {\partial C} {\partial a} zC=zaaC

而由于非线性模块的输出 a = σ ( z ) a = \sigma(z) a=σ(z),故第一项: ∂ a ∂ z = σ ′ ( z ) \frac {\partial a} {\partial z} = \sigma^{\prime}(z) za=σ(z)
而第二项可进一步展开为:
∂ C ∂ a = ∂ z ′ ∂ a ∂ C ∂ z ′ + ∂ z ′ ′ ∂ a ∂ C ∂ z ′ ′ \frac {\partial C} {\partial a} = \frac {\partial z^{\prime}} {\partial a} \frac {\partial C} {\partial z^{\prime}} + \frac {\partial z^{\prime \prime}} {\partial a} \frac {\partial C} {\partial z^{\prime \prime}} aC=azzC+az′′z′′C

与前面类似地,有:
∂ z ′ ∂ a = w 3 ∂ z ′ ′ ∂ a = w 4 \frac {\partial z^{\prime}} {\partial a} = w_3 \quad \frac {\partial z^{\prime \prime}} {\partial a} = w_4 az=w3az′′=w4

而计算 ∂ C ∂ z ′ \frac {\partial C} {\partial z^{\prime}} zC ∂ C ∂ z ′ ′ \frac {\partial C} {\partial z^{\prime \prime}} z′′C 需要下一次迭代,以此类推。

因此,如果网络的层级特别多,正向计算会非常繁琐。

但如果反过来看,从输出层开始,先得到 ∂ C ∂ z ′ \frac {\partial C} {\partial z^{\prime}} zC ∂ C ∂ z ′ ′ \frac {\partial C} {\partial z^{\prime \prime}} z′′C,再反向计算前面各层的 ∂ C ∂ z \frac {\partial C} {\partial z} zC 就会比较容易:
反向计算

其中,由于正向计算时已计算过各层的输出,因此 σ ′ ( z ) \sigma^{\prime}(z) σ(z) 为常数。

最后,总结整体过程入下:
整体过程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1134096.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

淘宝、京东双11活动全自动脚本丨IOS+安卓

淘宝的活动 - 幻想岛总动员开始了! 又开始手忙脚乱地做任务了,逛逛蚂蚁森林、芭芭农场、答题、逛店铺...很多任务,纯手动当然很累,这个时候,我们就需要借助一些脚本软件,让他自动完成任务,薅点小…

基于android的 rk3399 同时支持多个USB摄像头

基于android的 rk3399 同时支持多个USB摄像头 一、前文二、CameraHal_Module.h三、CameraHal_Module.cpp四、编译&烧录Image五、App验证 一、前文 Android系统默认支持2个摄像头,一个前置摄像头,一个后置摄像头 需要支持数量更多的摄像头&#xff0…

博睿动态|GOPS全球运维大会2023上海站即将开启!

10月26日,博睿数据将应邀出席第二十一届 GOPS 全球运维大会,大会为期2天,侧重方向是 DevOps、BizDevOps、AIOps、DevSecOps、云原生、效能度量等技术领域。 博睿数据AIOps首席专家兼产品总监贺安辉受邀出席10月26日的AIOps最佳实践及解决方案…

8 路数字量输入兼容干接点、湿节点多功能RTU

污水处理厂是处理废水并确保其符合排放标准的重要设施。为了监控和管理污水处理厂的流量和流速数据,采集网关在其中起到关键作用。本文将介绍污水处理厂流量流速数据采集网关的功能、工作原理以及其在污水处理厂中的重要性。 实时监测流量和流速数据:网关…

Arduion-STM32

​ Arduion-STM32 stm32duino 让stm32 在arduino中使用 源代码:GitHub - stm32duino/Arduino_Core_STM32: STM32 core support for Arduino busybox文件位置 stm32duino 下有个stm32tool 项目,内含有busybox.exe 使用usb转TTL烧写 使用 PA9 PA10 …

Linux cd命令:切换目录

cd 命令,是 Change Directory 的缩写,用来切换工作目录。Linux 命令按照来源方式,可分为两种,分别是 Shell 内置命令和外部命令。 所谓 Shell 内置命令,就是 Shell 自带的命令,这些命令是没有执行文件的&a…

VulnHub Tre

一、信息收集 1.nmap扫描 发现开发端口:22、80、8082 访问80和8082端口,没有发现什么有价值的信息 2.扫描目录 dirsearch扫描目录 ┌──(root💀kali)-[~/routing/dirsearch-] └─# python3 dirsearch.py -u "http://192.168.103.1…

sudo apt update 后会出现的一堆问题的解决

于是,我选择卸载CUDA : 采用的方法是: cd /usr/local/cuda-11.4/bin/ sudo ./cuda-uninstaller sudo rm -rf /usr/local/cuda-11.4 然后重新下载CUDA: 下载的时候注意: 首先选择下载对应的版本,如果还…

C++基础语法——智能指针

目录 1.智能指针存在的意义 2.内存泄漏 ①什么是内存泄漏,内存泄漏的危害 ②内存泄漏分类 ③如何检测内存泄漏 ④如何避免内存泄漏 3.智能指针的使用及其模拟实现 ①RAII ②智能指针的原理 ③std::auto_ptr 模拟实现 ④std::unique_ptr 模拟实现 ⑤st…

【目标跟踪】ECO算法论文阅读:ECO: Efficient Convolution Operators for Tracking

文章目录 1. 论文概要2. 研究背景和动机3. 相关滤波用于目标跟踪的原理4. ECO算法流程5. ECO算法创新点5.1 特征降维:PCA5.2 训练集简化:GMM5.3 模型更新策略:间歇更新 1. 论文概要 论文下载地址:ECO: Efficient Convolution Oper…

UG\NX二次开发 设置对象的高亮状态 UF_DISP_set_highlight

文章作者:里海 来源网站:王牌飞行员_里海_里海NX二次开发3000例,里海BlockUI专栏,C\C++-CSDN博客 感谢粉丝订阅 感谢 2301_79203630 订阅本专栏,非常感谢。 简介 UG\NX二次开发 设置对象高亮状态 UF_DISP_set_highlight 效果 代码 #include "me.hpp"extern DllEx…

Redis数据库管理工具Redis Desktop Manager最新中文

Redis Desktop Manager是一款直观且易用的Redis数据库管理工具,支持Windows、macOS和Linux等多平台。它提供了丰富的功能和工具,使用户可以轻松地创建、编辑、删除和浏览Redis键值对,并执行各种Redis命令。通过SSH Tunnel连接,RDM…

信号浪涌保护器的行业应用和原理与分类解决方案

什么是信号浪涌保护器 信号浪涌保护器是一种电子设备,它可以保护信号线路上的仪器、设备或系统免受雷击或其他瞬态过电压的损害。 信号浪涌保护器的主要原理是将线路上产生的高压浪涌,泄放到大地,将其限制到被保护对象可以耐受的范围内&…

【博士每天一篇文献-算法】Overcoming catastrophic forgetting in neural networks

阅读时间:2023-10-24 1 介绍 年份:2016 作者:James Kirkpatrick, Razvan Pascanu, Neil Rabinowitz, Joel Veness, Guillaume Desjardins, Andrei A. Rusu, Kieran Milan, John Quan, Tiago Ramalho, Agnieszka Grabska-Barwinska, Demis H…

js实现在报表参数界面获取body中控件的值

要在报表参数界面获取body中控件的值,你可以使用JavaScript来实现。下面是一个详细的介绍: 1. DOM(文档对象模型): - DOM是用于操作HTML文档的API,它允许你通过JavaScript访问和操作文档中的元素。 - 在报…

python由0到1的基础第一篇(基础语法、变量类型、运算符)

文章目录 前言编程语言是什么?编译型语言和解释型语言的区别编译型语言解释型语言编译型语言和解释型语言的差异总结 一、Python是什么?Python简介1.1Python是什么?1.2Python简介1.2.1Python优点1.2.2Python的缺点 二、Python能干什么&#x…

iview form 动态表单

最开始用得网上得 <FormItemlabel"采购方开户行":rules"baseForm.receiptType 12? baseInfoRule.procureBank: [{ required: false }]"><Inputv-model"baseForm.procureBank"placeholder"请输入采购方开户行"style"w…

RISC-V架构——中断处理和中断控制器介绍

1、ARM架构中断机制介绍 本文不是从零开始讲解中断&#xff0c;对于中断的基本知识不再赘述&#xff0c;对中断不是很了解可以先学习ARM中断的文章。参考博客&#xff1a;《ARM架构的外部中断介绍(S5PV210芯片)》&#xff1b; 2、RIAC_V架构的中断控制器架构 &#xff08;1&…

如何运用设计模式中的享元模式

文章目录 &#x1f31f; 如何将设计模式中的享元模式运用到生活当中&#x1f34a; 什么是享元模式&#x1f34a; 生活中的应用&#x1f389; 衣物&#x1f389; 图书馆 &#x1f34a; 总结 &#x1f4d5;我是廖志伟&#xff0c;一名Java开发工程师、Java领域优质创作者、CSDN博…

WORD中的表格内容回车行距过大无法调整行距

word插入表格&#xff0c;编辑内容&#xff0c;换行遇到如下问题&#xff1a; 回车后行距过大&#xff0c;无法调整行距。 解决方法&#xff08;并行&#xff09;&#xff1a; 方法1&#xff1a;选中要调整的内容&#xff0c;菜单路径&#xff1a;“编辑-清除-格式” 方法2&am…