P20 PyTorch 反向传播算法

P20 PyTorch 反向传播算法

news2025/11/9 1:35:21

前言：

反向传播是深度学习的基础核心，如果掌握了这个，其它的模型会很容易理解。

这里面结合前面的多层感知机，深入了解一下权重数是如何更新的

目录：

1: 多层感知机节点间的权重系数更新

2：反向传播的基本思路

3：整体训练流程

一多层感知机节点间的权重系数更新

我们常见的DNN 结构

问题：

t层的权重系数 $\text{[math]}$ 如何更新求梯度呢？

$\text{[math]}$

上图 $\text{[math]}$ 影响到t层j节点，j节点影响到t+1层m个节点。这里假设t+1为最后一层

前向传播公式

$\text{[math]}$

$\text{[math]}$

设损失函数

$\text{[math]}$

梯度更新

这里面重点看一下t-1 层到t 层 i,j 节点之间权重系数更新过程.

$\text{[math]}$

$\text{[math]}$

$\text{[math]}$

$\text{[math]}$

$\text{[math]}$

$\text{[math]}$

$\text{[math]}$

$\text{[math]}$

$\text{[math]}$

$\text{[math]}$

$\text{[math]}$

上面公式可以简化

$\text{[math]}$

其中

$\text{[math]}$ 只跟当前层的输出有关系

通过上面可以更进一步看出梯度爆炸和梯度弥散的原理

二反向传播的基本思路（DNN）

输入

向量x,

$\text{[math]}$

前向传播

$\text{[math]}$

$\text{[math]}$

损失函数

$\text{[math]}$

梯度更新过程：主要利用了向量的链式求导原理，以及梯度和迹之间的关系。

假设一共L 层，

step1: 先计算最后一层

设

step2: 利用链式法则，递归的求出每一层的 $\text{[math]}$

step3: 利用梯度和迹之间的关系，求出每一层的梯度

证明：

$\text{[math]}$

$\text{[math]}$

$\text{[math]}$

三整体训练流程

Train:

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/378728.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

基于VS Code的插件开发（基础篇）

基于VS Code的插件开发（基础篇）

一、基础介绍 VSCode 采用了 Electron，在语言上，VSCode 使用了自家的 TypeScript 语言开发。Electron是基于 Chromium 和 Node.js，使用 JavaScript, HTML 和 CSS 构建跨平台的桌面应用，它兼容 Mac、Windows 和 Linux，…

阅读更多...

认识DOM和架构

认识DOM和架构

DOM 代表文档对象模型，是 HTML 和 XML 文档的接口(API)。当浏览器第一次读取(解析)HTML文档时，它会创建一个大对象，一个基于 HTM L文档的非常大的对象，这就是DOM。它是一个从 HTML 文档中建模的树状结构。DOM 用于交互和修改DOM结…

阅读更多...

SpreadJS 16.0 中文版在线电子表设计预览EXCEL-Crack

SpreadJS 16.0 中文版在线电子表设计预览EXCEL-Crack

SpreadJS 纯前端表格控件 - V16.0 新特性--内容摘自互联网新文件结构是 SpreadJS 近几个版本中最为重要的架构级更新。这种新文件结构可以大大提高导入大型 Excel 文件的性能，同时在保存时创建更小、优化更好的文件。在 V15.0 及更早的版本中，Spread…

阅读更多...

android事件分发机制源码分析

android事件分发机制源码分析

没什么用的前言责任链设计模式流程图源码分析没什么用的前言事件分发机制是面试中一道必问的题目，而我的应对方式则是，在网络上找一些博客看看，然后做一些笔记，最后在面试时将我自己记住的内容说出来。这种方式本身没有太大的…

阅读更多...

Editor工具开发实用篇：EditorGUI/EditorGUILayout的区别和EditorGUILayout的方法介绍

Editor工具开发实用篇：EditorGUI/EditorGUILayout的区别和EditorGUILayout的方法介绍

目录一：EditorGUI和EditorGUILayout区别二：EditorGUILayout 1.EditorGUILayout.BeginFadeGroup(float value); 2.EditorGUILayout.BeginHorizontal EditorGUILayout.BeginVertical 3.EditorGUILayout.BeginScrollView 4.EditorGUILayout.BeginT…

阅读更多...

携手中国联通丨美格智能成为中国联通物联网产业联盟苏州分联盟副理事长单位

携手中国联通丨美格智能成为中国联通物联网产业联盟苏州分联盟副理事长单位

2月24日，联通数科物联网2023年巡展活动首场——中国联通物联网生态合作伙伴大会暨中国联通物联网产业联盟苏州分联盟成立仪式在苏州成功举办。本次活动由联通数字科技有限公司、中国联通物联网产业联盟联合主办，江苏省物联网服务协会指导，中国…

阅读更多...

MySQL运维篇之日志

MySQL运维篇之日志

01、日志 1.1、错误日志错误日志是MySQL中最重要的日志之一，它记录了当mysqld启动和停止时，以及服务器在运行过程中发生任何严重错误时的相关信息。当数据库出现任何故障导致无法正常使用时，建议首先查看此日志。该日志是默认开启的&…

阅读更多...

微服务之Nacos注册与配置

微服务之Nacos注册与配置

🏠个人主页：阿杰的博客 💪个人简介：大家好，我是阿杰，一个正在努力让自己变得更好的男人👨 目前状况🎉：24届毕业生，奋斗在找实习的路上🌟 &#x1…

阅读更多...

短视频美颜sdk人脸编辑技术详解、美颜sdk代码分析

短视频美颜sdk人脸编辑技术详解、美颜sdk代码分析

短视频美颜sdk中人脸编辑技术可以将人像风格进行转变，小编认为这也是未来的美颜sdk的一个重要发展方向，下文小编将为大家讲解一下短视频美颜sdk中人脸编辑的关键点。一、人脸编辑的细分关键点 1、年龄通过更改人脸的年龄属性，可用于模仿人…

阅读更多...

「TCG 规范解读」TCG 软件栈 TSS （下）

「TCG 规范解读」TCG 软件栈 TSS （下）

可信计算组织（Ttrusted Computing Group,TCG）是一个非盈利的工业标准组织，它的宗旨是加强在相异计算机平台上的计算环境的安全性。TCG于2003年春成立，并采纳了由可信计算平台联盟（the Trusted Computing Platform Alliance,TCPA）所开发的规范。现在的规范都不是最终稿，都…

阅读更多...

【Redis】Redis线程IO模型与基于文件的网络通信模型（Redis专栏启动）

【Redis】Redis线程IO模型与基于文件的网络通信模型（Redis专栏启动）

📫作者简介：小明java问道之路，2022年度博客之星全国TOP3，专注于后端、中间件、计算机底层、架构设计演进与稳定性建设优化，文章内容兼具广度、深度、大厂技术方案，对待技术喜欢推理加验证，就职于…

阅读更多...

Unity 渲染顺序

Unity 渲染顺序

Unity中的渲染顺序自上而下大致分为三层渲染优先级 Camera depth > Sorting Layer > Order in Layer > RenderQueueCamera depth:越小越优先（大的显示在小的前面）如图：尽管Sphere距离摄像机较远，但由于Camera_Sphere dep…

阅读更多...

Linux 常用 API 函数

Linux 常用 API 函数

文章目录1. 系统调用与库函数1.1 什么是系统调用1.2 系统调用的实现1.3 系统调用和库函数的区别2. 虚拟内存空间3. 错误处理函数4. C 库中 IO 函数工作流程5. 文件描述符6. 常用文件 IO 函数6.1 open 函数6.2 close 函数6.3 write 函数6.4 read 函数6.5 lseek 函数7. 文件操作相…

阅读更多...

算法笔记（十六）—— 有序表（红黑树，AVL树，Size-balance树，跳表），一文搞定！

算法笔记（十六）—— 有序表（红黑树，AVL树，Size-balance树，跳表），一文搞定！

有序表所有的操作都是O(logN)级别（红黑树，AVL树，Size-balance树，跳表）。红黑树，AVL树，Size-balance树都属于平衡搜索二叉树（BST）。搜索二叉书（不保证平衡性…

阅读更多...

OSPF -- （开放式最短路径优先协议）（公共协议）

OSPF -- （开放式最短路径优先协议）（公共协议）

OSPF -- （开放式最短路径优先协议）（公共协议） 1、属性：无类别链路状态IGP协议无类别：更新携带精确掩码链路状态：共享拓扑（共享LSA）本地计算路由IGP： 基于…

阅读更多...

EasyExcel

EasyExcel

文章目录🚏 EasyExcel🚀 一、初识EasyExcel🚬 1、Apache POI🚭 1.1 学习使用成本较高🚭 1.2 POI的内存消耗较大🚭 1.3 特点🚬 2、EasyExcel🚭 2.1 重写了POI对07版Excel的解析&#…

阅读更多...

Nginx学习整理

Nginx学习整理

Nginx学习第一章 Nginx概述1.1、Nginx概述1.2、Nginx官网1.3、Nginx用处第二章 Nginx单实例安装2.1、环境说明2.2、安装依赖2.3、Nginx下载2.4、Nginx解压2.5、Nginx安装2.6、Nginx命令2.7、开放防火墙2.8、启动后效果第三章 Nginx正向代理、反向代理3.1、概述3.2、反向代理配置…

阅读更多...

大数据｜Hadoop系统

大数据｜Hadoop系统

目录 📚Hadoop介绍 📚Hadoop优点 📚Hadoop的体系结构 🐰HDFS的体系结构 🐰MapReduce的体系结构 🐰HDFS和MapReduce的协同作用 📚Hadoop与分布式开发 🐰MapReduce计算模型 &a…

阅读更多...

【让面试官吃惊的回答:HTTP中GET和POST请求的区别你知道吗？】

【让面试官吃惊的回答:HTTP中GET和POST请求的区别你知道吗？】

一.知识回顾之前我们一起学习了HTTP1.0、HTTP1.1、HTTP2.0协议之前的区别、以及URL地址栏中输入网址到页面展示的全过程&&DNS域名解析的过程、HTTP协议基本概念以及通信过程、HTTPS基本概念、SSL加密原理、通信过程、中间人攻击问题、HTTP协议和HTTPS协议区别、HTTP协…

阅读更多...

Python - Opencv应用实例之CT图像检测边缘和内部缺陷

Python - Opencv应用实例之CT图像检测边缘和内部缺陷

Python - Opencv应用实例之CT图像检测边缘和内部缺陷将传统图像处理处理算法应用于CT图像的边缘检测和缺陷检测，想要实现效果如下：关于图像处理算法，主要涉及的有：灰度、阈值化、边缘或角点等特征提取、灰度相似度变换，主要偏向于一些2D的几何变换、涉及图像矩阵的一些统…

阅读更多...

推荐文章

最新文章