数据分析-深度学习Day5

news2025/1/12 18:52:11

Backpropagation反向传播

我们上节课学习了深度学习，也知道采用梯度下降优化我们的各神经元参数，以语音识别为例，一个输入特征量1000多项，8层隐层，大致需要的w,b参数有数百万项，这样我们梯度下降的计算量是非常大的，我们为了让梯度下降计算的更有效率，我们才有反向传播的方法

插图1

链式法则chain rule

我们学过微积分的话，下图应该不难理解，不赘述，看图

插图2

我们计算神经网络损失函数时候，把函数输出

和目标值

的距离评估

（可以是交叉熵）在所有样本上求和而成，我们为了梯度下降，就需要求解w的偏微分，就变成了每个样本C的对w的偏微分和。

插图3

我们考虑一个神经元，假设就2个输入x1,x2，我们很容易就得出神经元的输出z，经过激活函数（sigmoid或Relu）输出传递给其他神经元。我们求C对w的偏导，根据链式法则，就得到2个偏微分的乘积，其中把

的计算参数称作前向传播，把

计算称作反向传播

插图4

当然z对w1,w2的偏微分是秒算的，分别是x1,x2，即w对应连结的值

插图5

如图我们把第一层输入给定后，第一层神经元的偏微分就可以求出，同时算出的激活函数输出即下一级神经元的偏微分，从左至右，一级一级下去

插图6

我们假设一个神经元激活函数前后分别是z,a，如果是sigmoid函数，那当然

，而a又可以为下一级神经元作为输入，经权重偏置计算的到Z',Z''，我们求C对z的偏微分就可以经过链式法则，a对z的偏微分就是sigmoid（z）的导数，我们很熟悉，而后者可以展开成图最后的式子，当然Z',Z''对a的偏微分就是w3,w4，但是C对Z',Z''的偏微分怎么求呢，只要还有下一级神经元，我们就需要再往下一级计算（事实上类似于递归的算法）

插图7

我们将神经元考虑成一个反向模型，输入是C对Z',Z''的偏导，由于这个神经元的参数已经确定了，所以符号采用了三角号

插图8

我们假设当前的神经元已经是最后一个，即输出就是准备送给计算损失函数的，那我们根据下图就可以求出C对Z',Z''的偏微分了，一个是激活函数对其的偏微分，另一个是根据你定义的损失函数模型的偏微分（可求）

插图9

我们假设当前神经元连结的不是输出层，即连接的还是神经元，我们为了求出当前的偏导就需要用到下一级的偏导，直到传递到输出层，和递归很向吧。其实就相当于从末尾的输出端往左侧输入端一级一级传递，所以是反向传播

插图10

我们最后总结下，为了计算z对w的偏导，我们使用前向传播，计算出每一级输出即可

为了计算出损失函数对z的误差，我们使用反向传播

最后将2者相乘就得出了损失函数对于w的偏微分，实现了梯度下降的梯度求法。

（老师说不懂这里也可以，但是我觉得这部分理解其实并不难，还是掌握比较好）

插图11

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/153686.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

记一次部署在docker环境项目发送邮件出现No appropriate protocol

记一次部署在docker环境项目发送邮件出现No appropriate protocol

前言部门有个项目涉及到邮件发送，发送功能在本地测试可以成功发送，但是打包部署到docker环境中，却出现 No appropriate protocol (protocol is disabled or cipher suites are inappropriate)后面在网上搜索了一下，查到了这篇文…

阅读更多...

技术分享 | 测试平台开发-前端开发之Vue.js 框架的使用

技术分享 | 测试平台开发-前端开发之Vue.js 框架的使用

首先将 Vue.js 下载到本地，本章就以本地的 Vue.js 为例。在本地创建一个工作区即创建一个文件夹，使用 vscode 打开，将 Vue.js 放到工作区目录下。创建挂载元素首先创建一个 index.html 的文件，使用加载 vue.js，这…

阅读更多...

NAT模式虚拟机能ping通宿主机但是telnet不通教你如何设置网关走出误区

NAT模式虚拟机能ping通宿主机但是telnet不通教你如何设置网关走出误区

今天跟大家聊聊如何正确配置NAT模式下虚拟机的网关。如标题所言，我一开始在设置网关的时候一直存在着误区，而这个误区也导致标题中的问题：虚拟机能ping通宿主机，但是telnet不通，这就很奇葩了。如下网络拓扑图。虚…

阅读更多...

Linux ALSA 之五：ALSA Proc Info

Linux ALSA 之五：ALSA Proc Info

ALSA Proc Info一、概述二、Proc Files of Alsa Driver1、/proc/asound/xxx 简述2、创建 /proc/asound 目录树2.1 /proc/asound/version 文件2.2 /proc/asound/devices 文件2.3 /proc/asound/cards 文件2.4 /proc/asound/cardx 目录2.5 /proc/asound/pcm 文件一、概述 Linux系…

阅读更多...

企业不可忽视的舆情监测管理办法，TOOM舆情监控工作总结?

企业不可忽视的舆情监测管理办法，TOOM舆情监控工作总结?

企业做好舆情监控以及舆情管理是对企业负责，在企业发展过程中不可能是一帆风顺的，少不了各种各样的流言蜚语，像舆情监控管理监测早知早解决。接下来我们简单了解企业不可忽视的舆情监测管理办法，TOOM舆情监控工作总结? 一、企业…

阅读更多...

【NI Multisim 14.0原理图设计基础——调整元器件位置】

【NI Multisim 14.0原理图设计基础——调整元器件位置】

目录序言一、调整元器件位置 🍊1.元器件的移动 🍊2.元器件的旋转 🍊3.元器件的对齐序言 NI Multisim最突出的特点之一就是用户界面友好。它可以使电路设计者方便、快捷地使用虚拟元器件和仪器、仪表进行电路设计和仿真。首先启动NI…

阅读更多...

【自学Python】Python print()函数

【自学Python】Python print()函数

Python print()函数 Python print()函数教程在 Python 中，print() 函数用于打印相应的信息到终端控制台，同时 print() 函数可以支持同时输出一个或多个变量。 Python print()函数详解语法 print(*objects, sep , end\n, filesys.stdout, flushFa…

阅读更多...

线性代数 --- 投影Projection 六（向量在子空间上的投影）

线性代数 --- 投影Projection 六（向量在子空间上的投影）

向量b在多维子空间上的投影回顾：向量在向量上（直线上）的投影在研究向量在子空间上的投影前，先回顾一下前面学习的一个任意向量b在另一个向量a上的投影，共三个部分。1，求权重系数（A constant&…

阅读更多...

2022 general purpose in-context learning by meta-learning transformers

2022 general purpose in-context learning by meta-learning transformers

wps: option left 回到上一个视图 Kirsch L, Harrison J, Sohl-Dickstein J, et al. General-purpose in-context learning by meta-learning transformers[J]. arXiv preprint arXiv:2212.04458, 2022. 目录Kirsch L, Harrison J, Sohl-Dickstein J, et al. General-purpose…

阅读更多...

【高校节能】高校电力能源智能管理系统设计目标与原则

【高校节能】高校电力能源智能管理系统设计目标与原则

摘要：高校构建电力能源智能管理系统，可以实现对高校电力能源消耗的实时监测、分析预警和辅助决策。系统通过能效管理技术监测各个设备的用电情况，并通过数据的取得、整合、汇总来实现能源的绩效管理。系统从全局出发，整体调控电…

阅读更多...

CCF BDCI | 算能赛题决赛选手说明论文-03

CCF BDCI | 算能赛题决赛选手说明论文-03

基于TPU平台实现人群密度估计∗ ChaMd5-AI 唐晶机械工程&博士二年级华中科技大学中国-武汉 j_tanghust.edu.cn 团队简介唐晶，2001年生，本科毕业于华中科技大学机械卓越工程师班，现为华中科技大学机械科学与工程学院陶波教授课题组博…

阅读更多...

视频实时自然美颜，无惧素颜上镜

视频实时自然美颜，无惧素颜上镜

华为HMS Core 视频编辑服务依托自身AI技术的核心优势，在最新版本HMS Core 6.8.0中上线了全新的视频美颜功能，能对指定图片或视频中的人脸实现磨皮、美白、大眼、瘦脸的美颜效果，适用于直播、相机、视频剪辑、图片处理等场景中，打造…

阅读更多...

cubeIDE开发， stm32的GPIO原理、cubeMX配置及底层源码实现分析

cubeIDE开发， stm32的GPIO原理、cubeMX配置及底层源码实现分析

一、GPIO介绍 1.1 GPIO 简述 GPIO(General purpose input/output，通用型输入输出)，一个引脚可以用于输入、输出或其他特殊功能，PIN脚依现实需要可作为通用输入（GPI）或通用输出（GPO）或通用输入与…

阅读更多...

鑫磊股份开启申购：资产负债率较高，实控人控制企业借款高企

鑫磊股份开启申购：资产负债率较高，实控人控制企业借款高企

1月10日，鑫磊压缩机股份有限公司（下称“鑫磊股份”，SZ:301317）开启申购，发行价格20.67元/股，市盈率58.65倍。据贝多财经了解，鑫磊股份将在深圳证券交易所创业板上市。本次上市，鑫磊…

阅读更多...

LinuxC—进程

LinuxC—进程

进程 1 进程标识符pid 基本概念类型pid_t，是一个有符号16位整数，进程号是顺次向下使用(fd是优先使用当前可用最小的) shell中的ps命令能够查看当前系统的进程信息快照相关函数 getpid(2)获取当前进程的进程号 /* Get the process ID of the calling…

阅读更多...

中断处理程序

中断处理程序

文章目录前言前置知识中断概念中断分类实验操作实验一实验二实验三前言博客记录《操作系统真象还原》第七章实验的操作~ 实验环境：ubuntu18.04VMware ， Bochs下载安装实验内容： 编写中断处理程序（ 操作 8259A 打开中断&…

阅读更多...

2023年浙江食品安全管理员考试真题题库及答案

2023年浙江食品安全管理员考试真题题库及答案

百分百题库提供食品安全管理员考试试题、食品安全管理员考试预测题、食品安全管理员考试真题、食品安全管理员证考试题库等，提供在线做题刷题，在线模拟考试，助你考试轻松过关。一、多选题 1.餐具清洗消毒水池与以下哪些水池应分开&#xff…

阅读更多...

机器学习— —导入数据

机器学习— —导入数据

DAY1集成开发环境原始数据展示主要函数介绍data.iloc()函数dataset.iloc[0]dataset.iloc[:,:-1]dataset.iloc[:,3]dataset.iloc[1:3,1]可执行代码导入结果展示我的写在最后集成开发环境 Spyder (前身是 Pydee) 是一个强大的交互式 Python 语言开发环境，提供高级的代…

阅读更多...

如何搭建Python环境和安装Pycharm

如何搭建Python环境和安装Pycharm

1、搭建Python的基础环境 Anaconda简介 Anaconda指的是一个开源的Python发行版本，其包含了conda、Python等180多个科学包及其依赖项。因为包含了大量的科学包，Anaconda 的下载文件比较大（约 531 MB），如果只需要某些…

阅读更多...

【Kotlin】标准库函数 ② ( run 标准库函数 | run 函数传入 Lambda 表达式作为参数 | run 函数传入函数引用作为参数 )

【Kotlin】标准库函数 ② ( run 标准库函数 | run 函数传入 Lambda 表达式作为参数 | run 函数传入函数引用作为参数 )

文章目录一、run 标准库函数1、run 函数传入 Lambda 表达式作为参数2、run 函数传入函数引用作为参数Kotlin 语言中 , 在 Standard.kt 源码中 , 为所有类型定义了一批标准库函数 , 所有的 Kotlin 类型都可以调用这些函数 ; 一、run 标准库函数 1、run 函数传入 Lambda 表达式作…

阅读更多...

推荐文章

最新文章