(一)全连接神经网络

news2024/12/28 21:01:21

参考资料:https://zhuanlan.zhihu.com/p/273595649
在这里插入图片描述

一、前向传播

1、第一层

(1)线性层

{ z 1 ( 1 ) = w 11 ( 1 ) ∗ x 1 + w 12 ( 1 ) ∗ x 2 + b 1 ( 1 ) z 2 ( 1 ) = w 21 ( 1 ) ∗ x 1 + w 22 ( 1 ) ∗ x 2 + b 2 ( 1 ) z 3 ( 1 ) = w 31 ( 1 ) ∗ x 1 + w 32 ( 1 ) ∗ x 2 + b 3 ( 1 ) \left\{ \begin{array}{c} z_1^{(1)}= w_{11}^{(1)}*x_1+w_{12}^{(1)}*x_2+b_1^{(1)}\\ z_2^{(1)}= w_{21}^{(1)}*x_1+w_{22}^{(1)}*x_2+b_2^{(1)} \\ z_3^{(1)}= w_{31}^{(1)}*x_1+w_{32}^{(1)}*x_2+b_3^{(1)} \end{array}\right. z1(1)=w11(1)x1+w12(1)x2+b1(1)z2(1)=w21(1)x1+w22(1)x2+b2(1)z3(1)=w31(1)x1+w32(1)x2+b3(1)

(2)非线性层

{ a 1 ( 1 ) = f ( z 1 ( 1 ) ) a 2 ( 1 ) = f ( z 2 ( 1 ) ) a 3 ( 1 ) = f ( z 3 ( 1 ) ) \left\{ \begin{array}{c} a_1^{(1)}= f(z_1^{(1)})\\ a_2^{(1)}= f(z_2^{(1)})\\ a_3^{(1)}= f(z_3^{(1)}) \end{array}\right. a1(1)=f(z1(1))a2(1)=f(z2(1))a3(1)=f(z3(1))

(3)矩阵化

X ( 1 ) = [ x 1 x 2 ] X^{(1)}= \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} X(1)=[x1x2]
Z ( 1 ) = [ z 1 ( 1 ) z 2 ( 1 ) z 3 ( 1 ) ] Z^{(1)}= \begin{bmatrix} z_1^{(1)} \\ z_2^{(1)} \\ z_3^{(1)} \end{bmatrix} Z(1)= z1(1)z2(1)z3(1)

W ( 1 ) = [ w 11 ( 1 ) w 12 ( 1 ) w 21 ( 1 ) w 22 ( 1 ) ] W^{(1)}= \begin{bmatrix} w_{11}^{(1)} & w_{12}^{(1)}\\ w_{21}^{(1)} & w_{22}^{(1)} \\ \end{bmatrix} W(1)=[w11(1)w21(1)w12(1)w22(1)]
B ( 1 ) = [ b 1 ( 1 ) b 2 ( 1 ) b 3 ( 1 ) ] B^{(1)}= \begin{bmatrix} b_1^{(1)} \\ b_2^{(1)} \\ b_3^{(1)} \end{bmatrix} B(1)= b1(1)b2(1)b3(1)
Z ( 1 ) = W ( 1 ) ∗ X ( 1 ) + B ( 1 ) Z^{(1)}=W^{(1)}*X^{(1)}+B^{(1)} Z(1)=W(1)X(1)+B(1)

2、第二层

{ z 1 ( 2 ) = w 11 ( 2 ) ∗ a 1 ( 1 ) + w 12 ( 2 ) ∗ a 2 ( 1 ) + w 13 ( 2 ) ∗ a 3 ( 1 ) + b 1 ( 2 ) z 2 ( 2 ) = w 21 ( 2 ) ∗ a 1 ( 1 ) + w 22 ( 2 ) ∗ a 2 ( 1 ) + w 23 ( 2 ) ∗ a 3 ( 1 ) + b 2 ( 2 ) z 3 ( 2 ) = w 31 ( 2 ) ∗ a 1 ( 1 ) + w 32 ( 2 ) ∗ a 2 ( 1 ) + w 33 ( 2 ) ∗ a 3 ( 1 ) + b 3 ( 2 ) \left\{ \begin{array}{c} z_1^{(2)}= w_{11}^{(2)}*a_1^{(1)}+w_{12}^{(2)}*a_2^{(1)}+w_{13}^{(2)}*a_3^{(1)}+b_1^{(2)}\\ z_2^{(2)}= w_{21}^{(2)}*a_1^{(1)}+w_{22}^{(2)}*a_2^{(1)}+w_{23}^{(2)}*a_3^{(1)}+b_2^{(2)} \\ z_3^{(2)}= w_{31}^{(2)}*a_1^{(1)}+w_{32}^{(2)}*a_2^{(1)}+w_{33}^{(2)}*a_3^{(1)}+b_3^{(2)} \end{array}\right. z1(2)=w11(2)a1(1)+w12(2)a2(1)+w13(2)a3(1)+b1(2)z2(2)=w21(2)a1(1)+w22(2)a2(1)+w23(2)a3(1)+b2(2)z3(2)=w31(2)a1(1)+w32(2)a2(1)+w33(2)a3(1)+b3(2)

非线性层

{ a 1 ( 2 ) = f ( z 1 ( 2 ) ) a 2 ( 2 ) = f ( z 2 ( 2 ) ) a 3 ( 2 ) = f ( z 3 ( 2 ) ) \left\{ \begin{array}{c} a_1^{(2)}= f(z_1^{(2)})\\ a_2^{(2)}= f(z_2^{(2)})\\ a_3^{(2)}= f(z_3^{(2)}) \end{array}\right. a1(2)=f(z1(2))a2(2)=f(z2(2))a3(2)=f(z3(2))

3、第三层

{ z 1 ( 3 ) = w 11 ( 3 ) ∗ a 1 ( 2 ) + w 12 ( 3 ) ∗ a 2 ( 2 ) + w 13 ( 3 ) ∗ a 3 ( 2 ) + b 1 ( 3 ) z 2 ( 3 ) = w 21 ( 3 ) ∗ a 1 ( 2 ) + w 22 ( 3 ) ∗ a 2 ( 2 ) + w 23 ( 3 ) ∗ a 3 ( 2 ) + b 2 ( 3 ) \left\{ \begin{array}{c} z_1^{(3)}= w_{11}^{(3)}*a_1^{(2)}+w_{12}^{(3)}*a_2^{(2)}+w_{13}^{(3)}*a_3^{(2)}+b_1^{(3)}\\ z_2^{(3)}= w_{21}^{(3)}*a_1^{(2)}+w_{22}^{(3)}*a_2^{(2)}+w_{23}^{(3)}*a_3^{(2)}+b_2^{(3)} \\ \end{array}\right. {z1(3)=w11(3)a1(2)+w12(3)a2(2)+w13(3)a3(2)+b1(3)z2(3)=w21(3)a1(2)+w22(3)a2(2)+w23(3)a3(2)+b2(3)

非线性层

{ a 1 ( 3 ) = f ( z 1 ( 3 ) ) a 2 ( 3 ) = f ( z 2 ( 3 ) ) \left\{ \begin{array}{c} a_1^{(3)}= f(z_1^{(3)})\\ a_2^{(3)}= f(z_2^{(3)})\\ \end{array}\right. {a1(3)=f(z1(3))a2(3)=f(z2(3))

4、输出层

{ y 1 = a 1 ( 3 ) y 2 = a 2 ( 3 ) \left\{ \begin{array}{c} y_1= a_1^{(3)}\\ y_2=a_2^{(3)} \\ \end{array}\right. {y1=a1(3)y2=a2(3)

5、计算损失函数

l o s s = 1 2 ∣ y r e f − y d e s ∣ 2 loss = \frac{1}{2}|y_{ref} - y_{des}|^2 loss=21yrefydes2
展开损失:
l o s s = 1 2 [ ( y 1 − y 1 d e s ) 2 + ( y 2 − y 2 d e s ) 2 ] loss = \frac{1}{2}[(y_1 - y_{1_{des}})^2+(y_2 - y_{2_{des}})^2] loss=21[(y1y1des)2+(y2y2des)2]

二、后向传播

1、更新参数

在这里插入图片描述

2、定义误差项

在这里插入图片描述

3、通过误差项计算两个偏导

(1)计算最后一层δ

单个误差项

在这里插入图片描述
在这里插入图片描述
结合上面三个公式:
在这里插入图片描述

(2)推导前一层的δ

利用前向传播的链式法则:
在这里插入图片描述

每项的前三个就是后一层的误差项:
在这里插入图片描述

计算上面公式中的三个偏导,得出下式:
在这里插入图片描述
考虑同一层的误差项目,写成一般形式:
在这里插入图片描述

(3)计算偏导

关于权重的偏导

在这里插入图片描述

关于偏置的偏导

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1461625.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CCF-B类SGP‘24 4月10日截稿!速速行动!

会议之眼 快讯 第22届SGP(Eurographics Symposium on Geometry Processing)即欧洲图形学几何处理专题讨论会将于 2024 年 6月24 -日至26日在美国麻省理工学院举行!SGP是传播几何处理新研究想法和尖端成果的首要学术会议。作为该领域的重要学术盛事,SGP会…

IO 作业 24/2/21

1、使用多线程完成两个文件的拷贝&#xff0c;第一个线程拷贝前一半&#xff0c;第二个线程拷贝后一半&#xff0c;主线程回收两个线程的资源 #include <myhead.h> //定义分支线程1 void *task1(void *arg) {int fdr-1;//只读打开被复制文件if((fdropen("./111.txt…

sora生成高质量视频的原理

Sora是怎样生成视频的&#xff1f; 写在前面 Sora 是 OpenAI 在日前发布的超强视频生成 AI&#xff0c;旨在探索 AI 如何在理解真实世界运动和交互方面做得更好Sora目前无灰度体验 面临挑战 Sora面对的挑战就像是需要处理和理解来自世界各地、不同设备拍摄的数以百万计的图…

Java SourceDataLine 播放MP3音频 显示频谱

Java SourceDataLine 播放MP3音频 显示频谱 1 添加依赖2 快速傅里叶变换2.1 FFT.java2.2 Complex.java 3 音频播放3.1 Player.java3.1 XPlayer.java 4 显示频谱5 结果 项目Value音频格式 添加依赖*.wav(JDK 原生支持)*.pcm(JDK 原生支持)*.au(JDK 原生支持)*.aiff(JDK 原生支持…

2024 年 6 个变革性大型机预测

当今数字经济中组织的成功需要速度&#xff0c;即通过新应用程序和服务快速响应市场趋势、即时访问关键数据以及在问题影响服务之前解决问题的能力。进入新的一年&#xff0c;大型机上新兴技术的采用和适应将使企业能够拥抱不断变化的市场力量&#xff0c;并将其转化为竞争优势…

JVM对象的创建流程与内存分配

对象的创建流程与内存分配 创建流程对象内存分配方式内存分配安全问题对象内存分配流程【重要】:对象怎样才会进入老年代?重点 案例演示:对象分配过程大对象直接进入老年代02-对象内存分配的过程: 创建流程 加载 验证 解析 准备 初始化 使用 写在 对象内存分配方式 内存分配…

C语言系列(所需基础:大学C语言及格)-3-字符串/ASCII码表

文章目录 一、字符串二、ASCII码表 一、字符串 用" "来定义字符串&#xff1a; #include <stdio.h>int main() {"";//空字符串"hkl";//由""定义的字符串return(0); }用数组来存储字符串&#xff0c;并打印&#xff1a; #incl…

箱形理论在交易策略中的实战应用与优化

箱形理论&#xff0c;简单来说&#xff0c;就是将价格波动分成一段一段的方框&#xff0c;研究这些方框的高点和低点&#xff0c;来推测价格的趋势。 在上升行情中&#xff0c;价格每突破新高价后&#xff0c;由于群众惧高心理&#xff0c;可能会回跌一段&#xff0c;然后再上升…

jenkins远程触发构建报:Error 403 No valid crumb was included in the request

最近在跨jenkins触发构建的时候发现不能触发相应的项目&#xff0c;报如下图错误 解决方案&#xff1a; 1、安装Build Authorization Token Root Plugin插件 安装完成后去配置API Token&#xff0c;用户列表&#xff0c;配置用户的API Token&#xff0c;生成后记得保存 2、项…

Windows Server 2012 安装

1.镜像安装 镜像安装:Windows Server 2012 2.安装过程(直接以图的形式呈现) 2012激活秘钥:J7TJK-NQPGQ-Q7VRH-G3B93-2WCQD

【flutter】第一个flutter项目

前言 我们通过Android Studio来创建flutter项目。 安装dart和flutter插件 新版编译器需要先安装flutter插件才能构建flutter项目。 项目目录 我们基本就在lib中写代码 项目启动

一文读懂——SSL证书选择免费还是付费

免费SSL证书通常由一些知名的证书颁发机构&#xff08;CA&#xff09;提供。这些免费证书提供了基本的加密功能&#xff0c;足以保护网站的数据传输安全。它们的优点在于免费&#xff0c;对于个人网站或小型企业来说&#xff0c;可以有效地降低网站运营成本。 然而&#xff0c;…

挑战30天学完Python:Day16 日期时间

&#x1f4d8; Day 16 &#x1f389; 本系列为Python基础学习&#xff0c;原稿来源于 30-Days-Of-Python 英文项目&#xff0c;大奇主要是对其本地化翻译、逐条验证和补充&#xff0c;想通过30天完成正儿八经的系统化实践。此系列适合零基础同学&#xff0c;或仅了解Python一点…

(十一)【Jmeter】线程(Threads(Users))之jp@gc-Ultimate Thread Group

简述 操作路径如下: 作用:提供了高级的线程组控制选项,支持更复杂的场景模拟。配置:设置多种线程控制参数,如启动延迟、启动线程数、并发压测持续时间、关闭线程时间等。使用场景:针对特定需求进行高级的并发访问模拟,如流量控制、延迟启动等。优点:提供了丰富的控制…

“目标检测”任务基础认识

“目标检测”任务基础认识 1.目标检测初识 目标检测任务关注的是图片中特定目标物体的位置。 目标检测最终目的&#xff1a;检测在一个窗口中是否有物体。 eg:以猫脸检测举例&#xff0c;当给出一张图片时&#xff0c;我们需要框出猫脸的位置并给出猫脸的大小&#xff0c;如…

k8s kubectl陈述式资源管理及命令详解,项目流程与发布示例

目录 Kubernetes kubectl 命令表 _ Kubernetes(K8S)中文文档_Kubernetes中文社区http://docs.kubernetes.org.cn/683.html kubectl概念 概述 用途 kubectl语法 基本语法 简单举例 kubectl使用详解 set&#xff1a;更新 部署发布操作 暴露service service的作用 使…

halcon的灰度变换(图像增强)

参考Halcon代码&#xff1a; w:3 h:3 gen_image_const (Image, byte, w, h) get_domain (Image, Domain) get_region_points (Domain, Rows, Columns) *将图像的所有灰度值都设置为1 grayvals:[1,20,3,10,1,1,1,1,1] set_grayval (Image, Rows, Columns, grayvals) get_grayva…

星河做市基金会全球DAO社区启动,为数字货币市场注入新活力

2024年的数字货币市场即将迎来一次重要的历史性时刻 — 比特币减半&#xff0c;这四年一次的事件将成为全球数字资产市场的焦点&#xff0c;预示着新一轮的牛市浪潮即将到来。在这个关键时刻&#xff0c;星河做市基金会展现出其作为区块链行业领先市值管理公司的独特魅力。 GA…

Angular升级后运行编译变慢?如何解决?

公司的Angular项目升级后&#xff0c;使用体验感十分不好&#xff0c;运行、编译的时间明显增长&#xff0c;工作效率是十分低下&#xff0c;但奈何公司的大佬们都有自己的事情要忙&#xff0c;结识的大佬也不够多&#xff0c;只能靠自己找度娘了。但是&#xff0c;哎&#xff…

2024年最新1000个Java毕业设计选题参考

文章目录 2024年最新Java毕业设计选题参考一、Java毕业设计选题参考二、javaweb毕业设计选题三、springboot/ssm毕业设计选题参考 源码获取&#xff1a; 博主介绍&#xff1a;✌全网粉丝7W,CSDN博客专家、Java大数据领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/In…