“深度学习”学习日记。误差反向传播法--加法层、乘法层、激活函数层的实现

news2025/1/9 1:34:29

2023.1.16

1、加法层、乘法层:

前两篇文章都在讲述理论,今天实现代码操作:关于加法节点,乘法节点的内容在这篇文章。

https://blog.csdn.net/m0_72675651/article/details/128695488

在以后的学习中,将把构建神经网络的“层”实现为一个类。这里的“层”是指神经网络中功能的单位。

这样写感觉到可以让代码变得美观一点,而更容易找出错误并修改

class Addyer:  # 加法节点
    def __init__(self):
        pass

    def forward(self, x, y):
        out = x + y
        return out

    def backward(self, dout):
        dx = dout * 1
        dy = dout * 1
        return dx, dy


class Mullyer:  # 乘法节点
    def __init__(self):  # __init__() 中会初始化实例变量
        self.x = None
        self.y = None

    def forward(self, x, y):
        self.x = y
        self.y = x
        out = x * y

        return out

    def backward(self, dout):
        dx = dout * self.x
        dy = dout * self.y

        return dx, dy

现在用代码实现了,加法层和乘法层,所以我们用代码解决这个问题:

利用反向传播法,求解,篮球、足球分别对应付金额上涨1元的影响是多少?

 代码实现:

class Addyer:  # 加法节点
    def __init__(self):
        pass

    def forward(self, x, y):
        out = x + y
        return out

    def backward(self, dout):
        dx = dout * 1
        dy = dout * 1
        return dx, dy


class Mullyer:  # 乘法节点
    def __init__(self):  # __init__() 中会初始化实例变量
        self.x = None
        self.y = None

    def forward(self, x, y):
        self.x = y
        self.y = x
        out = x * y

        return out

    def backward(self, dout):
        dx = dout * self.x
        dy = dout * self.y

        return dx, dy


discout = 0.9

basketball = 100  # b
football = 200  # f

basketball_num = 2
footbal_num = 3

# 求解问题时 因为乘法层的反向传播需要正向传播的参数
m = Mullyer()
m1 = Mullyer()
m2 = Mullyer()
a = Addyer()

b_price = m2.forward(basketball, basketball_num)
f_price = m1.forward(football, footbal_num)
b_f_price = a.forward(b_price, f_price)
final_price = m.forward(discout, b_f_price)

print(final_price)  # 720
# 求解 应付金额上涨1元 delta=1
# 篮球得影响
delta = 1
ddiscount, db_f_price = m.backward(delta)
dbaskbetball1, dfootball1 = a.backward(db_f_price)
dbaskbetball, dbaskbetball_num = m2.backward(dbaskbetball1)
dfootball, dfootball_num = m1.backward(dfootball1)

print(db_f_price)  # 800
print(dfootball1)  # 0.9
print(dbaskbetball, dbaskbetball_num)  # 1.8 90.0
print(dfootball, dfootball_num)  # 2.7 180.0

综上,计算图中层的函数计算层实现计算复杂导数的代码简单,接下来要学习激活函数层的代码实现;

2,激活函数层:

我们回忆一下 ReLU( x) 函数, y=\left\{\begin{matrix} x \, \,\: (x>0)& \\ 0 \, \, \: (x\leqslant 0) & \end{matrix}\right. ,易得 其偏导数 \frac{\partial y}{\partial x}=\left\{\begin{matrix} 1\; \, \, \, (x>0)& \\ 0 \! \! \, \, \, \, \, \; (x\leqslant 0) & \end{matrix}\right.

在正向传播时,如果x大于0,则反向传播时,上游的x会原封不动的传递给下游;反之,正向传播时,如果x小于等于0的话,则反向传播中传给下游的信号将停在此处。

用计算图表示:

 

import numpy as np


class ReLU:
    def __init__(self):
        self.mask = None

    def forward(self, x):
        self.mask = (x <= 0)
        out = x.copy()
        out[self.mask] = 0

        return out

    def backward(self, dout):
        dout[self.mask] = 0
        dx = dout

        return dx


arr = np.arange(-3, 3).reshape(2, 3)
print(arr)
a = ReLU()
print(a.forward(arr))
mask = (arr <= 0)
print(mask)

输出结果:

[[-3 -2 -1]
 [ 0  1  2]]
[[0 0 0]
 [0 1 2]]
[[ True  True  True]
 [ True False False]]

通过输出结果,我们可以很清楚的知道mask的作用是一个开关 , 一个bool值开关。因此,反向传播中会使用正向传播保存的mask,True为0,false为1。

我们们使用网络的学习,这一部分学习过ReLU函数不适合作为激活函数 https://blog.csdn.net/m0_72675651/article/details/128602009

所以我们接下来来实现sigmoid函数 

回忆一下sigmoid函数:y=\frac{1}{1+exp(-x)} 

正先传播的话是这样:

 反向传播时有大学问,得分解详细讲述:

“ /  节点”: 正向传播时是 y=\frac{1}{x} ,所以在反向传播时,\frac{\partial y}{\partial x}=-\frac{1}{x^{2}}=-y^{2}  ;

“ + 节点”: 学习过他有上游会原封不动得传递到下游;

“exp 节点”:在正向传播时表示y=exp(x),由指数函数的数学解析式可得  \frac{\partial y}{\partial x}=exp\left ( x \right ) ;

“ x 节点”: 我们得将正向传播的值翻转后再做乘法运算;

用计算图表示:

或许可以进一步处理: \frac{\partial L}{\partial y}y^{2}exp\left ( -x \right )=\frac{\partial L}{\partial y}y\left ( 1-y \right )  。

import numpy as np


class Sigmoid:
    def __init__(self):
        self.out = None

    def forward(self, x):
        out = 1 / (1 + np.exp(-x))
        self.out = out

        return out

    def backward(self, dout):
        dx = dout * (1.0 - self.out) * self.out

        return dx


arr = np.arange(-3, 3).reshape(2, 3)
s = Sigmoid()
s1=s.forward(arr)
print(s.forward(arr))
print(s.backward(arr))

 输出结果:

[[0.04742587 0.11920292 0.26894142]
 [0.5        0.73105858 0.88079708]]
[[-0.13552998 -0.20998717 -0.19661193]
 [ 0.          0.19661193  0.20998717]]

 在正向传播时,用到了实例out,在反向传播时我们也用到了实例out,这样我们可以先进行一次正向传播,保存实例变量out

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/168246.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AHOcoder声码器

AHOcoder声码器 目前最常见的声码器有WORLD&#xff0c;STRAIGHT&#xff0c;&#xff27;riffin_Lim等&#xff0c;AHocoder算是少见的&#xff0c;但也可以学习一下。 代码下载网址&#xff1a;AHOcoder 简介 AHOcoder 语音声码器由 Daniel Erro 在巴斯克大学的 AHOLAB 信…

若依配置教程(一)运行若依系统

一、下载源代码 若依的源代码是开源的&#xff0c;所以我们在若依的官方网站即可进行下载&#xff0c;若依的官网是&#xff1a;http://doc.ruoyi.vip/ruoyi-vue/&#xff0c;进入官网后&#xff0c;会显示代码下载的地址&#xff1a;https://gitee.com/y_project/RuoYi-Vue&a…

【进阶】Bean作用域和生命周期

努力经营当下&#xff0c;直至未来明朗&#xff01; 文章目录一、通过⼀个案例来看 Bean 作⽤域的问题1. 被修改的Bean案例2. 原因分析二、作用域Scope定义1. Bean的六种作用域&#xff08;重点&#xff09;1&#xff09;singleton2&#xff09;prototype3&#xff09;request4…

JVM——类加载与字节码技术(2)

三、编译期处理 所谓的 语法糖 &#xff0c;其实就是指 java 编译器把* .java 源码编译为* .class 字节码的过程中&#xff0c;自动生成和转换的一些代码&#xff0c;主要是为了减轻程序员的负担&#xff0c;算是 java 编译器给我们的一个额外福利 【注意】以下代码的分析&am…

Python爬虫之基于 selenium 实现文献信息获取

目录初识 selenium网页分析代码实现踩过的坑最近有小伙伴后台跟我说&#xff0c;临近毕业&#xff0c;写毕业论文需要上知网查找大量的文献&#xff0c;但是一篇一篇看文献信息以及文献摘要又有点麻烦&#xff0c;能不能让我写一个爬虫去批量获取文献相关信息 我一听好家伙&am…

【算法】二叉树遍历

目录1.概述2.代码实现2.1.二叉树定义2.2.前序遍历2.3.中序遍历2.4.后序遍历2.5.层序遍历3.应用本文参考&#xff1a; LABULADONG 的算法网站 1.概述 &#xff08;1&#xff09;所谓遍历 (Traversal) 是指沿着某条搜索路线&#xff0c;依次对树中每个结点均做一次且仅做一次访问…

《从零开始编写一个直播服务器》 C++ 实现一个最简单的HTTP-FLV流媒体服务器

流媒体服务系列文章 文章目录流媒体服务系列文章前言一、http flv&#xff1f;二、使用步骤服务器代码总结前言 HTTP FLV通过http传输&#xff0c;时延可控制在2秒以内&#xff0c;浏览器可基于bilibili开源的flv.js(采用h5 mse技术)开发&#xff0c;比起rtsp、rtmp等免插件播…

Spring BeanPostProcessor

BeanPostProcessor&#xff0c;是bean的增强器&#xff0c;在bean初始化前后调用&#xff0c;常用的方法有postProcessBeforeInitialization和postProcessAfterInitialization&#xff0c;在Spring启动并初始化bean前后通过它们做一些扩展操作。 1、BeanPostProcessor 接口说明…

【信管9.1】​项目沟通及过程

项目沟通及过程沟通这个东西&#xff0c;可以说是整个项目成功失败最关键的因素。9成以上失败的项目在最后总结的时候&#xff0c;沟通不畅或者信息对接问题都会占据前三甲。其实只要是做项目&#xff0c;那么必须有团队&#xff0c;有团队有人&#xff0c;那么沟通就是不可避免…

03 技术太卷我学APEX-关于blob数据类型的使用

03 技术太卷我学APEX-关于blob数据类型的使用 0 Oracle 的blob类型 BLOB BLOB全称为二进制大型对象&#xff08;Binary Large Object)。它用于存储数据库中的大型二进制对象。可存储的最大大小为4G字节。 通常像图片、文件、音乐等信息就用BLOB字段来存储&#xff0c;先将文件…

外贸软件成本核算丨采购出入库有磅差怎么办

在液化天然气油料等行业&#xff0c;在与供应商之间的进出口贸易过程中&#xff0c;总是少不了会出现磅差的情况&#xff0c;因此就需要有磅差的约定。那什么是磅差呢&#xff1f;磅差指的是&#xff0c;供应方在发货时提供的磅单与购买方实际验收过磅数量之间的差额。一般磅差…

C++设计模式(1)——单例模式

亦称&#xff1a;单件模式、Singleton 意图 单例模式是一种创建型设计模式&#xff0c; 让你能够保证一个类只有一个实例&#xff0c; 并提供一个访问该实例的全局节点。 问题 单例模式同时解决了两个问题&#xff0c; 所以违反了单一职责原则&#xff1a; 1、保证一个类只…

CSS给元素添加边框(样式、颜色、宽度)

给元素添加边框 CSS边框属性允许你指定一个元素边框的样式和颜色, 和边框宽度。 可以使用 border 属性将边框样式,颜色,和宽度 一起设置。 如果不设置其中的某个值&#xff0c;也不会出问题&#xff0c;比如 border: solid #ff0000; 也是允许的。 使用border-style属性设置边…

ORA-39002: 操作无效 ORA-39070: 无法打开日志文件

今天在oracle12c上导数据&#xff0c;出现了错误。导库脚本久经考验&#xff0c;不应该有什么问题&#xff0c;但就是报错了。错误开头2句是&#xff1a; ORA-39002: 操作无效 ORA-39070: 无法打开日志文件 网上搜来的结果&#xff0c;是存放导出文件的路径不对&#xff0c;就…

常用API(String、ArrayList)

API&#xff08;应用程序接口&#xff09; Java写好的技术&#xff08;功能代码&#xff09;&#xff0c;可以直接调用String概述java.lang.String类代表字符串&#xff0c;String类定义的变量可以用于指向字符串对象&#xff0c;然后操作该字符串Java程序中的所有字符串文字&a…

JavaEE进阶第三课:Spring更简单的对象存储和取出(上)

上篇文章介绍了Spring的创建和使用&#xff0c;讲解3了Bean对象的基本存储和取出&#xff0c;这篇文章我们将会介绍Spring更简单的对象存储 目录1.Bean的存储1.0准备工作1.1五大类注解1.1.2为什么要有这么多注解1.2方法注解1.1.1方法注解需要搭配类注解一起使用1.2.2方法重载怎…

详细实例说明+典型案例实现 对迭代法进行全面分析 | C++

第四章 迭代法 目录 ●第四章 迭代法 ●前言 ●一、迭代法是什么&#xff1f; 1.简要介绍 2.代码示例&#xff08;简单理解&#xff09; 3.生活实例 ●二、迭代法的典型案例——开平方&帕斯卡三角形 1.开平方 2.帕斯卡三角形 ●总结 前言 简单的来…

游戏服务器如何维护

随着游戏的不断发展&#xff0c;游戏服务器的维护的重要性日益提升。对于玩家而言&#xff0c;他们需要得到更好的体验和更快的速度来享受这个娱乐项目。而对于运营者来说&#xff0c;则是确保安全运行、避免中断或者延迟的工作。本文就将介绍游戏服务器如何维护。如果你的游戏…

基于混沌系统和DNA算法的RGB图像加密(Matlab代码实现)

目录 &#x1f4a5;1 概述 &#x1f4da;2 运行结果 &#x1f389;3 参考文献 &#x1f468;‍&#x1f4bb;4 Matlab代码 &#x1f4a5;1 概述 本文介绍了基于混沌系统和DNA编码的彩色数字图像加密、解密、抗噪声性能分析以及抗裁剪性能分析。 &#x1f4da;2 运行结果 &…

Linux cksum命令

Linux cksum命令用于检查文件的CRC是否正确。确保文件从一个系统传输到另一个系统的过程中不被损坏。CRC是一种排错检查方式&#xff0c;该校验法的标准由CCITT所指定&#xff0c;至少可检测到99.998%的已知错误。指定文件交由指令"cksum"进行校验后&#xff0c;该指…