深度学习：（七）梯度下降法在神经网络中的应用

深度学习：（七）梯度下降法在神经网络中的应用

news2026/2/14 19:21:13

梯度下降法在神经网络中的应用

事先规定：

用 $n$ 表示个数（维度）:

$n^{[0]}=n_x$ ，表示单个训练样本 $x$ 的元素个数；

$n^{[1]}$ 表示隐藏层 $1$ 的单元（节点）个数；

$n^{[1]}$ 表示……

梯度下降法公式：

① $w$ 和 $b$ 参数随机初始化；

②计算预测值

③求导： $dw^{[1]}$ 、 $db^{[1]}$ 、 $dw^{[2]}$ 、 $db^{[2]}$ 。

④更新参数：
$\begin{align*} &W^{[1]}=W^{[1]}-\alpha·dW^{[1]}\\ &b^{[1]}=b^{[1]}-\alpha·db^{[1]}\\ &W^{[2]}=W^{[2]}-\alpha·dW^{[2]}\\ &b^{[2]}=b^{[2]}-\alpha·db^{[2]} \end{align*}$
第三步反向传播求导的详细步骤：
$\begin{align*} &dZ^{[2]}=A^{[2]}-Y\\ &dW^{[2]}=\frac{1}{m}dZ^{[2]}A^{[1]T}\\ &db^{[2]}=\frac{1}{m}np.sum(dZ^{[2]},axis=1,keepdims=True)\\ &dZ^{[1]}=W^{[2]T}dZ^{[2]}*g^{[1]'}(Z^{[1]})//这里的*是元素对应相乘\\ &dW^{[1]}=\frac{1}{m}dZ^{[1]}X^{T}//这里的转置是因为W^{[1]}是由w_i^{[1]T}组成的\\ &db^{[1]}=\frac{1}{m}np.sum(dZ^{[1]},axis=1,keepdims=True)\\ \end{align*}$

参数随机初始化

神经网络的参数 $w_i^{[l]}$ 和不能像逻辑回归一样，初始化为零，否则梯度下降算法就会无效。

也不要将隐藏层中的所有节点参数都初始化成一样的，否则每个节点都在做相同的运算，毫无意义。

$\begin{align*} &W^{[1]}=np.random.randn((n^{[1]},n^{[0]}))·0.01~//高斯分布随机变量再乘以0.01\\ &b^{[1]}=np.zeros((n^{[1]},1))\\ &W^{[2]}=...\\ &b^{[2]}=... \end{align*}$

通常情况下，会把参数随机初始化成很小很小的值，这也是乘以 $0.01$ 的原因。

因为参数大的话， $z$ 计算出来就会大， $a$ 也会大，就会落在激活函数 $\sigma(z)$ 或 $t anh (z)$ 的平缓区域，就会降低梯度下降法的速度，甚至形成梯度消失问题。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2171109.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

动态规划算法：13.简单多状态 dp 问题_打家劫舍II_C++

动态规划算法：13.简单多状态 dp 问题_打家劫舍II_C++

目录题目链接：LCR 090. 打家劫舍 II - 力扣（LeetCode） 一、题目解析题目： 解析： 二、算法原理 1、状态表示 2、状态转移方程状态转移方程推理： 1、i位置状态分析 2、首尾状态分析 3、初始化 d…

阅读更多...

Meta震撼发布Llama3.2大规模模型

Meta震撼发布Llama3.2大规模模型

在2024.9.26的年Meta Connect大会上，Meta正式推出了Llama3.2模型，旨在提升边缘AI和视觉任务的能力。Llama3.2系列包括11亿和90亿参数的中型视觉模型，以及为移动设备优化的1亿和3亿参数的小型模型，并针对高通和联发科的硬件平台进行…

阅读更多...

Webpack 介绍

Webpack 介绍

Webpack 介绍 Date: August 29, 2024 全文概要 Webpack概念： Webpack是一个静态的模块化的打包工具，可以为现代的 JavaSript 应用程序进行打包。 1-静态：Webpack可以将代码打包成最终的静态资源 2-模块化：webpack支持各种模块…

阅读更多...

教师工作量评估与管理软件

教师工作量评估与管理软件

2相关技术 2.1 MYSQL数据库 MySQL是一个真正的多用户、多线程SQL数据库服务器。是基于SQL的客户/服务器模式的关系数据库管理系统，它的有点有有功能强大、使用简单、管理方便、安全可靠性高、运行速度快、多线程、跨平台性、完全网络化、稳定性等，非常…

阅读更多...

Spring异常处理-@ExceptionHandler-@ControllerAdvice-全局异常处理

Spring异常处理-@ExceptionHandler-@ControllerAdvice-全局异常处理

文章目录 ResponseBodyControllerAdvice最终的异常处理方式异常的处理分两类编程式处理：也就是我们的try-catch 声明式处理：使用注解处理 ResponseBody /*** 测试声明式异常处理*/ RestController public class HelloController {//编程式的异常处理&a…

阅读更多...

EasyAR自定义相机RTSP视频流(CustomCamera)

EasyAR自定义相机RTSP视频流(CustomCamera)

EasyAR可以使用视频源作为输入源，官方给出了示例和文档，但是对于大部分Unity开发人员来说看了文档还是一头雾水。在Android Studio中将custom-camera.jar添加libs中，就可以查看源代码了分析其源代码，主要是ExternalCameraSampl…

阅读更多...

【linux 多进程并发】linux下使用常见命令，来解析进程家族体系脉络

【linux 多进程并发】linux下使用常见命令，来解析进程家族体系脉络

0101 Linux进程专栏内容： postgresql使用入门基础手写数据库toadb并发编程个人主页：我的主页管理社区：开源数据库座右铭：天行健，君子以自强不息；地势坤，君子以厚德载物. 文章目录 0101 Li…

阅读更多...

ASP.NET Core 打包net8.0框架在Linux CentOS7上部署问题

ASP.NET Core 打包net8.0框架在Linux CentOS7上部署问题

问题1 libstdc.so.6版本过低。 CentOS7默认安装的gcc版本太低，达不到.net8的启动条件。 /lib64/libstdc.so.6: version GLIBCXX_3.4.20’ not found (required by ./IDT_net) /lib64/libstdc.so.6: version GLIBCXX_3.4.21’ not found (required by ./IDT_net) 解…

阅读更多...

恢复丢失的数据:恢复数据库网络解决方案

恢复丢失的数据:恢复数据库网络解决方案

探索恢复数据库网络的深度对于了解现代企业如何防御其数据不断增长的威胁至关重要。在一个时代，数字证据和取证网络安全在法律和商业领域扮演关键角色，这些网络提供的弹性是不可或缺的。深入研究恢复数据库网络的重要性不仅仅是数据保护，它还…

阅读更多...

ubuntu安装mysql 8，mysql密码的修改

ubuntu安装mysql 8，mysql密码的修改

目录 1.安装mysql 82.查看当前状态3.手动给数据库设置密码mysql5mysql8 4.直接把数据库验证密码的功能关闭掉 1.安装mysql 8 apt install mysql-server-8.0敲 Y 按回车 table 选ok 2.查看当前状态 service mysql status显示active（running）证明安装成…

阅读更多...

媒界：吉利星瑞百炼成钢，持续引领中国汽车价值向上

媒界：吉利星瑞百炼成钢，持续引领中国汽车价值向上

秋风送爽绘秋色，出行良辰恰逢时。9月28日至9月29日，2024安行中国汽车安全科技公益巡展迎来尾声，安行中国携手吉利汽车，步履轻盈地踏入苏州星湖天街，共同呈献一场融合环保科技前沿、安全驾驶理念与深厚文化底蕴的48小时…

阅读更多...

使用jQuery处理Ajax

使用jQuery处理Ajax

使用jQuery处理Ajax HTTP协议超文本传输协议（HTTP，HyperText Transfer Protocol)是互联网上应用最为广泛的一种网络协议设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法所有的WWW文件都必须遵守这个标准一次HTTP操作称为一个事务&am…

阅读更多...

如何使用 CCF Communicator 框架快速开发设备接口

如何使用 CCF Communicator 框架快速开发设备接口

什么是 CCF Communicator Framework？ 通信器框架通过封装 CCF 和设备之间的连接，简化了硬件之间的低级消息处理。举例来说，考虑一下控制软件和硬件设备之间的连接方式。ASCII 串行连接需要使用 TCP 的套接字连接、用于处理设备发送/接收的…

阅读更多...

肺癌类器官培养研究概述

肺癌类器官培养研究概述

前言 2023年是类器官被《Science》杂志评为年度十大技术的10周年。10年后类器官技术发展迅猛，犹如一颗璀璨的明珠，不断的为生命科学研究揭示新的奥秘，推动生物医学领域不断前行。肺类器官培养条件也在不断完善，在基础和临床研究…

阅读更多...

MySQL面试知识汇总

MySQL面试知识汇总

学习链接创建索引有哪些注意点？ 索引应该建在查询频繁的字段，比如where查询、order排序索引的个数应该适量（最多64个），索引需要占用空间，更新时也需要维护区分度低的字段，例如性别&#xff0c…

阅读更多...

声阔头戴式耳机怎么样？西圣、jBL、声阔头戴式耳机终极pk测评推荐

声阔头戴式耳机怎么样？西圣、jBL、声阔头戴式耳机终极pk测评推荐

我们深知，一款优秀的头戴式耳机，不仅仅是音乐的传递者，更是用户情感与个性的延伸。因此，在设计之初，便将极致的佩戴舒适度视为核心追求，通过人体工学的精准设计与优质材料的精心挑选，力求让每一…

阅读更多...

Linux 配置与管理 SWAP(虚拟内存）

Linux 配置与管理 SWAP(虚拟内存）

Linux 配置与管理 SWAP(虚拟内存） 一、作用二、创建交换文件（以创建一个2GB的交换文件为例）1. 创建交换文件2. 设置文件权限2.1. **关于 sudo chmod 600 /root/swapfile 是否一定要执行**2.2. **关于其他用户启动是否没权限用到交换分区** 3.…

阅读更多...

大数据电商数仓项目--实战（一）数据准备

大数据电商数仓项目--实战（一）数据准备

第一章数仓分层 1.1 为什么要分层 1.2 数仓命名规范 1.2.1 表命名 ODS层命名为ods_表名DIM层命名为dim_表名DWD层命名为dwd_表名DWS层命名为dws_表名DWT层命名为dwt_表名ADS层命名为ads_表名临时表命名为tmp_表名 1.2.2 表字段类型数量类型为bigint金额类型为decimal(16…

阅读更多...

猫咪独自在家可以吗？希喂、美的、有哈宠物空气净化器哪款好？

猫咪独自在家可以吗？希喂、美的、有哈宠物空气净化器哪款好？

这不是快要国庆了吗，本来计划去旅游的，结果我妈让我假期回家。收拾行李已经很烦了，行李箱旁的猫咪更是让我头疼。我妈因为之前浮毛过敏的事情，禁止我把猫咪再带回家，朋友们也各有计划，甚至连上门喂养都约满…

阅读更多...

设备管理与点巡检系统

设备管理与点巡检系统

在现代企业管理中，设备的高效运作至关重要。为此，我们推出了设备管理与点巡检系统，通过自动化管理提升设备使用效率，保障生产安全。系统特点设备全生命周期管理系统涵盖设备的各个阶段，从设备管理、点检、巡检、保…

阅读更多...

推荐文章

最新文章