14 数值稳定性 + 模型初始化和激活函数【李沐动手学深度学习v2笔记】

news2025/4/6 21:13:42

1. 数值稳定性

神经网络的梯度

向量对向量求导（梯度）得到矩阵，太多的矩阵进行乘法会导致常见的两个问题

梯度消失和梯度爆炸 MLP MLP使用ReLU作为激活函数梯度爆炸的问题输入很大的时候梯度接近为0 梯度消失梯度消失的问题

只能训练比较浅的神经网络（底层训练不到）

总结

2. 模型初始化和激活函数

让训练更加稳定

让每层的方差是一个常数

权重初始化

例子：MLP

当前层的权重独立于当前层的输入

正向方差

反向均值和方差

Xavier初始

线性激活函数

反向

常用激活函数

总结

这一节听不懂了家人们，先这么着，回来懂了再回补

知乎https://zhuanlan.zhihu.com/p/685154434

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1490505.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

快速上手：在 Android 设备上运行 Pipy

Pipy 作为一个高性能、低资源消耗的可编程代理，通过支持多种计算架构和操作系统，Pipy 确保了它的通用性和灵活性，能够适应不同的部署环境，包括但不限于云环境、边缘计算以及物联网场景。它能够在 X86、ARM64、海光、龙芯、RISC-V …

（3）(3.2) MAVLink2数据包签名(安全)

文章目录前言 1 配置 2 使用 3 MAVLink协议说明前言 ArduPilot 和任务计划器能够通过使用加密密钥添加数据包签名，为空中 MAVLink 传输增加安全性。这并不加密数据，只是控制自动驾驶仪是否响应 MAVLink 命令。当自动驾驶仪处于激活状态时&#x…

详解：抖音老隋分享的蓝海项目优势

在当前竞争激烈的市场环境中，企业寻求突破和增长变得愈发困难。然而，抖音老隋分享的蓝海项目却为企业提供了一种全新的商业模式，助力企业实现创新和突破。本文将详细解析抖音老隋分享的蓝海项目优势主要有哪些。首先，抖音老隋分享…

VLAN虚拟局域网络

VLAN的概念和配置: http://t.csdnimg.cn/g39F7http://t.csdnimg.cn/g39F7 实验：

Verilog Coding Styles For Improved Simulation Efficiency论文学习记录

原文基于Verilog-XL仿真器，测试了以下几种方式对仿真效率的影响。 1. 使用 Case 语句而不是 if / else if 语句八选一多路选择器 case 实现效率比 if / else if 提升 6% 。 2. 如果可以尽量不使用 begin end 语句使用 begin end 的 ff 触发器比不使用 begin end …

Centos 9 安装 k8s

为了尽可能契合生产环境的部署情况，这里用kubeadm安装集群，同时方便跟随笔记一步步实践的过程，也更加了解k8s的一些特性和基础知识。先决条件这里将通过虚拟机安装3台centos stream 9服务器，并组成kubeneters集群（…

【回溯算法】【组合问题】Leetcode 77.组合 216. 组合总和 III

【回溯算法】【回溯算法剪枝】 Leetcode 77.组合 216. 组合总和 III 回溯算法可以解决的问题Leetcode 77.组合解法1 回溯法三部曲，函数参数、终止条件和单层搜索逻辑解法一plus 回溯法剪枝另一道组合回溯问题 216. 组合总和 III解法：回溯解法&#xff1…

C++设计模式之——享元模式详解和代码案例

文章目录 C中实现享元模式通常涉及以下几个关键部分：一个简单的C代码片段示例享元模式的进一步说明C享元模式代码案例——咖啡店订单系统享元模式在现实世界的应用场景 C中实现享元模式通常涉及以下几个关键部分： 享元模式（Flyweight Patter…

【Linux网络】再谈 “协议“

目录再谈 "协议" 结构化数据的传输序列化和反序列化网络版计算器封装套接字操作服务端代码服务进程执行例程启动网络版服务端协议定制客户端代码代码测试使用JSON进行序列化与反序列化我们程序员写的一个个解决我们实际问题，满…

一手实测【Claude3】 - GPT4啊，你的时代终于要过去了

通过虚拟卡 WildCard 的方式来升级Claude3最快了，大概2分钟就可以开通完成, 而且升级 GPT 4.0 价钱也不贵，虚拟卡一年10美元，Claude3 每个月也才 20美元。如果你觉得Claude3对你可能有帮助，那就赶快来升级吧！ Claude3…

这本书太好了！150页就能让你上手大模型应用开发

如果问个问题：有哪些产品曾经创造了伟大的奇迹？ChatGPT 应该会当之无愧入选。仅仅发布 5 天，ChatGPT 就吸引了 100 万用户——当然，数据不是关键，关键是其背后的技术开启了新的 AI 狂潮，成为技术变革的点火…

多功能声学综合馆：革新解决气膜场馆噪音难题

近年来，气膜场馆在各类活动中的广泛应用带来了许多便利，但其内部噪音问题也一直困扰着人们。为了有效解决这一挑战，多功能声学综合馆崭露头角，通过创新的声学技术成为解决气膜场馆噪音问题的独特方案。在这个嘈杂的世界中&#x…

第三篇【传奇开心果系列】Python的自动化办公库技术点案例示例：深度解读Pandas股票市场数据分析

传奇开心果博文系列系列博文目录Python的自动化办公库技术点案例示例系列博文目录前言一、Pandas进行股票市场数据分析常见步骤和示例代码1. 加载数据2. 数据清洗和准备3. 分析股票价格和交易量4. 财务数据分析二、扩展思路介绍1. 技术指标分析2. 波动性分析3. 相关性分析4.…

MYSQL07高级_Hash结构、平衡二叉树、B树、B+树介绍

文章目录 ①. 全表遍历②. Hash结构③. 平衡二叉搜索树(AVL)④. B树⑤. B树⑥. 时间复杂度选择的合理性磁盘的I/O操作次数对索引的使用效率至关重要查找都是索引操作,一般来说索引非常大,尤其是关系型数据库,当数据量比较大的时候,索引的大小有可能几个G甚至更多,为了减少索引…

头像剪切上传

头像剪切上传文章说明核心Api示例源码效果展示源码下载文章说明本文主要为了学习头像裁剪功能，以及熟悉canvas绘图和转文件的相关操作，参考教程（Web渡一前端–图片裁剪上传原理） 核心Api 主要就一个在canvas绘图的操作 context…

【触想智能】工业一体机刷卡应用知识分享

工业一体机刷卡技术是一种高效、稳定、安全的身份认证方式，具有广泛的应用场景和优势。在工业自动化控制、生产过程监测等领域，它已成为必不可少的设备之一。一、工业一体机刷卡的原理:工业一体机刷卡的原理和普通的刷卡设备类似，都是通过读…

VS2022如何添加行号？（VS2022不显示行号解决方法）

VS2022不显示行号解决方法 VS2022是非常好用的工具，很多同学在初学C/C的时候，都会安装，默认安装好VS2022后，写代码时，在编辑框的窗口左边就有显示行号，如下图所示： 但是有些同学安装好后&#…

阿里云中小企业扶持权益

为企业提供云资源和技术服务，助力企业开启智能时代创业新范式。阿里云推出中小企业扶持权益上云必备，助力企业长期低成本用云一、ECS-经济型e实例、ECS u1实例活动规则活动时间 2023年10月31日0点0分0秒至2026年3月31日23点59分59秒活动对象同时满…

GEE：使用Sigmoid激活函数对单波段图像进行变换（以NDVI为例）

作者：CSDN @ _养乐多_ 本文将介绍在 Google Earth Engine （GEE）平台上，对任意单波段影像进行 Sigmoid 变换的代码。并以对 NDVI 影像像素值的变换为例。文章目录一、Sigmoid激活函数1.1 什么是 Sigmoid 激活函数1.2 用到遥感图像上有什么用？二、代码链接三、完整代码一…

Tomcat概念、安装及相关文件介绍

目录一、web技术 1、C/S架构与B/S架构 1.1 http协议与C/S架构 1.2 http协议与B/S架构 2、前端三大核心技术 2.1 HTML（Hypertext Markup Language） 2.2 css（Cascading Style Sheets） 2.3 JavaScript 3、同步和异步 4、…