李沐深度学习知识点—数值稳定性、模型激活函数、全连接层到卷积、卷积层

李沐深度学习知识点—数值稳定性、模型激活函数、全连接层到卷积、卷积层

news2026/2/16 7:54:29

数值稳定性

其中h是一个向量，向量关于向量的倒数是一个矩阵，因此求梯度是求矩阵乘法

矩阵乘法带来了梯度爆炸，梯度消失

模型初始化和激活函数

归一化：不管梯度多大，我都把梯度拉回来，否的出现梯度爆炸和梯度消失问题。

不管做多深，都能在一个合理范围内

假设权重是独立同分布，定义均值和方差，t是层数

nt-1是t层输入的维度，nt是输出的维度，除非输入等于输入，除非无法相等

γt是第t层权重的方差

不能满足同时，取个折中，给定当前层和输出层权重大小，就能确定方差大小。

采用正态分布，当前值是0，方差不是固定的0.01了，是根据输入输出决定的。

如果想使得前项输出的均值和方差都是0，固定，那么β=0，α=1.

意味着什么？意味着激活函数fx必须=x，其中tanh和relu满足在0点附近，sigmoid改变后可以满足fx=x

补充：激活函数：如果不用激活函数，每一层输出都是上层输入的线性函数，如果使用，激活函数给神经元引入了非线性因素，使神经网络可以逼近任何非线性函数。

总结：可以通过合理的权重初始值和激活函数的选取提升数值的稳定性。

全连接层到卷积

一张图片中找信息，不能所有点都检查一遍。需要满足两个原则

平移不变性

局部性

现在x位置变换后，权重也得跟着变换，如何能让他不变。不管ij怎么变换，输出的地方挪到哪个位置，用的识别检测器v都应该不变的。

当把一个模型的取值范围做了限制，模型复杂度就降低了。也就不用存那么多元素了。

假设要算ij这个输出话，以i为中心，a可以任意变换的位置都要看一遍，但实际不应该看那么远的地方，只看附近就行。因此做出限制。

卷积层是特殊的全连接层

全连接层：卷积、池化、激活函数但是将原始数据映射到隐藏特征空间，全连接层是将学到的“分布式特征表示”映射到样本标记空间的作用。

卷积层

3、统一的公式：o = [( i + 2p - k) / s] + 1

说是卷积层，但是为了实现方便，将权重的负号改为了正，实际上是二维交叉相关

气象地图涉及到了时间

总结：

卷积层将输入和核矩阵进行交叉相关，加上偏移后得到输出

核矩阵和偏移时可学习的参数

核矩阵的大小是超参数（kernel的大小）

解决了问题：权重随着输入变得特别大，卷积不会有这个问题。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1882044.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【基础篇】第4章 Elasticsearch 查询与过滤

【基础篇】第4章 Elasticsearch 查询与过滤

在Elasticsearch的世界里，高效地从海量数据中检索出所需信息是其核心价值所在。本章将深入解析查询与过滤的机制，从基础查询到复合查询，再到全文搜索与分析器的定制，为你揭开数据检索的神秘面纱。 4.1 基本查询 4.1.1 Match查询…

阅读更多...

内容个性化的智能引擎：Kompas.ai如何满足用户需求

内容个性化的智能引擎：Kompas.ai如何满足用户需求

在数字化时代，用户对内容的消费趋向个性化和定制化。个性化内容不仅能提升用户体验，还能增强品牌与用户之间的互动。Kompas.ai作为一款先进的智能引擎，正通过其独特的技术满足用户的个性化需求。个性化内容的重要性个性化内容在提升用户体验…

阅读更多...

2024 vue3入门教程：01vscode终端命令创建第一个vue项目

2024 vue3入门教程：01vscode终端命令创建第一个vue项目

参考vue官网手册：https://cn.vuejs.org/guide/quick-start.html 一、找个盘符，新建文件夹存储以后得vue项目我的是e盘下创建了vueproject 二、使用vscode打开存储vue项目的文件夹因为我生成过项目，所以有文件，你们初次是没有…

阅读更多...

分布式存储和分布式计算两个哪个更适合作为工作深入方向发展?

分布式存储和分布式计算两个哪个更适合作为工作深入方向发展?

有朋友问，分布式存储比如hdfs，ceph，minio，tidb，glusterfs；分布式计算比如Hadoop，spark，flink；它们在实际工作中咋样？具体开发工作是啥？哪个更有发…

阅读更多...

leetCode.96. 不同的二叉搜索树

leetCode.96. 不同的二叉搜索树

leetCode.96. 不同的二叉搜索树题目思路代码 // 方法一：直接用卡特兰数就行 // 方法二：递归方法 class Solution { public:int numTrees(int n) {// 这里把 i当成整个结点，j当成左子树最左侧结点,并一次当根节点尝试// f[ i ] f[ j - 1…

阅读更多...

《昇思25天学习打卡营第19天 | 昇思MindSporeDiffusion扩散模型》

《昇思25天学习打卡营第19天 | 昇思MindSporeDiffusion扩散模型》

19天本节学了Diffusion扩散模型相关知识，并且通过实例完成扩散模型。Diffusion是从纯噪声开始通过一个神经网络学习逐步去噪，最终得到一个实际图像。 1.Diffusion对于图像的处理包括以下两个过程： 1.1我们选择的固定（或预定义&…

阅读更多...

Is ChatGPT a Good Personality Recognizer? A Preliminary Study？

Is ChatGPT a Good Personality Recognizer? A Preliminary Study？

ChatGPT是一个很好的人格识别者吗？初步调研摘要1 介绍2 背景和相关工作3 实验3.1 数据集3.2 提示策略3.3 基线3.4 评估指标3.5 实现细节3.6 Overall Performance (RQ1)3.7 ChatGPT在人格识别上的公平性 (RQ2)3.8 ChatGPT对下游任务的人格识别能力（RQ3&a…

阅读更多...

python-求s=a+aa+aaa+aaaa+aa...a的值（赛氪OJ）

python-求s=a+aa+aaa+aaaa+aa...a的值（赛氪OJ）

[题目描述] 求 saaaaaaaaaaaa...a 的值，其中 a 是一个一位的整数。例如 ：2222222222222222(此时共有 5 个数相加)。输入格式： 整数 a 和 n （ n 个数相加）。输出格式： s 的值。样例输入 2 2样例输出 24数据…

阅读更多...

操作系统精选题（四）（论述题）

操作系统精选题（四）（论述题）

🌈 个人主页：十二月的猫-CSDN博客 🔥 系列专栏： 🏀操作系统 💪🏻 十二月的寒冬阻挡不了春天的脚步，十二点的黑夜遮蔽不住黎明的曙光目录前言一、银行家算法的一道例题二、页…

阅读更多...

Stateflow快速入门系列（七）：使用时序逻辑调度图动作

Stateflow快速入门系列（七）：使用时序逻辑调度图动作

要定义 Stateflow 图在仿真时间的行为，请在图的状态和转移动作中包含时序逻辑运算符。时序逻辑运算符是内置函数，告知状态保持激活的时间长度或布尔条件保持为 true 的时间长度。使用时序逻辑，您可以控制以下各项的时序： 各状态之…

阅读更多...

守护矿山安全生产：AI视频分析技术在煤矿领域的应用

守护矿山安全生产：AI视频分析技术在煤矿领域的应用

随着人工智能（AI）技术的快速发展，其在煤矿行业的应用也日益广泛。AI视频智能分析技术作为其中的重要分支，为煤矿的安全生产、过程监测、效率提升和监管决策等提供了有力支持。一、煤矿AI视频智能分析技术的概述视频智慧煤矿AI…

阅读更多...

[数据库]mysql用户管理权限管理

[数据库]mysql用户管理权限管理

目录编辑用户管理编辑权限管理编辑编辑编辑案例编辑细节编辑用户管理我们用创建的用户在登录之后可以看到他和root看到的数据库是完全不一样的权限管理案例登录这个账户可以看到还看不到teatdb这个数据库, 因为还没有授权分配权限过来刷新…

阅读更多...

OpenCV 张正友标定法（二）

OpenCV 张正友标定法（二）

文章目录一、简介二、实现代码三、实现效果参考资料一、简介在之前的博客OpenCV 张氏标定法中，我们没有考虑镜头畸变等因素，因此计算出的内参与外参均是理想情况下的数值，而如果我们考虑到镜头的畸变：我们就需要考虑使用最小二乘法最小化像素坐标的重投影误差（上述所求…

阅读更多...

007-GeoGebra基础篇-构建等边三角形

007-GeoGebra基础篇-构建等边三角形

今天继续来一篇尺规作图，可以跟着操作一波，刚开始我写的比较细一点，每步都有截图，后续内容逐渐复杂后我就只放置算式咯。目录一、先看看一下最终效果二、本次涉及的内容三、开始尺规画图1. 绘制定点A和B2. 绘制线段AB3. 以点A为…

阅读更多...

基于STM32的智能电池管理系统

基于STM32的智能电池管理系统

目录引言环境准备智能电池管理系统基础代码实现：实现智能电池管理系统 4.1 数据采集模块4.2 数据处理与分析4.3 控制系统实现4.4 用户界面与数据可视化应用场景：电池管理与优化问题解决方案与优化收尾与总结 1. 引言智能电池管理系统（Ba…

阅读更多...

C语言--vs使用调试技巧

C语言--vs使用调试技巧

1.什么是bug? 1.产品说明书中规定要做的事情，而软件没有实现。 2.产品说明书中规定不要做的事情，而软件确实现了。 3.产品说明书中没有提到过的事情，而软件确实现了。 4.产品说明书中没有提到但是必须要做的事情，软件确没有实…

阅读更多...

预付式消费，今起实行！

预付式消费，今起实行！

近年来，随着我国经济社会快速发展，消费新业态、新模式不断涌现，消费者权益保护也面临新情况、新问题。大数据杀熟、自动续费难取消、网络直播带货“以假充真”“以次充好”、预付式消费商家跑路……数据显示，2023年，…

阅读更多...

Vue 常见面试题及答案

Vue 常见面试题及答案

本人详解作者：王文峰，参加过 CSDN 2020年度博客之星，《Java王大师王天师》公众号：JAVA开发王大师，专注于天道酬勤的 Java 开发问题中国国学、传统文化和代码爱好者的程序人生，期待你的关注和支持！本人外号：神秘小峯山峯转载说明：务必注明来源（注明：作者：王文峰…

阅读更多...

鸿蒙：页面路由使用

鸿蒙：页面路由使用

页面路由使用步骤： 1.导入Router模块 2.使用路由功能，以pushUrl模式为例 3.接收参数、返回 4.此时的路由是不能使用的，需要到main_pages.json中进行注册

阅读更多...

vscode的一些使用问题

vscode的一些使用问题

vscode使用技巧 1、快捷键（1）打开命令面板（2）注释（3）删除行（4）上下移动光标（5）光标回退（6）复制行（7）插入空白行…

阅读更多...

推荐文章

最新文章