计算机视觉与深度学习-全连接神经网络-训练过程-权值初始化- [北邮鲁鹏]

计算机视觉与深度学习-全连接神经网络-训练过程-权值初始化- [北邮鲁鹏]

news2024/11/6 9:45:25

文章目录

思想
避免全零初始化
随机权值初始化
- 权值初始化太小：
- 权值初始化太大
- Xavier初始化
- - 目标
  - 为什么输入和输出分布会变得不同？
  - Xavier在使用Tanh时的表现好
  - Xavier在使用ReLU时的表现不好
- HE初始化（MSRA）
- 权值初始化总结

思想

通过调整权值的分布使得输出与输入具有相同的分布

在这里插入图片描述

避免全零初始化

全零初始化：网络中不同的神经元有相同的输出，进行同样的参数更新；
因此，这些神经元学到的参数都一样，等价于一个神经元。

在这里插入图片描述
建议：采用随机初始化，避免全零初始化！

随机权值初始化

权值初始化太小：

前向信息流消失

在这里插入图片描述

权值初始化太大

反向梯度消失

在这里插入图片描述

实验结论：初始化时让权值不相等，并不能保证网络能够正常的被训练。

有效的初始化方法：是网络各层的激活值和局部梯度的方差在传播过程中尽量保持一致；以保证网络中正向和反向数据流动。

Xavier初始化

Xavier初始化是一种用于初始化神经网络权重的方法，旨在使网络的前向传播时保持信号的方差不变。该方法根据每一层的输入和输出神经元的数量来确定权重的初始范围。

目标

使网络各层的激活值和局部梯度的方差在传播过程中保持一致，即寻找w的分布使得输出y与输入z的方差一致

在这里插入图片描述

为什么输入和输出分布会变得不同？

因为输入在经过隐藏层时发生衰变。

Xavier在使用Tanh时的表现好

在这里插入图片描述

Xavier在使用ReLU时的表现不好

在这里插入图片描述
在多次迭代后结果集中在0附近

HE初始化（MSRA）

在这里插入图片描述
适用于ReLU函数

权值初始化总结

好的初始化方法可以防止前向传播过程中的信息消失，也可以解决反向传递过程中的梯度消失。
激活函数选择双曲正切(ReLU)或者Sigmoid时，建议使用Xaizer初始化方法;
激活函数选择ReLY或Leakly ReLU时，推荐使用He初始化方法。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1024956.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Kafka 集群与可靠性

Kafka 集群与可靠性

文章目录 Kafka集群的目标Kafka集群规模如何预估Kafka集群搭建实战Kafka集群原理成员关系与控制器集群工作机制replication-factor参数auto.leader.rebalance.enable参数集群消息生产可靠的生产者ISR（In-sync Replicas）使用ISR方案的原因ISR相关配置说明…

阅读更多...

一键转换！轻松将视频转换为TS格式，让您的视频播放更顺畅！

一键转换！轻松将视频转换为TS格式，让您的视频播放更顺畅！

尊敬的用户们，您是否遇到过需要将视频转换为TS格式的情况，但不知道应该如何操作？现在，我们为您提供一款简单而高效的工具，让您轻松将视频转换为TS格式，让您的视频播放更加顺畅！ 首先&#xff0…

阅读更多...

【flutter】架构之商城main入口

【flutter】架构之商城main入口

架构之商城main入口前言一、项目模块的划分二、入口main的配置三、配置文件怎么做总结前言本栏目我们将完成一个商城项目的架构搭建，并完善中间的所有功能，总页面大概200个，如果你能看完整个栏目，你肯定能独立完成flutter 项目…

阅读更多...

Java-根据模板生成PDF

Java-根据模板生成PDF

文章目录前言一、准备模板二、代码实现三、源代码总结前言在有些场景下我们可能需要根据指定的模板来生成 PDF，比如说合同、收据、发票等等。因为 PDF 是不可编辑的，所以用代码直接对 PDF 文件进行修改是很不方便的，这里我是通过 itext 和…

阅读更多...

优思学院｜六西格玛核心方法：CTQ关键质量树

优思学院｜六西格玛核心方法：CTQ关键质量树

在六西格玛管理方法中，CTQ是Critical-To-Quality的缩写。CTQ代表客户需求，这些需求被认为是项目/产品/流程的成功与否的关键因素，得到了执行团队的认可。CTQ树最初是作为六西格玛方法的一部分开发的。然而，您可以在各种情况下使用…

阅读更多...

VERTU钛合金材质手机创新应用，领先苹果十年之久

VERTU钛合金材质手机创新应用，领先苹果十年之久

9月13日,苹果发布了iPhone15系列手机,值得一提的是,这是苹果首次使用钛合金材质,也是苹果引以为傲的创新之一。钛合金是一种轻质、耐腐蚀、强度高的材料,由此应用于智能手机,可以提升手机的整体强度、耐摔性和耐刮擦性。然而,一个备受关注的事实是,英国奢侈手机品牌VERTU早在六…

阅读更多...

上海亚商投顾：沪指震荡反弹汽车产业链全天强势

上海亚商投顾：沪指震荡反弹汽车产业链全天强势

上海亚商投顾前言：无惧大盘涨跌，解密龙虎榜资金，跟踪一线游资和机构资金动向，识别短期热点和强势个股。一.市场情绪大小指数昨日集体反弹，沪指3100点失而复得，创业板指一度涨超1.5%，随后涨幅…

阅读更多...

Vue的第三章节之模版语法下篇（带你感受来自Vue模版语法的魅力）

Vue的第三章节之模版语法下篇（带你感受来自Vue模版语法的魅力）

目录编辑前言一、事件处理器 1. 事件冒泡模拟及处理方式 1.1 模拟 1.2 处理方式 1.3 事件冒泡模型图 2. 事件修饰符 3. 事件修饰符的使用案例模拟使用二、表单的综合案例（在控制台输出结果） 1. 模拟案例测试代码效果三、 Vue之自…

阅读更多...

Vue模板语法（下）

Vue模板语法（下）

事件处理器 <!DOCTYPE html> <html><head><meta charset"utf-8"><title></title><script src"https://cdn.bootcdn.net/ajax/libs/jquery/3.7.1/jquery.min.js"></script><script src"https://c…

阅读更多...

内存利用：迟来的blindless与逃不掉的exit漏洞

内存利用：迟来的blindless与逃不掉的exit漏洞

0x01 前言在计算机安全领域，漏洞的危险性往往与其广泛性和潜在攻击方式密切相关。今天，我们将深入探讨一个异常危险的漏洞，它存在于程序退出时执行的常见函数"exit"中。无论是在操作系统还是应用程序中，"exit&qu…

阅读更多...

【Vue.js】快速入门与工作生命周期的使用

【Vue.js】快速入门与工作生命周期的使用

🎬 艳艳耶✌️：个人主页 🔥 个人专栏 ：《Spring与Mybatis集成整合》《springMvc使用》 ⛺️ 生活的理想，为了不断更新自己 ! 目录编辑 1.Vue是什么 2.Vue的特点及优势 3. 使用Vue的详细步骤 3.1.导入 3.2…

阅读更多...

资源超分是什么？

资源超分是什么？

经常听到资源超分，但是具体指的什么还不清楚，哪里来的术语 https://www.modb.pro/db/199368 3．超线程技术管理及如何开启超线程是intel研发的技术，利用特殊的硬件指令，把一个物理CPU核模拟成两个逻辑内核&#xff…

阅读更多...

点成案例丨温度梯度培养箱在探究温度对植物发芽影响中的应用

点成案例丨温度梯度培养箱在探究温度对植物发芽影响中的应用

变暖的气候与受影响的种子全球变暖是指由于人类工业化和燃烧化石燃料等活动释放了大量温室气体，这些气体进入大气层导致地球气温在过去几十年里逐渐升高的现象。全球气候变暖带来了一系列严重的环境问题：温度升高导致冰川和极地冰层融化，海…

阅读更多...

中秋节要来了，程序猿的你还要加班吗

中秋节要来了，程序猿的你还要加班吗

其他人的中秋节是这样的： 明月松间照，清泉石上流。程序猿的中秋节是这样的： 明月几时有？把酒问青天。首先，跟大家开个玩笑。希望中秋节的你，不要加班，毕竟身体是革命的本钱嘛。中秋&…

阅读更多...

初识 python 装饰器

初识 python 装饰器

1.什么是装饰器？ 装饰器（Decorator）是Python中一种用于修改函数或类的行为的设计模式。装饰器允许您在不修改原始函数或类的情况下，给它们添加新的功能，这使得代码更具可重用性和可扩展性。简而言之，就是一…

阅读更多...

17.适配器模式（Adapter）

17.适配器模式（Adapter）

意图：将一个类的接口转换为Client希望的另一个接口，使得原本由于接口不兼容而不能一起工作的那些类在一起工作。 UML图 Target：定义Client使用的与特定领域相关的接口。 Client：与符合Target接口的对象协同工作。 Adaptee&#xf…

阅读更多...

华为OD机试 - 求最多可以派出多少支团队 - 双指针（Java 2023 B卷 100分）

华为OD机试 - 求最多可以派出多少支团队 - 双指针（Java 2023 B卷 100分）

目录专栏导读一、题目描述二、输入描述三、输出描述四、解题思路五、Java算法源码六、效果展示1、输入2、输出3、说明华为OD机试 2023B卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试（JAVA）真题（A卷B卷&#…

阅读更多...

Linux提权辅助工具Linux Exploit Suggester

Linux提权辅助工具Linux Exploit Suggester

Linux提权辅助工具Linux Exploit Suggester 1.概述2.工具使用3.已经有人二开了 1.概述 Linux Exploit Suggester是一款根据操作系统版本号自动查找相应提权脚本的工具 Linux Exploit Suggester的官方下载地址为https://github.com/PenturaLabs/Linux_Exploit_Suggester 2.工具…

阅读更多...

Linux内核源码分析 (B.4) 深度剖析 Linux 伙伴系统的设计与实现

Linux内核源码分析 (B.4) 深度剖析 Linux 伙伴系统的设计与实现

Linux内核源码分析 (B.4) 深度剖析 Linux 伙伴系统的设计与实现文章目录 1\. 伙伴系统的核心数据结构2\. 到底什么是伙伴3\. 伙伴系统的内存分配原理4\. 伙伴系统的内存回收原理5\. 进入伙伴系统的前奏5.1 获取内存区域 zone 里指定的内存水位线5.2 检查 zone 中剩余内存容量…

阅读更多...

基于Java的公务员考试资料共享平台的设计与实现

基于Java的公务员考试资料共享平台的设计与实现

前言 💗博主介绍：✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗 👇🏻…

阅读更多...

推荐文章

最新文章