深度学习 --- stanford cs231学习笔记八(训练神经网络之dropout)

深度学习 --- stanford cs231学习笔记八(训练神经网络之dropout)

news2026/2/15 16:23:28

6，dropout

6，1 线性分类器中的正则化

在线性分类器中，我们提到过正则化，其目的就是为了防止过度拟合。例如，当我们要用一条curve去拟合一些散点的数据时，常常是不希望训练出来的curve过所有的点，因为这些点里面可能包含噪声。如果，拟合出来的函数曲线真的能过所有的点，包括噪点，往往不是人们期望中的那条最佳curve。

对于深度学习而言，过度拟合还好带来另一个问题，就是弱化泛化能力。说白了就是训练好的模型只在部分数据上表现良好，在其他的一些数据上的表现就没那么好。比如说，在下图的左图中随着迭代次数的增加，损失函数的值越来越低，说明训练的模型准确率越来越高。但把这个训练好的模型放在测试集上，随着迭代次数的增加，训练集的准确率越来越高，但验证集的准确率一直没变。

在线性分类器中，为了避免这一问题，通过在损失函数中加入了正则化项达到目的。

6，2 神经网络中的正则化---drop out

除了上面提到的L1,L2正则化，在神经网络中还有一种更为强大且常用的正则化方法---dropout他们都是为了防止过拟合。

Dropout 的原理：

dropout通过在训练过程中以一定概率“丢弃”神经元，即，选择性的令一部分神经元的输出为0。神经元的丢弃概率通常选择在0.2到0.5之间，具体值需要根据具体的任务和数据集进行调优。在不同层应用不同的丢弃概率。

他打破了每层神经网络中的co-adapting(协同适应性)，即，神经元之间的相互依赖。co-adapting会引起模型在训练数据上表现很好，但在新数据上表现不佳。且增加了不同神经元所学习到的特征的相似性。

具体实现：

1，在训练阶段，每个神经元以概率p被随机丢弃，丢弃的神经元在当前迭代中不参与计算。这样，每次迭代都使用一个不同的“子网络”。

2，在测试阶段：所有神经元都参与计算，但为了保持输出的预期值一致，需要将每个神经元的输出按丢弃概率p进行缩放（乘以1-p）。

引起co-adapting的原因：

在训练的过程中，每层神经网络中的全部神经元是通过一同更新来缩小损失函数的。换句话说就是所有的神经元协同作用并肩作战，而不是单打独斗。这就是说，对于每个隐含层而言，是整层神经元反映/学习了一个feature，而不是一层中的单个神经元反映/学习了一个feature。

dropout通过随机丢弃神经元，迫使模型在训练的时候不能靠整层神经元去学习，而是需要每个神经元独立地处理输入数据。

这能增加了不同神经元所学习特征的多样性。下面是使用dropout技术前后神经元学习到的feature的差异。

过拟合的原因：

由于深层神经网络的学习功能十分强大，因此，在训练数据集的学习过程中，除了学习我们期望的部分，还会学习到噪声。这就会引起过度拟合，使得模型在训练数据上表现良好，但在新数据上表现不佳。

局限性：

Dropout并不是解决所有过拟合问题的万能方法，有时也需要结合其他正则化方法（如L1、L2正则化）或者数据增强等技术。

使用dropout会增加训练时间，因为每次训练迭代都要随机丢弃神经元并重新计算网络的前向和反向传播。

（全文完）

--- 作者，松下J27

参考文献(鸣谢)：

1，Stanford University CS231n: Deep Learning for Computer Vision

2，训练神经网络(第二部分)_哔哩哔哩_bilibili

3，10 Training Neural Networks I_哔哩哔哩_bilibili

4，Schedule | EECS 498-007 / 598-005: Deep Learning for Computer Vision

5，《Dropout: A Simple Way to Prevent Neural Networks from Overfitting》

版权声明：所有的笔记，可能来自很多不同的网站和说明，在此没法一一列出，如有侵权，请告知，立即删除。欢迎大家转载，但是，如果有人引用或者COPY我的文章，必须在你的文章中注明你所使用的图片或者文字来自于我的文章，否则，侵权必究。 ----松下J27

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1896651.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【C#】ProgressBar进度条异步编程思想

【C#】ProgressBar进度条异步编程思想

1.控件介绍进度条通常用于显示代码的执行进程进度，在一些复杂功能交互体验时告知用户进程还在继续。在属性栏中，有三个值常用： Value表示当前值，Minimum表示进度条范围下限，Maximum表示进度条范围上限。 2.简单实…

阅读更多...

探索人工智能在电子商务平台与游戏发行商竞争中几种应用方式

探索人工智能在电子商务平台与游戏发行商竞争中几种应用方式

过去 12 年来，电脑和视频游戏的发行策略发生了巨大变化。数字游戏的销量首次超过实体游戏的销量在20132020 年的封锁进一步加速了这一趋势。例如，在意大利，封锁的第一周导致数字游戏下载量暴涨174.9%. 展望未来，市场有望继续增…

阅读更多...

配置基于不同IP地址的虚拟主机

配置基于不同IP地址的虚拟主机

定义配置文件vhost.conf <directory /www> allowoverride none require all granted </directory> <virtualhost 192.168.209.136:80> documentroot /www servername 192.168.209.136 </virtualhost><virtualhost 192.168.209.138:80> document…

阅读更多...

电阻负载柜或无功负载组？

电阻负载柜或无功负载组？

选择正确电源测试解决方案的快速指南如果您在市场上寻找负载组，您无疑会遇到电阻式和反应式这两个术语。为了使负载组规范尽可能简单，您需要了解不同类型的负载测试解决方案之间的区别，以及哪种解决方案最适合您的应用。什么是电阻负载组&…

阅读更多...

AntDesign上传组件upload二次封装+全局上传hook使用

AntDesign上传组件upload二次封装+全局上传hook使用

文章目录前言a-upload组件二次封装1. 功能分析2. 代码详细注释3. 使用到的全局上传hook代码4. 使用方式5. 效果展示总结前言在项目中，ant-design是我们常用的UI库之一，今天就来二次封装常用的组件a-upload批量上传组件,让它用起来更方便。 a-uploa…

阅读更多...

Gartner发布软件供应链安全指南：软件供应链攻击造成的损失将从 2023 年的460亿美元上升到2031年的1380亿美元

Gartner发布软件供应链安全指南：软件供应链攻击造成的损失将从 2023 年的460亿美元上升到2031年的1380亿美元

软件供应链安全是一个关键的风险和合规性问题，但大多数组织都以分散的方式处理它。缺乏一个包罗万象的框架会遗留安全漏洞。通过实施三支柱框架，安全和风险管理领导者可以确保广泛的保护。主要发现对软件供应链的攻击给组织带来重大的安全、监管和运营…

阅读更多...

Twitter群发消息API接口的功能？如何配置？

Twitter群发消息API接口的功能？如何配置？

Twitter群发消息API接口怎么申请？如何使用API接口？ 为了方便企业和开发者有效地与用户互动，Twitter提供了各种API接口，其中Twitter群发消息API接口尤为重要。AokSend将详细介绍Twitter群发消息API接口的功能及其应用场景。 Twit…

阅读更多...

foreach的一些坑（在遍历时修改元素带来的问题）

foreach的一些坑（在遍历时修改元素带来的问题）

阅读更多...

船舶雷达与导航中M7/8防水插座应用优势

船舶雷达与导航中M7/8防水插座应用优势

船舶雷达与导航系统是船舶安全航行的重要组成部分，而7/8防水插座在这些系统中起着至关重要的作用。其中防水MIN-change 7/8"航空法兰插座成型预铸电缆式、组装式、面板式法兰座、T-型三通可选 7/8防水插座的电气性能 7/8防水插座因其优良的电气性能而被广泛应…

阅读更多...

【matlab 路径规划】基于改进遗传粒子群算法的药店配送路径优化

【matlab 路径规划】基于改进遗传粒子群算法的药店配送路径优化

一背景介绍本文分享的是一个基于订单合并的订单分配和路径规划联合优化，主要背景是骑手根据客户需求，从药店取药之后进行配送，配送的过程中考虑路径的长度、客户的服务时间窗、车辆的固定成本等要素，经过建模和优化得到最优的配…

阅读更多...

收银系统源码-营销活动-幸运抽奖

1. 功能描述营运抽奖：智慧新零售收银系统，线上商城营销插件，商户/门店在小程序商城上设置抽奖活动，中奖人员可内定； 2.适用场景新店开业、门店周年庆、节假日等特定时间促销；会员拉新，需会…

阅读更多...

【漏洞复现】万户协同办公平台——反序列化

【漏洞复现】万户协同办公平台——反序列化

声明：本文档或演示材料仅供教育和教学目的使用，任何个人或组织使用本文档中的信息进行非法活动，均与本文档的作者或发布者无关。文章目录漏洞描述漏洞复现测试工具漏洞描述万户协同办公平台ezEIP是一个综合信息基础应用平台，…

阅读更多...

14-11 2024 年的 13 个 AI 趋势

14-11 2024 年的 13 个 AI 趋势

2024 年的 13 个 AI 趋势人工智能对环境的影响和平人工智能人工智能支持的问题解决和决策针对人工智能公司的诉讼2024 年美国总统大选与人工智能威胁人工智能、网络犯罪和社会工程威胁人工智能治疗孤独与对人工智能的情感依赖人工智能影响者中国争夺人工智能霸主地位人工智能…

阅读更多...

上海时尚新品发布会，可以邀请哪些媒体

上海时尚新品发布会，可以邀请哪些媒体

传媒如春雨，润物细无声，大家好，我是51媒体网胡老师。在上海举办时尚新品发布会时，可以邀请的媒体类型多样，以下是一些建议的媒体类型及其特点： 一、平面媒体报纸： 《文汇报》：上…

阅读更多...

【带你全面了解 RAG，深入探讨其核心范式、关键技术及未来趋势】

【带你全面了解 RAG，深入探讨其核心范式、关键技术及未来趋势】

文末有福利！ 大型语言模型（LLMs）已经成为我们生活和工作的一部分，它们以惊人的多功能性和智能化改变了我们与信息的互动方式。然而，尽管它们的能力令人印象深刻，但它们并非无懈可击。这些模型可能会产生…

阅读更多...

python-图像旋转（赛氪OJ）

python-图像旋转（赛氪OJ）

[题目描述] 输入一个 n 行 m 列的黑白图像，将它顺时针旋转 9090 度后输出。输入： 第一行包含两个整数 n 和 m，表示图像包含像素点的行数和列数。1≤n≤100，1≤m≤100。接下来 n 行，每行 m 个整数，表示图像…

阅读更多...

【FreeRTOS】同步与互斥通信-有缺陷的互斥案例

【FreeRTOS】同步与互斥通信-有缺陷的互斥案例

目录同步与互斥通信同步与互斥的概念同步与互斥并不简单缺陷分析汇编指令优化过程 - 关闭中断时间轴分析思考时刻参考《FreeRTOS入门与工程实践(基于DshanMCU-103).pdf》同步与互斥通信同步与互斥的概念一句话理解同步与互斥：我等你用完厕所，我再…

阅读更多...

【Python学习笔记】菜鸟教程Scrapy案例 + B站amazon案例视频

【Python学习笔记】菜鸟教程Scrapy案例 + B站amazon案例视频

背景前摇（省流可以跳过这部分） 实习的时候厚脸皮请教了一位办公室负责做爬虫这块的老师，给我推荐了Scrapy框架。我之前学过一些爬虫基础，但是用的是比较常见的BeautifulSoup和Request，于是得到Scrapy这个关键词后&am…

阅读更多...

【2023ICPC网络赛I 】E. Magical Pair

【2023ICPC网络赛I 】E. Magical Pair

当时在做洛谷U389682 最大公约数合并的时候我就想到把每个质因子分解出来然后跑高维前缀和，但是那一道题不是用这个方法，所有我也一直在思考这种做法是不是真的有用。因为昨天通过2024上海大学生程序设计竞赛I-六元组计数这道题我了解到了不少关于原根的…

阅读更多...

印章谁在管、谁用了、用在哪？契约锁让您打开手机一看便知

印章谁在管、谁用了、用在哪？契约锁让您打开手机一看便知

“印章都交给谁在管”、“哪些人能用”、“都有哪些业务在用”…这些既是管理者最关心的印章问题也是影响印章安全的关键要素。但是公司旗下分子公司那么多，各类公章、法人章、财务章、合同章一大堆，想“问”明白很难。契约锁电子签及印控平台推出“印章…

阅读更多...

推荐文章

最新文章