吴恩达深度学习笔记（5）

吴恩达深度学习笔记（5）

news2025/3/10 21:32:06

调试处理（随机采样、非格网、由粗到细）及超参数

深度学习中涉及大量超参数，如下所示

在不知道哪个参数更为重要的情况下，机器学习参数较少，可以利用网络化的参数取值试验，但是深度学习参数较多的情况下，更适合用随机取值的方法

关注到某参数效果更好，可以采用由粗到细的方法。

正确定的采样尺度：

在超参数选择的时候，一些超参数是在一个范围内进行均匀随机取值，如隐藏层神经元结点的个数、隐藏层的层数等。但是有一些超参数的选择做均匀随机取值是不合适的，这里需要按照一定的比例在不同的小范围内进行均匀随机取值。

确定超参数的两种方法：

有大量数据，但是计算能力低，调试一个模型，每天不断优化
有计算能力，同时训练大量模型

正则化网络的激活函数：

批量归一化（batch norm）：使得超参数的搜索问题更加容易，神经网络对超参数的选择更加鲁棒，有更大的超参数范围可以工作，更容易训练很深的网络，

常用的方式是将隐藏层的经过激活函数前的z进行归一化。

将批量归一化添加进神经网络

批量归一化为什么有作用

可以加速神经网络训练的原因和输入层的输入特征进行归一化，从而改变Cost function的形状，使得每一次梯度下降都可以更快的接近函数的最小值点，从而加速模型训练过程的原理是有相同的道理
使得神经网络中较晚或者较深的权重，对早期层神经网络权重的变化更具鲁棒性
有轻微的正则化作用

模型在左侧数据集上效果很好，右侧不一定，，虽然都是猫，但是很大程度上样本的分布情况是不同的，所以我们无法保证模型可以仅仅通过黑色猫的样本就可以完美的找到完整的决策边界。第二个样本集合相当于第一个样本的分布的改变，称为：Covariate shift（协变量偏移）。

以深度神经网络为例，虽然第三层的输入可能随着前两层参数的变化而变换，归一化减少了输入值变化的问题。减弱了早期层参数必须做的和后续参数必须做的之间的耦合，允许网络中的每一层独立学习。

正则化效果的原因：

测试时的批量归一化：

在测试的时候，我们需要对每一个测试样本进行预测，无法计算均值和方差。通常的方法就是在我们训练的过程中，对于训练集使用指数加权平均，当训练结束的时候，得到指数加权平均后的均值，这些值直接用于Batch Norm公式的计算，用以对测试样本进行预测。

softmax回归

可以判断出一个或者多个类别，而不是两个类别。

如下图，输出层表示是个类别，输出层的激活函数是一个新的激活函数。

在没有隐藏隐藏层的时候，直接对Softmax层输入样本的特点，则在不同数量的类别下，Sotfmax层的作用：

训练一个softmax分类器：

softmax激活函数g()：

逻辑回归实际是softmax分类中c=2的简化形式。

训练具有softmax输出层的神经网络：

网络的损失函数：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2216533.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

通过华为鲲鹏认证的软件产品如何助力信创产业

通过华为鲲鹏认证的软件产品如何助力信创产业

软件通过华为鲲鹏认证与信创产业有着密切的联系。鲲鹏认证是华为推动信创产业发展的一项重要举措，通过该认证，软件可以在华为的生态系统中实现更好的兼容性和性能优化，从而推动信创产业的全面发展和国产化替代。鲲鹏认证的定义和重要性鲲鹏…

阅读更多...

POMO：强化学习的多个最优策略优化(2020)（完）

POMO：强化学习的多个最优策略优化(2020)（完）

文章目录 Abstract1 Introduction2 Related work3 Motivation4 多最优策略优化（POMO）4.1 从多个起始节点进行探索4.2 策略梯度的共享基线4.3 用于推理的多个贪婪轨迹5 Experiments5.1 Traveling salesman problem5.2 带容量限制得车辆路径问题5.3 0-1背包问题6 ConclusionAbs…

阅读更多...

【黑马redis基础篇】介绍和数据类型

【黑马redis基础篇】介绍和数据类型

1.NoSQL //来源：02 NoSQL类型：键值、文档、图 NoSQL特点：非结构化的、无关联的、非SQL、BASE(无法满足事务ACID) 2.认识Redis //来源03 基于内存的键值型NoSQL数据库。全称远程词典服务器。 2.1特征 （1）键值型&a…

阅读更多...

免费分享1885页Python电子书，耗时200小时整理！！！

免费分享1885页Python电子书，耗时200小时整理！！！

python学习方向建议： 如果你是本科及以下学历，建议你学习以下两个方向 1、爬虫。简单的爬虫库，代理爬虫，分布式爬虫等 2、Web。学习主流Web框架，轻量级的Flask。重量级的Django等 3、自动化测试如果你是本科以上学…

阅读更多...

Ascend C算子编程和C++基础 Lesson5-2 算子性能优化方法2

Ascend C算子编程和C++基础 Lesson5-2 算子性能优化方法2

一、层次化访问优化 1、Buffer访问优化 2、Shape对齐亲和计算，shape尽量采用32B对齐的shape 3、Buffer资源分配二、计算资源利用优化

阅读更多...

数据源对接，这个工具能满足你

数据源对接，这个工具能满足你

在数字化时代，数据已成为企业决策和业务优化的关键。而数据源对接则是获取高质量、全面数据的重要途径。数据源对接能够将各种来源的数据进行标准化处理，统一接入并进行整合分析，为企业提供更加准确、可靠的数据支持。其重要性不言而喻。一…

阅读更多...

Scopus数据库更新，新增3本期刊剔除！（附excel下载）

Scopus数据库更新，新增3本期刊剔除！（附excel下载）

Scopus官网近日更新了2024年10月期刊目录，此次更新有3本期刊被剔除（Discontinued Titles Sep. 2024），请注意避雷投稿！此外本次新增38本期刊被Scopus数据库收录（Accepted Titles Sep. 2024） 关于…

阅读更多...

有手就会，在线sd一键体验创作气球文字

有手就会，在线sd一键体验创作气球文字

使用在线sd制作气球文字，很好闻很有趣的制作体验，快来试试吧 1.打开网站电脑传送门👉上河AI（pc端） 手机传送门👉上河AI（移动端） 上河AI绘图最近还有限时优惠活动，从…

阅读更多...

No.16 笔记 | SSRF（服务器端请求伪造）基础

No.16 笔记 | SSRF（服务器端请求伪造）基础

一、SSRF基础知识 1.1 什么是SSRF？ 🔍 SSRF是"Server-Side Request Forgery"的缩写，中文意思是"服务器端请求伪造"。 🎭 简单来说：攻击者让服务器去访问它不应该访问的地方。 1.2 SSRF的基本模…

阅读更多...

程序负载优化，持续更新，建议收藏！

程序负载优化，持续更新，建议收藏！

1.前言对一个程序来说，内存和负载是两个重点指标。特别是对嵌入式程序来说，本身单片机的主频小，内存少，这就要求开发工作者必须考虑如何在有限的内存和负载下开展工作。本文主要侧重负载优化。首先介绍负载的概念，其…

阅读更多...

uniapp 微信公众号H5/app/小程序跳转小程序

uniapp 微信公众号H5/app/小程序跳转小程序

1.微信公众号H5跳转小程序使用微信标签wx-open-launch-weapp a.在init.vue使用标签（要实现跳转的页面）<wx-open-launch-weappid"launch-btn"style"width: 100%; display: block":appid"pageParam.appId":path"pa…

阅读更多...

机器学习中的回归分析：理论与实践

机器学习中的回归分析：理论与实践

引言回归分析是统计学和机器学习中广泛使用的技术，主要用于建立因变量与自变量之间的关系模型。在实际应用中，回归分析不仅可以帮助我们理解数据，还能进行有效的预测。本文将深入探讨回归分析的基本概念、常用的回归算法、应用场景&#xf…

阅读更多...

【算法题解】二分查找的经典问题解析

【算法题解】二分查找的经典问题解析

文章目录什么是二分？关于二分的一些题目1.分巧克力解题思路编写代码 2.数组中数值和下标相等的元素3.0到n-1中缺失的数字4.数列分段 II解题思路编写代码总结什么是二分？ 二分是一种思想，用于有序数组中快速查找目标元素。用动图展示一下…

阅读更多...

如何实现前端低代码?

如何实现前端低代码?

昨天收到在后台收到一封朋友的私信。内容如下： 你好，我关注你很久了，看你经常在发低代码的内容，内容也很好，所以想跟您请教一下。最近练手在写一个低代码项目，实现前后端可视化应用搭建后端采用c#&#x…

阅读更多...

过期大米被重新销往乡村学校？论EasyCVR平台如何构建校园食品卫生安全视频监管方案

过期大米被重新销往乡村学校？论EasyCVR平台如何构建校园食品卫生安全视频监管方案

近期，重庆市市场监管局发布的一则通报引起了社会广泛关注。通报指出，酉阳县某公司存在将过期大米重新包装并销往乡村学校的行为，这一事件再次将校园食品卫生安全问题推向了风口浪尖。面对这样的食品安全隐患，如何加强监管、确保…

阅读更多...

【linux问题】Linux命令行终端窗口的输出，显示不全问题

【linux问题】Linux命令行终端窗口的输出，显示不全问题

Linux命令行终端窗口的输出，显示不全问题问题： 图中显示的是一个Linux命令行终端窗口， nmcli dev wifi 是一个命令——列出所有能用的Wi-Fi。执行命令后，窗口输出了显示了所有能用的Wi-Fi网络列表。但是在每一行末尾有一个“…

阅读更多...

使用API有效率地管理Dynadot域名，删除域名服务器（Name Server）

使用API有效率地管理Dynadot域名，删除域名服务器（Name Server）

前言 Dynadot是通过ICANN认证的域名注册商，自2002年成立以来，服务于全球108个国家和地区的客户，为数以万计的客户提供简洁，优惠，安全的域名注册以及管理服务。 Dynadot平台操作教程索引（包括域名邮箱&…

阅读更多...

2-STM32入门

2-STM32入门

STM32入门意法半导体公司推出STM32芯片。只需动手。第一步安装开发环境。 STM32CubeIDE 点灯大师 1.新建工程 File -> New -> STM32 Project 选择自己的开发版型号，输入项目名称，创建一个STM32工程。点亮红色小灯的引脚为PB0(不了解的…

阅读更多...

头戴式耳机性价比高的品牌有哪些？五款头戴式耳机200元左右推荐

头戴式耳机性价比高的品牌有哪些？五款头戴式耳机200元左右推荐

耳机作为最被广大用户接受的数码产品，相信很多小伙伴都会拥有一个，甚至多个。但…在众多耳机样式中，如果论音质，同价位中头戴式应该是最好的，毕竟全包耳设计，能够让其有效隔绝外界噪音，实现更加…

阅读更多...

svg全链路流程轨迹

svg全链路流程轨迹

直接上效果 <template><div class"right-page"><div class"container"><div class"line-wrap"><svgversion"1.1"xmlns"http://www.w3.org/2000/svg"xmlns:xlink"http://www.w3.org/1999/…

阅读更多...

推荐文章

最新文章