神经网络小结:训练的全过程

news2025/1/16 4:49:11

这一节我们主要是将之前的知识穿起来,形成一个整体。如果之前的没看过可以回翻一下专栏。但是在整体回归之前,我们还需要学习一个小知识点——随机初始化

随机初始化

在神经网络中,我们大致的训练流程就是:通过前向传播得出当前 θ \theta θ下的假设结果,使用代价函数对比得到的假设结果和实际结果y,然后使用反向传播和梯度下降修正 θ \theta θ,使得 J ( θ ) J(\theta) J(θ)最小。但是在第一次进行前向传播的时候,就需要对 θ \theta θ赋予一定的初值,而简单地将所有的 θ \theta θ设置为0是不可行的。如果是这样的话,会导致所有的隐藏层都计算出同样的的结果,因此在开始之前,我们需要对一开始的 θ \theta θ进行随机初始化

很多编程语言都提供了取随机数的内置函数,我们可以规定 θ ∈ [ − ϵ , ϵ ] \theta \in [-\epsilon ,\epsilon ] θ[ϵ,ϵ],比如可以这样进行随机初始化: θ = r a n d ( 0 , 1 ) ∗ ( 2 ∗ ϵ ) − ϵ \theta=rand(0,1)*(2*\epsilon)-\epsilon θ=rand(0,1)(2ϵ)ϵ,其中rand(0,1)表示在0到1中随机取一个实数

神经网络流程整合

神经网络的流程如下:

1.选择一种架构
首先我们呢根据需要选择一种模型,决定有多少个隐藏层,每个隐藏层有多少个单元。输入层单元和样例特征有关,而输出层则和你需要分类的类别数量有关。有关于如何选择隐藏层的数目后面会介绍

2.随机初始化网络的参数

3.执行前向传播算法
通过前向传播算法,对于任意一个实例 x ( i ) x^{(i)} x(i),得出其假设函数 h θ ( x ( i ) ) h_\theta(x^{(i)}) hθ(x(i)),这部分在https://blog.csdn.net/weixin_45434953/article/details/131048661的2.2

3.使用计算出的结果计算代价函数
使用各个实例的y和计算出来的 h θ ( x ( i ) ) h_\theta(x^{(i)}) hθ(x(i))根据公式计算出代价函数 J ( Θ ) J(\Theta) J(Θ),这部分和下面的4.都在https://blog.csdn.net/weixin_45434953/article/details/131210254

4.使用反向传播计算出 ∂ ∂ Θ i j ( l ) J ( Θ ) \frac{\partial}{\partial\Theta_{ij}^{(l)}}J(\Theta) Θij(l)J(Θ)

5.使用梯度检测检查梯度下降是否正常
当反向传播和数值估计所得到的导数值近似的时候,才能保证梯度下降正常工作,这一部分在https://blog.csdn.net/weixin_45434953/article/details/131171613,检查结束后记得关闭梯度检测

6.使用最优化算法得出最优的 θ \theta θ
使用最优化算法,比如梯队下降,并且结合梯度下降来最小化假设函数 J ( θ ) J(\theta) J(θ),得到最小化假设函数后的 θ \theta θ则是局部最优的参数取值,之所以是局部最优是因为假设函数图像也许拥有多个局部最优值

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/666842.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

指针和数组--指针和二维数组的关系

指针和二维数组的关系 目录 一、二维数组的行地址和列地址 二、通过二维数组的行指针和列指针来引用二维数组元素 一、二维数组的行地址和列地址 在C语言中,可将一个二维数组看成是由若干个一维数组构成的。例如若有下面的定义: int a[3][4]&#xf…

8、DuiLib创建子窗口

文章目录 1、创建子窗口2、创建子窗口 XML 配置文件 1、创建子窗口 一个大规模的应用不可能只有一个窗口,之前我们的案例都是在一个窗口实现的,接下来我们实现一个关于窗口,来介绍如何通过 DuiLib 实现子窗口管理。 2、创建子窗口 XML 配置…

小红书种草软文怎么写?教你几招

小红书种草软文写得好,能打消用户的疑虑,吸引更多的用户关注和购买你的产品,从而获得源源不断的流量和口碑,小红书种草软文怎么写?接下来伯乐网络传媒就来给大家讲解一下,教你几招超实用的方法!…

MMSegmentation V0.27.0官方问题(包含多尺度设置)(四)

1、在单个 GPU 上再现性能 #179(添加链接描述) 2、如何使用 PyTorch 的 WeightedRandomSampler 或编写自定义采样器添加链接描述 4、使用独立的分段器 #2931添加链接描述 5、How to change the training policy from Iter to Epoch based on the existin…

【产品运营】如何通过数据分析掌握用户行为?

对于运营来说,需要掌握用户行为来制定不同的运营策略。而用户行为是通过数据分析得出的,那么,具体的数据分析是哪些数据,不同的数据又有什么区别? 通过本文能够学到什么? 快速了解一款APP。行业趋势&#…

完美解决 ---latex运行正常,但是公式显示有问题,latex公式不显示等号 = 和加号 +

文章目录 一、问题展示二、分析原因三、 我的解决办法四、 \usepackage{txfonts}宏包是什么?五、\usepackage{amsmath}宏包是什么?总结 一、问题展示 latex运行正常,但是公式显示有问题,latex公式不显示等号 和加号 二、分析原…

C++基础(9)——文件操作

前言 本文主要介绍了C中文件操作基本知识 5.1:C语言使用标准C库函数读写文件复习 fgets、fputs(读写文本文件) int main(int argc, char *argv[]) {FILE *file;file fopen("a.txt", "a");if (file NULL){perror(&q…

flutter项目启动安卓模拟器不好使的问题

这里写自定义目录标题 一. 新建的flutter项目安卓模拟器不能使用二当上面操作完成以后,新建的flutter项目可以使用安卓模拟器,但是老项目不好使的解决方法 在flutter项目中,ios模拟器好使,安卓模拟器不好使. 分为2种情况: 一. 新建的flutter项目安卓模拟器不能使用 但是在and…

专业的性能测试工具都具备哪些特点?

在软件开发和系统运行过程中,性能是一个关键的指标,直接影响到用户体验和系统的可靠性。为了确保软件和系统的性能达到预期水平,专业的性能测试工具成为必不可少的一环。那专业的性能测试工具都具备哪些特点?探讨其在软件开发和系…

分享几个免费设计生成及参考工具(第三期)

今天来给大家分享几个国外免费的设计生成工具 Uxcrush https://www.uxcrush.com/ 一个收集优秀 Figma 资源的网站,包括网站模板、移动模板、UI套件、图标、设备模型、插画等等。希望为 Figma 用户提供一个方便找到最适合他们设计项目或学习目标的资源站。 unpromp…

用Python写了一个下载网站所有内容的软件,可见即可下

目录标题 前言效果展示环境介绍:代码实战获取数据获取视频采集弹幕采集评论 GUI部分尾语 前言 嗨喽~大家好呀,这里是魔王呐 ❤ ~! 今天我们分享一个用Python写下载视频弹幕评论的代码。 顺便把这些写成GUI,把这些功能放到一起让朋友用起来更方便~ 效果…

FAQ页面在SaaS产品中的应用

随着云计算和软件即服务(SaaS)的快速发展,越来越多的企业选择将业务迁移到云端,以更好地管理和运营他们的业务。在这种背景下,SaaS产品的出现成为了企业管理和运营的新趋势。SaaS产品通过云端的方式,为企业…

【linux】不小心对整个/usr/目录执行了chmod 777命令,如何恢复故障的权限设定

一、问题背景 在安装ansys的时候,脑子抽风,以为/usr/目录是共享目录,直接把所有文件或目录的权限完全设置为全用户自由读写和执行即可。 但是没想到执行了命令sudo chmod -R 777 /usr/命令之后,出现了一大堆sudo权限错误。 较为…

基于AT89S52单片机的多功能电子万年历

1、 项目介绍(设计内容) 基于AT89S52单片机的多功能电子万年历的硬件结构和软硬件设计方法。本设计由数据显示模块、温度采集模块、时间处理模块和调整设置模块四个模块组成。系统以AT89S52单片机为控制器,以串行时钟日历芯片DS1302记录日历…

小程序中各类二维码、小程序码,在各种场景下,长按识别支持情况验证结果

近期由于业务涉及到小程序长按识别加群、关注公众号等业务,各类场景下的支持情况,官方文档也没有特别具体的说明,所以整体做了一些测试。测试结果如下,如果有一些不准确或者未验证的情况,欢迎大家指正、补充哈~ 小程序…

Unity核心8——模型导入

一、模型导入概述 ​ Unity 支持很多模型格式。比如 .fbx /.dae /.3ds /.dxf /.obj 等等。 ​ 99%的模型都不是在 Unity 中制作的,都是美术人员在建模软件中制作,如 3DMax、Maya 等等。 ​ 当他们制作完模型后,虽然 Unity 支持很多模型格式…

公司内部资料!游戏上线前部署准备,就这新手都行

前言 游戏做的差不多了,是时候准备上线测试部署了,选一个靠谱的云服务器厂商还是很重要,这次准备尝试用下华为云的服务,为了在上线前做足准备,先做一次预演,省得到时候手忙脚乱。也给其他的同事做一个文档…

PRL:中国科大观测到单体量子系统中最强的量子互文性

近期,中国科学技术大学郭光灿院士团队在量子物理基本问题研究中取得重要进展。 ——该团队李传锋、许金时等与南开大学陈景灵教授、西班牙塞维利亚大学Adn Cabello教授等合作,实验研究了单体高维量子系统中对应于多体非定域性的量子关联,从而…

数据库管理-第八十三期 炒点冷饭(20230620)

数据库管理 2023-06-20 第八十三期 抄点冷饭1 ORA-040312 Shared Pool3 Library Cache4 Doc ID 2590172.15 Bug 34832725总结 第八十三期 抄点冷饭 上周,借着剩余的两天年假,又从300多个小时中拿了3天出来,加上前后两个周末,去泰…

结合符号性记忆,清华等提出ChatDB,提升大模型的复杂推理能力

结合符号性记忆,清华等提出ChatDB,提升大模型的复杂推理能力 随着大语言模型(Large Language Models)的爆火,例如 ChatGPT,GPT-4,PaLM,LLaMA 等,如何让大语言模型更好的…