【博学谷学习记录】超强总结，用心分享丨人工智能深度学习神经网络基础知识点总结

【博学谷学习记录】超强总结，用心分享丨人工智能深度学习神经网络基础知识点总结

news2025/7/13 9:30:33

目录

- 神经网络
- 激活函数
- - 引入激活函数原因：
  - sigmoid激活函数
  - tanh 激活函数
  - ReLU 激活函数（最常用）
  - SoftMax
  - 如何选择
- 反向传播
- - 参数初始化方法
  - 优化方法
  - 正则化
  - 批量归一层
- 网络模型调优的思路

神经网络

简单的神经网络包括三层：输入层，隐藏层，输出层。
其中隐藏层可以有很多层，每一层也可以包含数量众多的的神经元。

激活函数

引入激活函数原因：

激活函数用于对每层的输出数据进行变换, 进而为整个网络结构结构注入了非线性因素。此时, 神经网络就可以拟合各种曲线。如果不使用激活函数，整个网络虽然看起来复杂，其本质还相当于一种线性模型。

sigmoid激活函数

劣势：
1.当输入 <-6 或者 >6 时，sigmoid 激活函数图像的导数接近为 0，此时网络参数将更新极其缓慢，或者无法更新。
2.一般来说， sigmoid 网络在 5 层之内就会产生梯度消失现象。
3.该激活函数并不是以 0 为中心的，所以在实践中这种激活函数使用的很少。
在这里插入图片描述

在这里插入图片描述

一般用于二分类输出层

tanh 激活函数

优：与 Sigmoid 相比，它是以 0 为中心的，使得其收敛速度要比 Sigmoid 快，减少迭代次数

劣：，当输入的值大概 <-3 或者 > 3 时，其导数近似 0。
在这里插入图片描述

在这里插入图片描述

一般用于隐藏层

ReLU 激活函数（最常用）

优：
计算量较sigmoid小
Relu会使一部分神经元的输出为0，这样就造成了网络的稀疏性，并且减少了参数的相互依存关系，缓解了过拟合问题的发生。

公式：f(x) = max(0, x)

函数图像
在这里插入图片描述
导数图像

SoftMax

用于多分类，以概率形式展现出来

如何选择

隐藏层：优先RELU 不使用sigmoid，可以尝试tanh
输出层：二分类sigmoid, 多分类softmax ，回归identity

反向传播

算法通过链式求导的方法来计算神经网络中的各个权重参数的梯度，从而使用梯度下降算法来更新网络参数。

参数初始化方法

全0
全1
固定值
正态分布
kaiming 初始化，也叫做 HE 初始化. HE 初始化分为正态分布的 HE 初始化、均匀分布的 HE 初始化.
xavier 初始化，也叫做Glorot初始化。两种：正态分布的 xavier 初始化、均匀分布的xavier 初始化

优化方法

Momentum
AdaGrad
RMSProp
Adam

正则化

Dropout 层的使用，减一部分梯度归0，达到无法更新参数的目的，用于控制网络复杂度，以此达到正则化的目的

批量归一层

在这里插入图片描述

数据在经过 BN 层之后，无论数据以前的分布是什么，都会被归一化成均值为 β，标准差为λ 的分布

torch.nn.BatchNorm2d(num_features, eps=1e-05, momentum=0.1, affine=True)

affine = False 表示 γ=1，β=0，反之，则表示 λ(γ) 和 β 要进行学习;
BatchNorm2d 适用于输入的数据为 4D，输入数据的形状 [N,C,H,W]
：N 表示批次，C 代表通道数，H 代表高度，W 代表宽度

网络模型调优的思路

对输入数据进行标准化
调整优化方法
调整学习率
增加批量归一化层
增加网络层数、神经元个数
增加训练轮数
数据再清洗，进行预处理
等等…

心得：通过对神经网络的学习，了解到了神经网络虽然功能强大，但深度学习较机器学习来说特征可解释性弱

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/380418.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

CentOS8基础篇10：网络环境配置

CentOS8基础篇10：网络环境配置

管理员为了能够更好的管理和维护网络，需要配置服务器的网络环境，再将服务器部署到网络环境中。为此他需要完成以下工作： 设置临时主机名为Server。设置网卡信息：IP地址为192.168.137.5，子网掩码是255.255.255.0&#…

阅读更多...

Docker 安装GitLab学习笔记

Docker 安装GitLab学习笔记

1.环境准备 1.1安装虚拟机采用Vitualbox7.0安装ubuntu-22.04.1-live-server-amd64 虚拟机网络连接方式：桥接网卡固定局域网ip：192.168.10.102 1.2.安装Docker 参考：https://www.runoob.com/docker/ubuntu-docker-install.html 采用手动…

阅读更多...

Android Button修改背景颜色及实现Button水波纹效果

Android Button修改背景颜色及实现Button水波纹效果

Android Button修改背景颜色及实现Button水波纹效果，效果如下： 以下基于API33（Android13.0），向下兼容至API24（Android7.0）。 1.修改Button背景我们可以发现在布局xml文件中直接修改backgroun…

阅读更多...

（Trie Tree）字典树

（Trie Tree）字典树

（Trie Tree）字典树场景：在n个字符串中查找某个字符串。暴力匹配，时间复杂度为O（nm），m为字符串平均长度，效率过低。字典查找单词"fly"，首先查找’f’,然后…

阅读更多...

LeetCode算法复杂度分析（时间复杂度空间复杂度）

LeetCode算法复杂度分析（时间复杂度空间复杂度）

文章目录前言时间复杂度1.概述2.大O记法3.常见类型空间复杂度1.概述2.常见类型典型算法的复杂度分析1.递归算法2.哈希表前言我们知道，研究算法的最终目的就是如何花更少的时间，如何占用更少的内存去完成相同的需求。时间复杂度 1.概述我们要计算算…

阅读更多...

分享一篇由C语言实现《数据结构》无头无循环单链表

分享一篇由C语言实现《数据结构》无头无循环单链表

三月，你好，各位csdn uu们好文章目录前言一、何为单链表二、单链表基本操作（增，删，查，改，销毁，遍历）1.查找与修改、销毁与遍历2.链表插入与删除操作三、单链表 VS 顺序表…

阅读更多...

python如何快速采集美~女视频？无反爬

python如何快速采集美~女视频？无反爬

人生苦短我用python~ 这次康康能给大家整点好看的不~ 环境使用: Python 3.8 Pycharm mou歌浏览器 mou歌驱动 —> 驱动版本要和浏览器版本最相近 <大版本一样, 小版本最相近> 模块使用: requests >>> pip install requests selenium >>> pip …

阅读更多...

暑期实习准备——Verilog手撕代码（持续更新中。。。

暑期实习准备——Verilog手撕代码（持续更新中。。。

暑期实习准备——手撕代码牛客刷题笔记Verilog快速入门VL4 移位运算与乘法VL5 位拆分与运算VL6 多功能数据处理器VL8 使用generate…for语句简化代码VL9 使用子模块实现三输入数的大小比较VL11 4位数值比较器电路VL12 4bit超前进位加法器电路VL13 优先编码器电路①Verilog进阶挑…

阅读更多...

Scala-模式匹配

Scala-模式匹配

基本语法模式守卫匹配类型匹配对象 Scala 中的模式匹配类似于 Java 中的 switch 语法基本语法模式匹配语法中，采用 match 关键字声明，每个分支采用 case 关键字进行声明，当需要匹配时，会从第一个 case 分支开始&#…

阅读更多...

C++学习笔记-内存空间

C++学习笔记-内存空间

考虑这样一种情况，当我们使用相同的名称，叫Zara的两个人在同一个班级。我们需要明确区分它们将不得不使用一些额外的信息，如他们的名字，如他们生活在不同的区域或母亲或父亲的名字等等。同样的情况也出现在C应用程序中。例如&am…

阅读更多...

Ubuntu 18.04.6 LTS 服务版安装参考

Ubuntu 18.04.6 LTS 服务版安装参考

文章目录安装环境安装过程等待安装进行设置语言选择更新设置键盘样式设置IP地址配置代理配置 Ubuntu 存档镜像自定义存储配置设置账号配置 SSH安装软件包等待安装完成重启后验证安装后的基础优化重置 root 密码放开 root 远程登陆网卡信息变更修改ubuntu-18.04.6-live-server-a…

阅读更多...

怎么用白光干涉仪的拼接测量功能

怎么用白光干涉仪的拼接测量功能

白光干涉仪的基本原理是通过不同的光学元件形成参考光路和探测光路，是利用干涉原理测量光程差，从而确定相关物理量的光学仪器。结合精密Z向扫描模块、3D 建模算法等，可以对器件表面进行非接触式扫描并建立表面3D图像，然后通过一体…

阅读更多...

普通指针扫盲

普通指针扫盲

一、什么是指针 C语言里，变量存放在内存中，而内存其实就是一组有序字节组成的数组，每个字节有唯一的内存地址。 CPU 通过内存寻址对存储在内存中的某个指定数据对象的地址进行定位。这里，数据对象是指存储在内存中的一个指定数据…

阅读更多...

【项目精选】病历管理系统设计与实现（源码+视频）

【项目精选】病历管理系统设计与实现（源码+视频）

点击下载源码企业财务管理系统主要用于电子病历来提高医院各项工作的效率和质量，促进医学科研、教学；减轻各类事务性工作的劳动强度，使他们腾出更多的精力和时间来服务于病人。本系统结构如下： 电子病例系统： 病人登…

阅读更多...

通过知识库深度了解用户的心理

通过知识库深度了解用户的心理

自助服务知识库的价值是毋庸置疑的，如果执行得当，可以帮助减少客户服务团队的工作量，仅仅编写内容和发布是不够的，需要知道知识库对客户来说是否有用，需要了解客户获得的反馈，如果你正确的使用知识库软件&a…

阅读更多...

哪款蓝牙耳机打电话好用？打电话音质好的蓝牙耳机

哪款蓝牙耳机打电话好用？打电话音质好的蓝牙耳机

现在几乎是人人离不开耳机的时代。在快节奏的生活和充满嘈杂声音的世界中，戴着耳机听歌，是每个人生活中最不可或缺的一段自由、放松的时光，下面小编就来分享几款通话音质好的蓝牙耳机。一、南卡小音舱蓝牙耳机动圈单元：13.3mm…

阅读更多...

伯恩光学再成被执行人：多次因劳动纠纷被起诉，曾冲刺港交所上市

伯恩光学再成被执行人：多次因劳动纠纷被起诉，曾冲刺港交所上市

近日，贝多财经从天眼查APP了解到，伯恩光学（深圳）有限公司（下称“伯恩光学”）因《伯恩光学（深圳）有限公司与温*燕劳动合同纠纷的案件》一事，被广东省深圳市龙岗区人民法院…

阅读更多...

服务端开发之Java备战秋招面试篇6-Java各种并发锁

服务端开发之Java备战秋招面试篇6-Java各种并发锁

努力了那么多年,回头一望,几乎全是漫长的挫折和煎熬。对于大多数人的一生来说,顺风顺水只是偶尔,挫折、不堪、焦虑和迷茫才是主旋律。我们登上并非我们所选择的舞台,演出并非我们所选择的剧本。继续加油吧！ 目录 1、Java中主流锁分类体系介绍 2、乐观锁CAS原理刨…

阅读更多...

wordpress 占用内容过高的解决方案

wordpress 占用内容过高的解决方案

WordPress占用内存过高可能由多种因素引起，以下是一些可能的原因和解决方法： 主题和插件： WordPress的主题和插件是最常见的内存占用原因。确保使用的主题和插件是最新版本，并且只使用必需的插件。禁用不需要的插件，并…

阅读更多...

【Linux】文件时间-ACM

【Linux】文件时间-ACM

文章目录文件时间-acmAccessChangeModify文件时间-acm 我们可以使用stat 文件名的方式查看对应的文件的时间信息 Access 表示文件最近一次被访问的时间文件的访问实际也就是文件的读取实际操作中,文件的Access时间可能没有变化,这是因为在新的Linux内核中,Access时间不…

阅读更多...

推荐文章

最新文章