深度学习(前馈神经网络)知识点总结

news2026/2/11 15:16:54

用于个人知识点回顾，非详细教程

1.梯度下降

前向传播

特征输入—>线性函数—>激活函数—>输出

在这里插入图片描述

反向传播

根据损失函数反向传播，计算梯度更新参数

在这里插入图片描述

在这里插入图片描述

2.激活函数(activate function)

什么是激活函数？

在神经网络前向传播中，每一层的输出还需要经过激活函数再作为下一层的输入，即 $a^{[1]}=\sigma(z^{[1]})$

为什么需要激活函数？

如果没有非线性激活函数，模型的最终输出实际上只是输入特征x的线性组合
在这里插入图片描述

激活函数的分类

（1）sigmoid函数：除了输出层是一个二分类问题基本不会用
$a=\sigma(z)=\frac{1}{1+e^{-z}}$
（2）tanh函数：数据平均值更接近0，几乎所有场合都适用
$a=tanh(z)=\frac{e^{z}-e^{-z}}{e^{z}+e^{-z}}$

sigmoid函数和tanh函数两者共同的缺点是，在z特别大或者特别小的情况下，导数梯度或者函数斜率会变得特别小，最后就会接近于0，导致降低梯度下降的速度。

（3）Relu函数：修正线性单元，最常用的默认函数
$a = ma x (0, z)$
（4）Leaky Relu函数：进入负半区
$a = ma x (0.01 z, z)$

sigmoid函数和tanh函数在正负饱和区的梯度都会等于0，而Relu和Leaky Relu可以避免梯度弥散现象，学习速度更快

在这里插入图片描述

3. 正则化

偏差和方差

高方差过拟合，高偏差欠拟合

在这里插入图片描述

L1/L2正则化

在损失函数加上正则化，L1正则化更稀疏

在这里插入图片描述

dropout正则化

根据概率随机删除节点

在这里插入图片描述

其它正则化方法

在这里插入图片描述

4.优化算法

mini-batch梯度下降法

数据集分成多个子集来更新梯度

在这里插入图片描述

动量梯度下降(momentum)

参数更新时的梯度微分值计算方式采用指数加权平均

在这里插入图片描述

RMSprop(root mean square prop)

在这里插入图片描述

Adam

momentum+RMSprop

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/954775.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【Linux系列】离线安装openjdk17的rpm包

【Linux系列】离线安装openjdk17的rpm包

首发博客地址首发博客地址[1] 系列文章地址[2] 视频地址[3] 准备 RPM 包请从官网下载：https://www.oracle.com/java/technologies/downloads/#java17[4] 如需不限速下载，请关注【程序员朱永胜】并回复 1020 获取。安装 yum localinstall jdk-17_linux…

阅读更多...

renren-fast-vue环境升级后，运行正常打包后，访问页面空白

renren-fast-vue环境升级后，运行正常打包后，访问页面空白

网上各种环境，路径都找了一遍，也没成功。后来发现升级后打包的dist文件结构发生了变化， 1.最开始正常版本是这样 2.升级后是这样，少了日期文件夹 3.问题：打包后的index.html中引入的是config文件夹，而打…

阅读更多...

Matlab(画图进阶)

Matlab(画图进阶)

目录大纲 1.特殊的Plots 1.1 loglog(双对数刻度图) 1.3 plotyy(创建具有两个y轴的图形) 1.4yyaxis(创建具有两个y轴的图) 1.5 bar 3D条形图(bar3) 1.6 pie(饼图) 3D饼图 1.7 polar 2.Stairs And Ste阶梯图 3.Boxplot 箱型图和Error Bar误差条形图 3.1 boxplot 3.2 …

阅读更多...

国外地址如何地理编码？Python三行代码解决！

国外地址如何地理编码？Python三行代码解决！

对于单个地址基于Python中的geocoder库获取经纬度非常方便，代码如下： # codingutf-8 import geocoder # 输入地址 address Akala Temple lonLat geocoder.osm(address) print(lonLat.latlng) # 输出结果 [27.8569644, 84.0893767]若地址数量较多&am…

阅读更多...

Gradio项目所学

Gradio项目所学

从项目中学习Gradio：快速搭建AI算法可视化部署演示(侧重项目搭建与案例分享) 我们通常使用的两款AI可视化交互应用： Gradio 与 StreamList 本次我们通过项目案例对Gradio从简单使用到进阶进行讲解介绍 Gradio的优势 Gradio的优势在于其代码结构的简单性与…

阅读更多...

Java“牵手”京东商品详情数据，京东API接口申请指南

Java“牵手”京东商品详情数据，京东API接口申请指南

京东平台商品详情接口是开放平台提供的一种API接口，通过调用API接口，开发者可以获取京东商品的标题、价格、库存、月销量、总销量、库存、详情描述、图片等详细信息。获取商品详情接口API是一种用于获取电商平台上商品详情数据的接口，通过…

阅读更多...

面试总结 - 计算机网络

面试总结 - 计算机网络

计算机网络 1 OSI 七层模型 | TCP与UDP | 响应状态码 OSI 模型应用层: 计算机用户，以及各种应用程序和网络之间的接口，其功能是直接向用户提供服务，完成用户希望在网络上完成的各种工作。 HTTP SMTP FTP DNS 表示层: 负责数据格式的转换&…

阅读更多...

鸿蒙系列-如何更好地使用 ArkUI 的 Image 组件？

鸿蒙系列-如何更好地使用 ArkUI 的 Image 组件？

如何使用好 ArkUI 的 Image 组件？ 开发者经常需要在应用中显示一些图片，例如：按钮中的logo、网络图片、本地图片等。在应用中显示图片需要使用 Image 组件实现，Image支持多种图片格式，包括png、jpg、bmp、svg和gif&am…

阅读更多...

实现公网远程访问：Windows本地快速搭建SFTP文件服务器并配置端口映射

实现公网远程访问：Windows本地快速搭建SFTP文件服务器并配置端口映射

文章目录 1. 搭建SFTP服务器1.1 下载 freesshd服务器软件1.3 启动SFTP服务1.4 添加用户1.5 保存所有配置 2 安装SFTP客户端FileZilla测试2.1 配置一个本地SFTP站点2.2 内网连接测试成功 3 使用cpolar内网穿透3.1 创建SFTP隧道3.2 查看在线隧道列表 4. 使用SFTP客户端&#xff0…

阅读更多...

镜头翻转大师：视频剪辑高手的魔法技巧

镜头翻转大师：视频剪辑高手的魔法技巧

在数字媒体时代，视频制作已成为各种规模的组织和个人的必备技能。无论是小型家庭活动还是大型企业项目，都需要通过视频来展示成果、传播信息，或是仅仅为了分享生活的美好瞬间。然而，视频制作并非易事，其中最困难的步骤…

阅读更多...

气传导蓝牙耳机排行榜，值得大家选择的气传导耳机推荐！

气传导蓝牙耳机排行榜，值得大家选择的气传导耳机推荐！

随着科技的不断进步，气传导耳机已经成为了市场上备受瞩目的产品之一。相比传统耳机，气传导耳机的音质表现更加出色，同时还具有更好的佩戴感受。下面跟着我脚步来，推荐几款值得大家选择的气传导耳机，看看哪款更好&…

阅读更多...

【错误记录】exe4j 打包程序无法设置 jar 包依赖的问题 ( 将源码和依赖库打包到同一个 jar 包中 )

【错误记录】exe4j 打包程序无法设置 jar 包依赖的问题 ( 将源码和依赖库打包到同一个 jar 包中 )

文章目录一、问题描述二、解决方案一、问题描述在【错误记录】IntelliJ IDEA 导出可执行 jar 包执行报错 ( java.lang.ClassNotFoundException | 打包时没有选择依赖库 ) 博客中遇到 java.lang.ClassNotFoundException: com.microsoft.sqlserver.jdbc.SQLServerDriverat j…

阅读更多...

[LeetCode周赛复盘] 第 360 场周赛20230827

[LeetCode周赛复盘] 第 360 场周赛20230827

[LeetCode周赛复盘] 第 360 场周赛20230827 一、本周周赛总结2833. 距离原点最远的点1. 题目描述2. 思路分析3. 代码实现 2834. 找出美丽数组的最小和2. 思路分析3. 代码实现 2835. 使子序列的和等于目标的最少操作次数1. 题目描述2. 思路分析3. 代码实现 2836. 在传球游戏中最…

阅读更多...

Leetcode328 奇偶链表

Leetcode328 奇偶链表

思路：分别处理奇偶，保存奇偶的第一个和最后一个节点，注意最后链接的时候需要把偶数的next去掉再拼接不然就成环了 class Solution:def oddEvenList(self, head: ListNode) -> ListNode:if not head or not head.next or not head.next.ne…

阅读更多...

数据结构与算法-递归回溯分治

数据结构与算法-递归回溯分治

引入思考： 1.微信分销系统中有一个返利，大家应该都知道，比如B是A的下线，C是B的下线，那么在分钱返利的时候A可以分B，C的钱，这时候我们是不是就要分别找B,C的最后上级。这个问题我们一般怎么来解决…

阅读更多...

数据通信——传输层TCP（可靠传输机制的滑动窗口）

数据通信——传输层TCP（可靠传输机制的滑动窗口）

引言之前提到过拥塞问题，如果大量数据疯狂涌入，接收端无法及时处理就会导致数据丢包，从而使得通信受到干扰。之前的连续ARQ如果不加以节制，疯狂发送报文，接收端无法及时返回ACK就会导致网络瘫痪。滑动窗口机制协议这…

阅读更多...

Linux服务器部署JavaWeb后端项目

Linux服务器部署JavaWeb后端项目

适用于：MVVM前后台分离开发、部署、域名配置前端：Vue 后端：Spring Boot 这篇文章只讲后端部署，前端部署戳这里目录 Step1：服务器上搭建后端所需环境1、更新服务器软件包2、安装JDK83、安装MySQL4、登录MySQL5、修…

阅读更多...

一百六十六、MySQL——systemctl stop mysqld无法停止MySQL8.0服务

一百六十六、MySQL——systemctl stop mysqld无法停止MySQL8.0服务

一、目的为了解决MySQL的中文乱码问题，需要对/etc/my.cnf文件进行参数配置。而对/etc/my.cnf文件进行配置参数之前，需要先停止MySQL服务二、错误命令语句示范 （一）错误的命令语句 # systemctl stop mysqld （…

阅读更多...

SQL分组后取topN

SQL分组后取topN

准备数据 create table SC( SId varchar(10) comment "学生ID", CId varchar(10) comment "课程ID", score decimal(18,1) comment "课程成绩");insert into SC values(01 , 01 , 80); insert into SC values(01 , 02 , 90); insert into SC va…

阅读更多...

用最少数量的箭引爆气球【贪心算法】

用最少数量的箭引爆气球【贪心算法】

用最少数量的箭引爆气球有一些球形气球贴在一堵用 XY 平面表示的墙面上。墙面上的气球记录在整数数组 points ，其中points[i] [xstart, xend] 表示水平直径在 xstart 和 xend之间的气球。你不知道气球的确切 y 坐标。一支弓箭可以沿着 x 轴从不同点完全垂直地…

阅读更多...

推荐文章

最新文章