✨机器学习笔记(六)—— ReLU、多分类问题、Softmax、Adam、反向传播

news2024/11/20 3:22:18
Course2-Week2:
https://github.com/kaieye/2022-Machine-Learning-Specialization/tree/main/Advanced%20Learning%20Algorithms/week2

机器学习笔记(六)

  • 1️⃣ReLU(Rectified Linear Unit)
  • 2️⃣多分类问题
  • 3️⃣Softmax
  • 4️⃣Adam
  • 5️⃣ 反向传播(Back propagation)

1️⃣ReLU(Rectified Linear Unit)

✨ReLU function: a = g ( z ) = m a x ( 0 , z ) a =g(z)= max(0, z) a=g(z)=max(0,z)

ReLU 激活函数与线性和 Sigmoid 激活函数对比,三个都是常用的激活函数:

在这里插入图片描述

🎈在此示例中的派生的 “awareness” 特征是具有连续的值范围,Sigmoid 最适合 0/1 的二分类情况。而 ReLU 函数提供连续的线性关系,并且有一个 "off" 范围,可以关闭 z < 0 z < 0 z<0 的范围,让其输出 0,"off" 功能使 ReLU 成为非线性的激活函数。

在这里插入图片描述

🎈在输出层中,如果是二分类问题选择 Sigmoid 函数作为激活函数是个不错的选择;而对于线性输出(既有负值也有正值)可以选择线性函数作为激活函数;如果对于回归问题但是输出只有正值(如房屋价格),则选择 ReLU 函数作为激活函数就相当合适了。
🤓在输出层中激活函数的选取可以去考虑预测的 y ^ \hat y y^ 是个什么样的值来进行选取。

在这里插入图片描述

🎈在隐藏层中,其实除了二分类问题使用 Sigmoid 激活函数,基本上都使用 ReLU 激活函数。ReLU 相较于 Sigmoid 计算速度更快,因为只需要计算 m a x ( 0 , z ) max(0, z) max(0,z),而 Sigmoid 需要取幂、取负,相除等等,计算效率自然就低了;对于梯度下降,Sigmoid 在多个地方逐渐变平坦,就导致了 J ( w , b ) J(w,b) J(w,b) 的函数也有多个平坦的地方,难以到全局最小值,并且偏导数很小会使梯度下降的速度缓慢,而 ReLU 梯度下降会更快更好

在这里插入图片描述


✨选取激活函数方式的概括

在这里插入图片描述


🧐为什么神经网络需要激活函数?

🎈如果在神经网络中不使用激活函数:
在这里插入图片描述
🤓就会出现了将前一个线性回归得出的输出,作为下一个线性回归的输入去计算,最终其实就是线性函数的线性组合,则还是一个线性函数,这样的话就没有必要去写这么个多层的神经网络了,本质就是一个一层的输入输出映射,根本就不需要神经网络。

2️⃣多分类问题

多分类问题:目标值 y y y 的值多于 2 个的情况。
在这里插入图片描述
使用 P ( y = i ∣ x ⃗ ) P(y=i \mid \vec x) P(y=ix ) 表示在输入 x ⃗ \vec x x 上分类为第 i i i 种情况的概率。

3️⃣Softmax

Softmax 是 Sigmoid 的一般形式,用于处理多分类问题,由于我们已经学过了逻辑回归函数 Sigmoid,将两者对比来学习 Softmax 函数。

在这里插入图片描述

🤓由此可以看出 Sigmoid 是对于分类问题只有两个值 P ( y = 0 ∣ x ⃗ ) P(y=0 \mid \vec x) P(y=0x ) P ( y = 1 ∣ x ⃗ ) P(y=1 \mid \vec x) P(y=1x ) 时的特殊 Softmax 函数,也可以说 Softmax 回归模型是逻辑回归的泛化。

🎈再对比一下两者的损失函数:

在这里插入图片描述


🎗️神经网络的 Softmax 输出

🧐在具有 Softmax 输出的 softmax 回归和神经网络中,都会生成 N 个输出,并选择 1 个输出作为预测类别。在这两种情况下,向量 z z z 都是由应用于 softmax 函数的线性函数生成的。softmax 函数转换为概率分布,应用 softmax 后,每个输出将介于 0 和 1 之间,并且输出将加到 1,以便可以将其解释为概率。

在这里插入图片描述

4️⃣Adam

Adam: Adaptive Moment estimation

🤓 Adam 算法是梯度下降的优化算法,相较于原始的梯度下降算法,Adam 算法可以自适应学习率,让梯度下降的过程更快并且更加精准。当学习率过小时,梯度下降的过程缓慢,Adam 会增大学习率去加快速度;当学习率过大时,梯度下降并不精准,Adam 会减小学习率去更好的执行梯度下降。

在这里插入图片描述

✨代码实现:

在这里插入图片描述

5️⃣ 反向传播(Back propagation)

🎈顺序计算各个中间参数的过程为前向传播,而反向通过前面求出的参数的值或偏导值再求出偏导则是后向传播。

在这里插入图片描述

🤓反向传播可以很好的提高计算效率,对于 N N N 个这样的节点和 P P P 个参数的情况,通过计算图的反向传播可以只花费 N + P N + P N+P 步求出。如果普通的计算通过求出 N N N 个节点值再求每个 P P P 则要花费 N × P N × P N×P 步。可见后向传播的计算效率显著提高。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2183031.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Linux】进程+权限管理+软硬链接+其他命令

目录 1. man手册 2. find按文件名称 3. find按文件类型 4. date显示时间 5. cal显示日历 6. du文件大小 7. ln链接 8. 软连接&#xff0c;硬链接区别 9. 文本查找 10. wc统计文本(计算文件的Bytes数、字数或列数) 11. 查看文本内容&#xff1a; 1…

深度学习---------------------------深度循环神经网络

目录 回顾&#xff1a;循环神经网络总结深度循环神经网络代码 回顾&#xff1a;循环神经网络 RNN就一个隐藏的层&#xff0c;无法做的很宽&#xff0c;所以一般的做法是做的更深。&#xff08;更深的时候是说每一层做一点点的非线性。&#xff09; 怎么样把循环网络变深&#…

新版IDEA中Git的使用(四)——解决冲突

说明&#xff1a;之前介绍过新版IDEA中Git的基础操作、分支操作和回滚代码&#xff0c;本文介绍基于新版IDEA&#xff0c;如何解决代码冲突。 避免冲突 解决冲突的最好方法就是不要发生冲突&#xff0c;这里我介绍下面几点&#xff0c;可以避免代码冲突&#xff1b; 时常做pu…

[Unity Demo]从零开始制作空洞骑士Hollow Knight第十三集:制作小骑士的接触地刺复活机制以及完善地图的可交互对象

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、制作小骑士的接触地刺复活机制 1.制作动画以及使用UNITY编辑器编辑2.实现有攻击的地刺行为3.使用代码实现小骑士接触复活功能二、完善地图的可交互对象 1.制…

ThreadLocal原理解析及面试

基本使用 讲原理之前&#xff0c;我简单写个demo小程序 public class TestThreadLocal {public static void main(String[] args) throws InterruptedException {ThreadLocal<String> tl new ThreadLocal();/**主线程设置了一个值*/tl.set("SSSSSs");//tl.…

黑马头条day10 热点文章定时文章

day8-9是项目实战没有新东西 暂时跳过 进度到这里 但是后边的东西一直跑不通 调度一直失败 我也不知道哪里出了问题 整tm一天了也没搞出来 心态炸了 主要是xxl调度算是新内容 但是一直跑不出来就很烦 所谓的热点也就是计算权值然后存储到redis就行了 未解决&#xff1a; we…

【源码部署】springboot部署服务器之宝塔安装数据库远程无法链接问题

最近新搞了一个阿里云服务器&#xff0c;使用docker安装东西感觉太麻烦&#xff0c;于是用了宝塔。按了宝塔之后麻烦接连不断啊&#xff0c;最让人头疼的就是这个mysql无法远程链接问题&#xff0c;因此整理一下防止忘记在踩坑&#xff1a; 1、首先就是在宝塔面板中放行端口&a…

深度学习--------------------长短期记忆网络(LSTM)

目录 长短期记忆网络候选记忆单元记忆单元隐状态 长短期记忆网络代码从零实现初始化模型参数初始化实际模型训练 简洁实现 长短期记忆网络 忘记门&#xff1a;将值朝0减少 输入门&#xff1a;决定要不要忽略掉输入数据 输出门&#xff1a;决定要不要使用隐状态。 候选记忆单元…

这4款专业的Windows录屏工具,帮你解决多样的录屏的问题。

像Xbox 录制&#xff0c;步骤记录器等工具都是Windows系统里面自带的录屏工具&#xff0c;如果时想要更多功能的录屏工具&#xff0c;可以下载一些专业录屏软件&#xff0c;我可以给大家推荐几款&#xff0c;实用稳定&#xff0c;专业高效的录屏软件。 1、福昕多效录屏 直达&a…

【Java基础】Java面试基础知识QA(上)

Java面试基础知识Q&A&#xff08;上&#xff09; 面向对象编程&#xff08; OOP&#xff09; Java 是一个支持并发、基于类和面向对象的计算机编程语言。面向对象软件开发的优点&#xff1a; 代码开发模块化&#xff0c;更易维护和修改。代码复用。增强代码的可靠性和灵活性…

springboot系列--web相关知识探索二

映射 指的是与请求处理方法关联的URL路径&#xff0c;通过在Spring MVC的控制器类&#xff08;使用RestController注解修饰的类&#xff09;上使用注解&#xff08;如 RequestMapping、GetMapping&#xff09;来指定请求映射路径&#xff0c;可以将不同的HTTP请求映射到相应的处…

【PRISMA卫星有关简介】

PRISMA卫星是一颗小型超光谱成像卫星&#xff0c;以下是对其的详细介绍&#xff1a; 一、基本信息 英文全称&#xff1a;Prototype Research Instruments and Space Mission technology Advancement Main&#xff0c;或简化为PRISMA。发射时间&#xff1a;PRISMA卫星于2019年…

今日指数项目项目集成RabbitMQ与CaffienCatch

今日指数项目项目集成RabbitMQ与CaffienCatch 一. 为什么要集成RabbitMQ 首先CaffeineCatch 是作为一个本地缓存工具 使用CaffeineCatch 能够大大较少I/O开销 股票项目 主要分为两大工程 --> job工程(负责数据采集) , backend(负责业务处理) 由于股票的实时性也就是说 ,…

【Redis】Redis中的 AOF(Append Only File)持久化机制

目录 1、AOF日志 2、AOF 的执行顺序与潜在风险 3、如何优化 AOF&#xff1f;&#xff08;写入策略&#xff09; 4、AOF重写机制&#xff08;防止日志文件无限增长&#xff09; 1、AOF日志 想象一下&#xff0c;Redis 每次执行写操作的时候&#xff0c;都把这些操作以追加的…

SpringBoot项目 | 瑞吉外卖 | 短信发送验证码功能改为免费的邮箱发送验证码功能 | 代码实现

0.前情提要 之前的po已经说了单独的邮箱验证码发送功能怎么实现&#xff1a; https://blog.csdn.net/qq_61551948/article/details/142641495 这篇说下如何把该功能整合到瑞吉项目里面&#xff0c;也就是把原先项目里的短信发送验证码的功能改掉&#xff0c;改为邮箱发送验证…

World of Warcraft [CLASSIC][80][Grandel] /console cameraDistanceMaxZoomFactor 2

学习起来&#xff01;&#xff01;&#xff01; 调整游戏界面镜头距离&#xff0c;默认值为&#xff1a;2 /console cameraDistanceMaxZoomFactor 2 大于4&#xff0c;效果不明显了&#xff0c;鼠标滚轮向后滚&#xff0c;拉起来镜头 World of Warcraft [CLASSIC][80][Grandel…

Another redis desktop manager使用说明

Another redis desktop manager使用说明 概述界面介绍图示说明连接界面设置界面查看操作日志主界面信息进入redis-cli控制台更多 概述 Another Redis Desktop Manager是一个开源的跨平台 Redis 客户端&#xff0c;提供了简洁易用的图形用户界面&#xff08;GUI&#xff09;&am…

第5篇:勒索病毒自救指南----应急响应篇

经常会有一些小伙伴问&#xff1a;中了勒索病毒&#xff0c;该怎么办&#xff0c;可以解密吗&#xff1f; 第一次遇到勒索病毒是在早几年的时候&#xff0c;客户因网站访问异常&#xff0c;进而远程协助进行排查。登录服务器&#xff0c;在站点目录下发现所有的脚本文件及附件…

【JaveEE】——多线程中使用顺序表,队列,哈希表

阿华代码&#xff0c;不是逆风&#xff0c;就是我疯 你们的点赞收藏是我前进最大的动力&#xff01;&#xff01; 希望本文内容能够帮助到你&#xff01;&#xff01; 目录 一&#xff1a;多线程环境使用ArrayList 引入&#xff1a; 1&#xff1a;顺序表使用同步机制 2&…

Linux服务器配置anaconda3,下载torch

如图&#xff0c;vscode连接远程服务器后&#xff0c;如下所示&#xff1a; 下载 Anaconda 下载及安装 进入下载官网&#xff0c;点击linux&#xff0c; 下载方式有两种&#xff0c; 直接下载安装包&#xff0c;下载完上传服务器&#xff0c;并安装&#xff0c;安装执行b…