Lesson 5 Classification(short version)

Lesson 5 Classification(short version)

news2026/2/14 18:13:53

听课（李宏毅老师的）笔记，方便梳理框架，以作复习之用。本节课主要讲了回归和分类的区别，分类的过程，分类的损失函数。这节课比较简短。

1. 回归和分类的区别

回归只是输出一个预测的值
分类是输出预测的class

那么class用什么表示呢？用1,2,3代表class 1, class 2, class 3吗？但是这样是不行的，如果用数字代表类别，难道说class 1 与class 2 是类似的吗？因为1和2数字很接近。

2. 使用向量表示类别

但是这里要注意a1,a2,a3是乘以不同的权重参数
a1w11,a1w12, a1*w13这样的
在这里插入图片描述

3. 输出的处理——softmax函数

经过上图的处理之后，得到的输出值可能是任意的，但是我们想要的向量，每一个元素都要0-1之内，所以我们需要对输出进行一些处理。
在这里插入图片描述
softmax函数的表达式具体如下图红框所示：

经过softmax之后，数据之间的差距会变大。具体数据差距可见上图所示。

4. 分类的损失函数

我们之前在linear model讲过损失函数的表达式，常用MSE计算，但是在分类任务里我们却倾向于采用另一种损失计算方式——cross-entropy（交叉熵），甚至在pytorch里。softmax与cross -entropy是捆绑在一起的。
在这里插入图片描述
那为什么选这个呢？它的优势到底在哪里？

5. cross-entropy在分类学习中的优势

下图是实验得出的数据。
如果采用MSE那么在gradient decent中很有可能被卡住，在左上角gradient几乎为0，使用Adam的话还是有可能走到右下角的，因为会自动调大学习率。

但是如果我们采用cross-entropy就不用太担心这个问题，这个损失函数更好，那么optimization时的难度也会相对地降低
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1502642.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【Leetcode每日一刷】数组|双指针篇：977. 有序数组的平方、76. 最小覆盖子串（附滑动窗口法详解）

【Leetcode每日一刷】数组|双指针篇：977. 有序数组的平方、76. 最小覆盖子串（附滑动窗口法详解）

力扣每日刷题一、977. 有序数组的平方1.1题目1.2、解题思路1.3、代码实现——C 二、76. 最小覆盖子串2.1：题目2.2、解题思路2.3：代码实现——c2.4：易错点一、977. 有序数组的平方 1.1题目 [题目链接]( 1.2、解题思路题型：双…

阅读更多...

请编程输出无向无权图各个顶点的度 ← STL vector 模拟邻接表存图

请编程输出无向无权图各个顶点的度 ← STL vector 模拟邻接表存图

【题目描述】请利用 STL vector 模拟邻接表存图，编程输出无向无权图各个顶点的度。【输入样例】 5 6 1 3 2 1 1 4 2 3 3 4 5 1【输出样例】 4 2 3 2 1【算法分析】本例利用 STL vector 模拟实现邻接表。代码参见：https://blog.csdn.net/hnjzsyjyj/arti…

阅读更多...

服务器配置禁止IP直接访问，只允许域名访问

服务器配置禁止IP直接访问，只允许域名访问

联网信息系统需设置只允许通过域名访问，禁止使用IP地址直接访问，建议同时采用云防护技术隐藏系统真实IP地址且只允许云防护节点IP访问服务器，提升网络安全防护能力。一、Nginx 修改配置文件nginx.conf，在server段里插入正则表达式…

阅读更多...

Redis系列之持久化机制RDB和AOF

Redis系列之持久化机制RDB和AOF

Redis系列之持久化机制RDB和AOF 文章目录 1. 为什么需要持久化？2. 持久化的方式3. RDB机制3.1 RDB机制介绍3.2 配置RDB3.3 什么时候触发3.4 操作实例3.5 RDB优势和不足 4. AOF机制4.1 什么是AOF机制？4.2 同步机制4.3 重写机制4.4 AOF的优势和不足混合模…

阅读更多...

C++的面向诗篇：类的叙事与对象的旋律

C++的面向诗篇：类的叙事与对象的旋律

个人主页：日刷百题系列专栏：〖C/C小游戏〗〖Linux〗〖数据结构〗〖C语言〗 🌎欢迎各位→点赞👍收藏⭐️留言📝 一、面向对象的定义学习C语言时，我们就经常听说C语言是面向过程的，…

阅读更多...

3.7号freeRtoS

3.7号freeRtoS

1. 串口通信配置串口为异步通信设置波特率，数据位，校验位，停止位，数据的方向同步通信在同步通信中，数据的传输是在发送端和接收端之间通过一个共享的时钟信号进行同步的。这意味着发送端和接收端的时钟需要保持…

阅读更多...

LiveNVR监控流媒体Onvif/RTSP功能-视频广场点击在线或离线时展示状态记录快速查看通道离线原因

LiveNVR监控流媒体Onvif/RTSP功能-视频广场点击在线或离线时展示状态记录快速查看通道离线原因

LiveNVR视频广场点击在线或离线时展示状态记录快速查看通道离线原因 1、状态记录1.1、点击在线查看1.2、点击离线查看 2、RTSP/HLS/FLV/RTMP拉流Onvif流媒体服务 1、状态记录 1.1、点击在线查看可以点击视频广场页面中， 在线两个字查看状态记录 1.2、点击离线查…

阅读更多...

学习笔记—功能测试的基础认知

学习笔记—功能测试的基础认知

除了测试工作之外，其他流程并行优点： 软件测试出测试执行外，还有很多工作软件测试完全独立，其他流程并发进行具有很强的灵活性缺点： 管理型要求高技能要求高测试就绪点分析困难测试用例的定义测试用例…

阅读更多...

Java List集合取交集的八种不同实现方式

Java List集合取交集的八种不同实现方式

码到三十五 ： 个人主页心中有诗画，指尖舞代码，目光览世界，步履越千山，人间尽值得 ! 在Java中，取两个List集合的交集可以通过多种方式实现，包括使用Java 8的Stream API、传统的for循环遍历、使…

阅读更多...

DeepLearning in Pytorch|我的第一个NN-共享单车预测

DeepLearning in Pytorch|我的第一个NN-共享单车预测

目录概要一、数据准备导入数据数据可视化二、设计神经网络版本一版本二（正片） 三、测试小结概要我的第一个深度学习神经网络模型---利用Pytorch设计人工神经网络对某地区租赁单车的使用情况进行预测输入节点为1个，隐含…

阅读更多...

安装及管理docker

安装及管理docker

文章目录 1.Docker介绍2.Docker安装3.免sudo设置4. 使用docker命令5.Images6.运行docker容器7. 管理docker容器8.创建image9.Push Image 1.Docker介绍 Docker 是一个简化在容器中管理应用程序进程的应用程序。容器让你在资源隔离的进程中运行你的应用程序。类似于虚拟机&#…

阅读更多...

PyTorch基础（20）-- torch.gt() / torch.ge() / torch.le() / torch.lt()方法

PyTorch基础（20）-- torch.gt() / torch.ge() / torch.le() / torch.lt()方法

一、前言嗯……最近遇到的奇奇怪怪的方法很多了，学无止境啊！学不完啊，根本学不完！本篇文章介绍四个方法：torch.gt()、torch.ge()、torch.le()和torch.lt()方法，由于这四个方法很相似，所以放到…

阅读更多...

灯塔：CSS笔记（2）

灯塔：CSS笔记（2）

一选择器进阶后代选择器：空格作用：根据HTML标签的嵌套关系，，选择父元素后代中满足条件的元素选择器语法：选择器1 选择器2{ css } 结果： *在选择器1所找到标签的后代（儿子孙子重孙子…

阅读更多...

Docker常见命令使用

Docker常见命令使用

Docker命令是使用Docker的基础。这里记录下Docker日常运维过程中经常使用到的一些命令，更全面的命令还请参考Docker官网。 docker用法概述 Docker命令可以通过CLI工具实现与服务器的交互。Docker命令的语法如下： docker [DOCKER-COMMAND] [OPTIONS] […

阅读更多...

【高效开发工具系列】Windows 系统下将 Windows 键盘的 ctrl 和 alt 互换

【高效开发工具系列】Windows 系统下将 Windows 键盘的 ctrl 和 alt 互换

💝💝💝欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan 的首页,持续学…

阅读更多...

vscode 配置opengl (glut), lib链接可参考

vscode 配置opengl (glut), lib链接可参考

这里假定你已经配置好基础的vscode c环境 json介绍这里其实主要配置的3种json, vscode其实就是通过launch.json和tasks.json来自动生成指令的 launch.json 这个用于启动程序用的，但是由于其可以指定preLaunchTask-即在启动之前需要做什么事情，所以这…

阅读更多...

【面试精讲】Java动态代理是如何实现的？JDK Proxy 和 CGLib 有什么区别？

【面试精讲】Java动态代理是如何实现的？JDK Proxy 和 CGLib 有什么区别？

Java动态代理是如何实现的？JDK Proxy 和 CGLib 有什么区别？ 目录一、Java动态代理的实现 1、使用JDK Proxy实现动态代理 2、使用CGLib实现动态代理二、JDK Proxy 与 CGLib 的区别三、Spring中的动态代理四、 Lombok代理原理总结前言本文…

阅读更多...

做跨境电商，选哪个浏览器好？跨境电商浏览器推荐

做跨境电商，选哪个浏览器好？跨境电商浏览器推荐

在我们的日常生活中，有很多浏览器可供选择，比如百度浏览器、谷歌浏览器和360、火狐等等。但是在跨境电商行业中，是否有特别适合我们卖家使用的浏览器呢？所谓跨境电商浏览器，就是为跨境电商用户设计的浏览器&#xff0c…

阅读更多...

【LeetCode 算法专题突破】---二分查找（⭐⭐⭐）

【LeetCode 算法专题突破】---二分查找（⭐⭐⭐）

前言我在算法题目的海洋中畅游已久，也曾在算法竞赛中荣获佳绩。然而，我发现自己对于算法的学习，还缺乏一个系统性的总结和归类。尽管我已经涉猎过不少算法类型，但心中仍旧觉得有所欠缺，未能形成完整的算法体系。因…

阅读更多...

官方阴阳怪气？双标？《Nature》专访《中科院预警名单》，中国作者为何炸裂？

官方阴阳怪气？双标？《Nature》专访《中科院预警名单》，中国作者为何炸裂？

毕业推荐 SCIE： • 计算机类，6.5-7.0，JCR1区，中科院2区 • 2个月19天录用，6天见刊，36天检索 SCI&EI（CCF-C类） • 算法类，2.0-3.0，JCR3区&#xff0c…

阅读更多...

推荐文章

最新文章