Softmax和Cross Entropy Loss在分类问题中的作用

Softmax和Cross Entropy Loss在分类问题中的作用

news2026/2/12 22:38:10

在这里插入图片描述

本文以三分类神经网络为例，讲解Softmax和Cross Entropy Loss在分类问题中的作用。

首先，对类别标签进行一位有效编码：

$y=[y_{1},y_{2},y_{3}]^{T}$

$y_{i}=\left\{\begin{matrix} 1 ,& if (i=y) & \\ 0, & otherwise & \end{matrix}\right.$

(假设对于猫、狗、马三分类问题，有一张猫的图片，它的标签为 $y = [1, 0, 0]$ ；有一张狗的图片，它的标签为 $y = [0, 1, 0]$ ；有一张马的图片，它的标签为 $y = [0, 0, 1]$ )

其次，对输出值 $O=[o_{1},o_{2},o_{3}]$ 进行Softmax运算，输出匹配概率（非负，和为1）：

$\hat{y}=softmax(o)$

$\hat{y}_{i}=\frac{exp(o_{i})}{\sum_{k=1}^{n}exp(o_{k})}$

(本文为 $3$ 分类，所以上式中的 $n = 3$ ，将猫的图片输入网络，输出结果可能为 $\hat{y}=[0.6,0.15,0.25]$ ；将狗的图片输入网络，输出结果可能为 $\hat{y}=[0.15,0.6,0.25]$ ；将马的图片输入网络，输出结果可能为 $\hat{y}=[0.15,0.25,0.6]$ )

然后，对真实值 $y$ 和输出值 $\hat{y}$ 做Cross Entropy Loss（交叉熵损失）计算，将其作为损失值：

$l(y,\hat{y})=-\sum_{i=1}^{n}y_{i}log\hat{y}_{i}=-log\hat{y}_{y}$

(由于真实值 $y$ 是一个一位有效编码的向量，即只在真实类别处的值为 $1$ ，其余类别处的值为 $0$ ，所以上述交叉熵损失计算可简化为：某个类别的损失值 $=$ 输出值 $\hat{y}$ 中该类别对应概率值的 $- l o g$ 值。即在分类问题中，不关心非正确类的预测值，只关心正确类的预测值)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/425628.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

形式语言和自动机总结----正则语言RE

形式语言和自动机总结----正则语言RE

第3-4章正则表达式正则表达式的设计举例正则表达式的运算正则表达式的优先级举例 1.倒数第三个字符是1 （01)*1(01)(01) 2.不含有连续的0 （101）*（0） 3.含有000 （01）*000（01&a…

阅读更多...

【算法LearnNO.1】算法介绍以及算法的时间复杂度和空间复杂度

【算法LearnNO.1】算法介绍以及算法的时间复杂度和空间复杂度

目录一、算法 1、算法概述 2、算法的5个特性 3、设计算法的标准二、时间复杂度 1、时间复杂度的介绍 2、渐进时间复杂度的求法 3、计算时间复杂度的代码举例（平方阶示例） 4、时间复杂度排序三、空间复杂度一、算法 1、算法概述算法就是解…

阅读更多...

蔚来试水辅助驾驶订阅，NOP+能否吃蟹？

蔚来试水辅助驾驶订阅，NOP+能否吃蟹？

作者 | 德新编辑 | 王博2021年的NIO Day上，随着当时ET7发布，蔚来最早宣布了智能驾驶订阅服务：NAD，月费680元。两年后，辅助驾驶订阅模式终于开始落地：蔚来将从7月1日起，对NOP进行收费&#xff…

阅读更多...

Nginx基础教程

Nginx基础教程

Nginx 目标 Nginx简介【了解】 Nginx安装配置【掌握】一、Nginx简介 Nginx称为:负载均衡器或静态资源服务器:html,css,js,img Nginx(发音为“engine X”)是俄罗斯人编写的十分轻量级的HTTP服务器,是一个高性能的HTTP和反向代理服务器，同时也是一个IMAP/P…

阅读更多...

索引优化、优化，你又是一个好MongoDB！！！博学谷狂野架构师

索引优化、优化，你又是一个好MongoDB！！！博学谷狂野架构师

MongoDB索引优化作者: 博学谷狂野架构师GitHub：GitHub地址 （有我精心准备的130本电子书PDF）只分享干货、不吹水，让我们一起加油！😄 索引简介索引通常能够极大的提高查询的效率，如果没有索引&a…

阅读更多...

【pg数据库状态监控相关参数展示】

【pg数据库状态监控相关参数展示】

1、最近项目中做了一个postgresql数据库监控状态功能的需求，需求如下图 2、研究好久，终于在pg数据库的官方文档中找到了相关视图参数， 文档连接如下： 数据库基础信息： http://www.postgres.cn/docs/9.3/functions-in…

阅读更多...

开源项目：数据库表结构生成文档工具

开源项目：数据库表结构生成文档工具

目录一、软件介绍二、技术框架三、功能介绍四、代码展示 1、获取数据库信息部分代码 2、导出Html文档代码五、运行效果六、项目开源地址一、软件介绍今天给大家分享我自己编写的数据库表结构文档生成工具，方便大家在实际开发当中，可以很方便导出…

阅读更多...

JAVA常用工具-文件操作相关IO

JAVA常用工具-文件操作相关IO

IO技术在JDK中算是极其复杂的模块，文件管理都依赖IO技术，而且都是编程的难点，想要整体理解IO流，先从Linux操作系统开始， Linux空间隔离 Linux使用是区分用户的，这个是基础常识，其底层也区分用…

阅读更多...

【MQTT协议】使用Mosquitto实现mqtt协议（二）:编写视频帧的发布/订阅服务

【MQTT协议】使用Mosquitto实现mqtt协议（二）:编写视频帧的发布/订阅服务

目录一、Mosquitto中的QoS定义QoS1和3区别二、安装base64库三、cjson简介四、主程序代码五、调用Mosquitto库使用的cmakelist更多内容详见【MQTT协议】使用c实现mqtt协议（Mosquitto源码编译）一、Mosquitto中的QoS定义 MQTT协议中的QoS（Qual…

阅读更多...

CLIP论文拜读及理解

CLIP论文拜读及理解

文章目录一、clip论文阅读二、prompt1.除prompt之外的预训练语言模型2.prompt2.1. prompt定义2.2. prompt类型2.3. prompt重构2.3.1 prompt template2.3.2 Answer engineering2.4 多个 prompt的使用2.5 prompt的训练总结参考（博文、论文）一、clip论文阅读…

阅读更多...

Windows系统安装WSL，并安装docker服务

Windows系统安装WSL，并安装docker服务

背景因为工作需要，要在电脑上执行sh脚本，并启动docker服务执行具体逻辑。因为我的电脑是windows系统，对做本任务来说，比较吃力，所以想到使用wsl，让windows电脑具有linux电脑的能力。什么是 WSL 2 WSL 2 …

阅读更多...

JVM的类加载的过程以及双亲委派模型

JVM的类加载的过程以及双亲委派模型

目录 1、加载 （加载字节码文件，生成.class对象） 2、验证（验证Class文件是否符合规范） 3、准备 （为静态变量分配内存并设置变量初始值） 4、解析（初始化常量池中的一些常量&#…

阅读更多...

索引的分类

索引的分类

1.唯一索引给表中某一列设置为了唯一约束(这列不允许出现重复数据)后，数据库会为将这一列设置索引，这个索引叫做唯一索引（主键那一列是一个特殊的唯一索引，不仅要满足唯一索引这一列不可以出现重复数据，而且这一列还…

阅读更多...

Android opencv

Android opencv

install cmake cpp folder,新建c项目获取 OpenCV4Android SDK O4A_SDK 下载，并解压 ~/Downloads/OpenCV-android-sdk$ tree -d -L 2 . ├── apk ├── samples │ ├── 15-puzzle │ ├── camera-calibration │ ├── color-blob-detection │ ├…

阅读更多...

文件：IO流

文件：IO流

1. 什么是IO /O 即输入Input/ 输出Output的缩写，其实就是计算机调度把各个存储中（包括内存和外部存储）的数据写入写出的过程；java中用“流（stream）”来抽象表示这么一个写入写出的功能，封装成一…

阅读更多...

Vue学习笔记（7. axios异步请求）

Vue学习笔记（7. axios异步请求）

1. axios请求方式方式1：axios({method:"GET",url:"..."}) 方式2：axios({method:"POST",url:"...",data:"..."}) 方式3：axios.get("url...") 方式4：axios.post(…

阅读更多...

Python中的35个关键字

Python中的35个关键字

✅作者简介：CSDN内容合伙人、阿里云专家博主、51CTO专家博主、新星计划第三季python赛道Top1🏆 📃个人主页：hacker707的csdn博客 🔥系列专栏：零基础入门篇 💬个人格言：不断的翻越一座…

阅读更多...

【 Spring MVC 核心功能(二) - 获取参数(下)】

【 Spring MVC 核心功能(二) - 获取参数(下)】

文章目录一、使用 RequestBody 接收JSON对象二、使用 RequestPart 上传⽂件三、获取 Cookie四、获取 Header五、存储和获取 Session5.1 存储 Session5.2 获取 Session一、使用 RequestBody 接收JSON对象有时客户端会通过 post 方式发送 json 格式的请求，那后端就可…

阅读更多...

2.3.5双链表

2.3.5双链表

单链表vs双链表就是既有前驱指针也有后继指针，由line改为double。双链表的插入怎么实现？ s->nextp->next; p->next->priors s->priorp //把p赋给s的前驱指针指向的位置 p->nexts; 如果p刚好是最后一个元素。 p->next->prio…

阅读更多...

基于ArcGIS的电子地图矢量化方法

基于ArcGIS的电子地图矢量化方法

一、电子地图及纸质地图矢量化的目的地图数据来源有很多，其中栅格数据数字化是地图数据的重要来源。栅格数据的矢量化包括地理配准以及矢量化。矢量化后的地图数据往往可以为我们的空间统计分析提供实验依据，从而探究地理分布的时空差异性。空间参考&a…

阅读更多...

推荐文章

最新文章