Softmax和Cross Entropy Loss在分类问题中的作用

news2024/11/23 12:15:14

在这里插入图片描述

  本文以三分类神经网络为例,讲解Softmax和Cross Entropy Loss在分类问题中的作用。

  首先,对类别标签进行一位有效编码

y = [ y 1 , y 2 , y 3 ] T y=[y_{1},y_{2},y_{3}]^{T} y=[y1,y2,y3]T

y i = { 1 , i f ( i = y ) 0 , o t h e r w i s e y_{i}=\left\{\begin{matrix} 1 ,& if (i=y) & \\ 0, & otherwise & \end{matrix}\right. yi={1,0,if(i=y)otherwise

(假设对于猫、狗、马三分类问题,有一张猫的图片,它的标签为 y = [ 1 , 0 , 0 ] y=[1,0,0] y=[1,0,0];有一张狗的图片,它的标签为 y = [ 0 , 1 , 0 ] y=[0,1,0] y=[0,1,0];有一张马的图片,它的标签为 y = [ 0 , 0 , 1 ] y=[0,0,1] y=[0,0,1])

  其次,对输出值 O = [ o 1 , o 2 , o 3 ] O=[o_{1},o_{2},o_{3}] O=[o1,o2,o3]进行Softmax运算,输出匹配概率(非负,和为1):

y ^ = s o f t m a x ( o ) \hat{y}=softmax(o) y^=softmax(o)

y ^ i = e x p ( o i ) ∑ k = 1 n e x p ( o k ) \hat{y}_{i}=\frac{exp(o_{i})}{\sum_{k=1}^{n}exp(o_{k})} y^i=k=1nexp(ok)exp(oi)

(本文为 3 3 3分类,所以上式中的 n = 3 n=3 n=3,将猫的图片输入网络,输出结果可能为 y ^ = [ 0.6 , 0.15 , 0.25 ] \hat{y}=[0.6,0.15,0.25] y^=[0.6,0.15,0.25];将狗的图片输入网络,输出结果可能为 y ^ = [ 0.15 , 0.6 , 0.25 ] \hat{y}=[0.15,0.6,0.25] y^=[0.15,0.6,0.25];将马的图片输入网络,输出结果可能为 y ^ = [ 0.15 , 0.25 , 0.6 ] \hat{y}=[0.15,0.25,0.6] y^=[0.15,0.25,0.6])

  然后,对真实值 y y y和输出值 y ^ \hat{y} y^做Cross Entropy Loss(交叉熵损失)计算,将其作为损失值:

l ( y , y ^ ) = − ∑ i = 1 n y i l o g y ^ i = − l o g y ^ y l(y,\hat{y})=-\sum_{i=1}^{n}y_{i}log\hat{y}_{i}=-log\hat{y}_{y} l(y,y^)=i=1nyilogy^i=logy^y

(由于真实值 y y y是一个一位有效编码的向量,即只在真实类别处的值为 1 1 1,其余类别处的值为 0 0 0,所以上述交叉熵损失计算可简化为:某个类别的损失值 = = = 输出值 y ^ \hat{y} y^中该类别对应概率值的 − l o g -log log值。即在分类问题中,不关心非正确类的预测值,只关心正确类的预测值)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/425628.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

形式语言和自动机总结----正则语言RE

第3-4章正则表达式 正则表达式的设计举例 正则表达式的运算 正则表达式的优先级 举例 1.倒数第三个字符是1 (01)*1(01)(01) 2.不含有连续的0 (101)*(0) 3.含有000 (01)*000(01&a…

【算法LearnNO.1】算法介绍以及算法的时间复杂度和空间复杂度

目录 一、算法 1、算法概述 2、算法的5个特性 3、设计算法的标准 二、时间复杂度 1、时间复杂度的介绍 2、渐进时间复杂度的求法 3、计算时间复杂度的代码举例(平方阶示例) 4、时间复杂度排序 三、空间复杂度 一、算法 1、算法概述 算法就是解…

蔚来试水辅助驾驶订阅,NOP+能否吃蟹?

作者 | 德新 编辑 | 王博2021年的NIO Day上,随着当时ET7发布,蔚来最早宣布了智能驾驶订阅服务:NAD,月费680元。 两年后,辅助驾驶订阅模式终于开始落地:蔚来将从7月1日起,对NOP进行收费&#xff…

Nginx基础教程

Nginx 目标 Nginx简介【了解】 Nginx安装配置【掌握】 一、Nginx简介 Nginx称为:负载均衡器或 静态资源服务器:html,css,js,img ​ Nginx(发音为“engine X”)是俄罗斯人编写的十分轻量级的HTTP服务器,是一个高性能的HTTP和反向代理服务器,同时也是一个IMAP/P…

索引优化、优化,你又是一个好MongoDB!!!博学谷狂野架构师

MongoDB索引优化 作者: 博学谷狂野架构师GitHub:GitHub地址 (有我精心准备的130本电子书PDF)只分享干货、不吹水,让我们一起加油!😄 索引简介 索引通常能够极大的提高查询的效率,如果没有索引&a…

【pg数据库状态监控相关参数展示】

1、最近项目中做了一个postgresql数据库监控状态功能的需求,需求如下图 2、研究好久,终于在pg数据库的官方文档中找到了相关视图参数, 文档连接如下: 数据库基础信息: http://www.postgres.cn/docs/9.3/functions-in…

开源项目:数据库表结构生成文档工具

目录 一、软件介绍 二、技术框架 三、功能介绍 四、代码展示 1、获取数据库信息部分代码 2、导出Html文档代码 五、运行效果 六、项目开源地址 一、软件介绍 今天给大家分享我自己编写的数据库表结构文档生成工具,方便大家在实际开发当中,可以很方便导出…

JAVA常用工具-文件操作相关IO

IO技术在JDK中算是极其复杂的模块,文件管理都依赖IO技术,而且都是编程的难点,想要整体理解IO流,先从Linux操作系统开始, Linux空间隔离 Linux使用是区分用户的,这个是基础常识,其底层也区分用…

【MQTT协议】使用Mosquitto实现mqtt协议(二):编写视频帧的发布/订阅服务

目录一、Mosquitto中的QoS定义QoS1和3区别二、安装base64库三、cjson简介四、主程序代码五、调用Mosquitto库使用的cmakelist更多内容详见 【MQTT协议】使用c实现mqtt协议(Mosquitto源码编译)一、Mosquitto中的QoS定义 MQTT协议中的QoS(Qual…

CLIP论文拜读及理解

文章目录一、clip论文阅读二、prompt1.除prompt之外的预训练语言模型2.prompt2.1. prompt定义2.2. prompt类型2.3. prompt重构2.3.1 prompt template2.3.2 Answer engineering2.4 多个 prompt的使用2.5 prompt的训练总结参考(博文、论文)一、clip论文阅读…

Windows系统安装WSL,并安装docker服务

背景 因为工作需要,要在电脑上执行sh脚本,并启动docker服务执行具体逻辑。因为我的电脑是windows系统,对做本任务来说,比较吃力,所以想到使用wsl,让windows电脑具有linux电脑的能力。 什么是 WSL 2 WSL 2 …

JVM的类加载的过程以及双亲委派模型

目录 1、加载 (加载字节码文件,生成.class对象) 2、验证(验证Class文件是否符合规范) 3、准备 (为静态变量分配内存并设置变量初始值) 4、解析(初始化常量池中的一些常量&#…

索引的分类

1.唯一索引 给表中某一列设置为了唯一约束(这列不允许出现重复数据)后,数据库会为将这一列设置索引,这个索引叫做唯一索引(主键那一列是一个特殊的唯一索引,不仅要满足唯一索引这一列不可以出现重复数据,而且这一列还…

Android opencv

install cmake cpp folder,新建c项目 获取 OpenCV4Android SDK O4A_SDK 下载,并解压 ~/Downloads/OpenCV-android-sdk$ tree -d -L 2 . ├── apk ├── samples │ ├── 15-puzzle │ ├── camera-calibration │ ├── color-blob-detection │ ├…

文件:IO流

1. 什么是IO /O 即输入Input/ 输出Output的缩写,其实就是计算机调度把各个存储中(包括内存和外部存储)的数据写入写出的过程;java中用“流(stream)”来抽象表示这么一个写入写出的功能,封装成一…

Vue学习笔记(7. axios异步请求)

1. axios请求方式 方式1:axios({method:"GET",url:"..."}) 方式2:axios({method:"POST",url:"...",data:"..."}) 方式3:axios.get("url...") 方式4:axios.post(…

Python中的35个关键字

✅作者简介:CSDN内容合伙人、阿里云专家博主、51CTO专家博主、新星计划第三季python赛道Top1🏆 📃个人主页:hacker707的csdn博客 🔥系列专栏:零基础入门篇 💬个人格言:不断的翻越一座…

【 Spring MVC 核心功能(二) - 获取参数(下)】

文章目录一、使用 RequestBody 接收JSON对象二、使用 RequestPart 上传⽂件三、获取 Cookie四、获取 Header五、存储和获取 Session5.1 存储 Session5.2 获取 Session一、使用 RequestBody 接收JSON对象 有时客户端会通过 post 方式发送 json 格式的请求,那后端就可…

2.3.5双链表

单链表vs双链表 就是既有前驱指针也有后继指针,由line改为double。 双链表的插入怎么实现? s->nextp->next; p->next->priors s->priorp //把p赋给s的前驱指针指向的位置 p->nexts; 如果p刚好是最后一个元素。 p->next->prio…

基于ArcGIS的电子地图矢量化方法

一、电子地图及纸质地图矢量化的目的 地图数据来源有很多,其中栅格数据数字化是地图数据的重要来源。栅格数据的矢量化包括地理配准以及矢量化。矢量化后的地图数据往往可以为我们的空间统计分析提供实验依据,从而探究地理分布的时空差异性。 空间参考&a…