机器学习中的交叉熵

news2026/2/11 10:38:44

文章目录

一、背景
二、概率论基础知识
三、熵≈信息熵（应用领域不同）、相对熵=KL散度、交叉熵、softmax、sigmoid、交叉熵损失
图像分割如何理解CrossEntropyLoss()
参考资料

一、背景

学习机器学习过程中，总是会遇到交叉熵这个名词。通过交叉熵损失作为损失函数来优化模型也是学习过程中必然会遇到的场景。但是,每次当和同门或者其它人遇到或者讨论什么是交叉熵的时候，总是无法从0到1讲出来，往往就是说这句话：“衡量预测结果和标签之间的分布差异，从而优化模型，使得我们的模型预测的结果能够与真实结果同分布。”
本文出于此目的，想要把交叉熵从原理到机器学习中的应用捋一遍，方便以后回顾以及和网上的你们进行不断的探讨学习。

二、概率论基础知识

随机变量
随机变量，随机变量可以取很多值，但和我们之前了解到的变量不同，随机变量无法求解。随机变量通常用大写字母表示，例如X，Y。这样的目的可能就是为了和传统的变量区分开。但是我们将其称之为变量又会对人误导，它其实是一种函数，将随机过程映射到实际数字中。比如说我想量化一个随机过程是，明天是否会下雨。你可以等到明天来看，也可以来量化。你可以定义一个随机变量，如果明天下雨就是1，如果不下就是0，不一定赋值0或者1，只是0或者1更好用而已。我们可以赋值21和100，这取决于你如何定义。随机变量和一般变量的差别要牢记，它并非传统观念意义上的变量，更像是从随机过程（下雨或者不下雨这个随机过程）映射到数值的函数，这个数值是随机的，获取我们知道概率的话，就可以将值映射为概率。

随机抛硬币是一个随机过程，每抛一次都是一次试验。随机变量可以用来量化这个随机试验。简单来说，随机变量就是函数映射，这里讲到的随机变量的概念将会和概率结合起来，形成非常有用的知识架构。对随机变量的量化的意义就在这里。

离散型随机变量X的概率分布=分布律=概率函数；
而离散型随机变量的概率分布函数F(x)就是把概率函数累加，因此又称之为累积概率函数；
在这里插入图片描述

在这里插入图片描述

三、熵≈信息熵（应用领域不同）、相对熵=KL散度、交叉熵、softmax、sigmoid、交叉熵损失

在这里插入图片描述

举例加深对交叉熵的理解：

从例子中可以看出，给出的正确预测概率值越高的那个预测，标签对预测结果的交叉熵其实是最小的。

补充：0*任何数都是零；真是标签使用one hot编码的意义就是，表示的是随机变量（样本）的概率分布；交叉熵对于连续变化的信号（连续型随机变量的信号的效果是很差的，连续的一般用均方差），离散型一般用交叉熵，效果也较好。
在这里插入图片描述
$q(c_i)$ 代表预测为真实标签的概率。

补充：（源自深度之眼：Line讲解）
在这里插入图片描述

其中lg和log在计算机中默认是以10为底。

图像分割如何理解CrossEntropyLoss()

其实就是像素级别的分类问题，对每个像素分类结果求交叉熵之后，求和取平均。
参考内容：pytorch语义分割中CrossEntropyLoss()损失函数的理解与分析

参考资料

bilibili一个视频彻底搞懂交叉熵、信息熵、相对熵、KL散度、交叉熵损失、交叉熵损失函数、softmax

【公开课-85集全】可汗学院：统计学（强烈推荐）

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/41695.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

SpringBoot整合knife4j

SpringBoot整合knife4j

1.1 Swagger 前后端分离开发：前端和后端分开进行开发，2个项目，一个是前端项目，一个是后端项目目前基本上很多小项目都是前后端分离，除了后台管理系统前后端分离开发，前端(app、小程序、智能硬件等)怎么…

阅读更多...

栈（C语言实现）

栈（C语言实现）

文章目录：1.栈的概念2.栈的结构3.接口实现3.1初始化栈3.2判断栈是否为空3.3压栈（入栈）3.4出栈3.5查看栈顶元素3.6统计栈内元素个数3.7销毁栈1.栈的概念栈：一种特殊的线性表，其只允许在固定的一端进行插入和删除元素操…

阅读更多...

Credly 数字证书

Credly 数字证书

Credly 数字证书 Credly 简介通过 Credly 颁发的徽章是对学习成果、经验或能力的数字表述。Credly 数字证书包括常见的组织徽章，如：AWS, Adobe, Autodesk, Certiport, Microsoft, CISCO, IBM 等等，以一种简单和安全的方式在线分享和验证&a…

阅读更多...

基于改进人工蜂群算法的K均值聚类算法（Matlab代码实现）

基于改进人工蜂群算法的K均值聚类算法（Matlab代码实现）

🍒🍒🍒欢迎关注🌈🌈🌈 📝个人主页：我爱Matlab 👍点赞➕评论➕收藏养成习惯（一键三连）🌻🌻🌻 🍌希…

阅读更多...

基于SEIRD和元胞自动机（CA)模型的传染病发展趋势预测

基于SEIRD和元胞自动机（CA)模型的传染病发展趋势预测

目录前言一、模型假设二、符号说明三、SEIRD模型1. 模型求解四、元胞自动机（CA)模型1. 模型求解2. 城市居民减少外出对疫情发展的影响3. 城市间人口流动对疫情发展的影响五基于防疫政策的修正模型2 “全民戴口罩”“早发现，早隔离”“全民打疫苗”总结前…

阅读更多...

Jsonp跨域的坑，关于jsonp你真的了解吗

Jsonp跨域的坑，关于jsonp你真的了解吗

先来介绍Jsonp跨域 Jsonp全称是Json with Padding，和Json没有关系 Json是一种数据交换格式，而Jsonp是一种依靠开发人员聪明才智创造出的一种费官方跨域数据交换协议。json是描述信息的格式，jsonp是信息传输的协议在页面上直接发送一个跨域的…

阅读更多...

树莓派之树莓派系统安装

树莓派之树莓派系统安装

树莓派系统安装概述树莓派(是为学习计算机编程教育而设计)，只有信用卡大小的微型电脑，其系统基于Linux。随着Windows 10 IoT的发布，我们也将可以用上运行Windows的树莓派。2014年刚知道有树莓派的时候好奇买了一块，型号&#x…

阅读更多...

DSP-IIR滤波器设计

DSP-IIR滤波器设计

目录滤波器的性能指标： 常用的模拟滤波器： 巴特沃斯滤波器： 巴特沃斯滤波器设计——一般已知Ωp及其衰减指标,Ωs及其衰减指标求得A，ε，N，Ωc： 巴特沃斯滤波器设计例题： 切比…

阅读更多...

Python系列-Django

Python系列-Django

文章目录Python系列-Django用django实现社交媒体 social_book基本演示，点击可查看视频整体项目的创建数据库设计，基本用户创建表的设计 models.py创建用户查看数据库插件 database navigator登录、注册的实现用djangovue实现社交媒体 social_bookPython系…

阅读更多...

【Java集合】Collection接口常用方法

【Java集合】Collection接口常用方法

文章目录Collection接口和常用方法> Collection接口常用方法> Collection接口遍历元素：使用Iterator（迭代器）> Collection接口遍历元素：增强 for 循环Collection接口和常用方法 Collection接口实现类的特点：…

阅读更多...

CPU中的核与进程，线程间的关系讲解（操作系统基础概念）

CPU中的核与进程，线程间的关系讲解（操作系统基础概念）

CPU中的核与进程，线程间的关系讲解（操作系统基础概念） CPU中的内核概念 CPU内核（Die）是CPU中间的核心芯片，由单晶硅制成，用来完成所有的计算、接受/存储命令、处理数据等，是数字…

阅读更多...

Node.js | 详解 JWT 登录验证的工作原理

Node.js | 详解 JWT 登录验证的工作原理

🧑‍💼 个人简介：一个不甘平庸的平凡人🍬 🖥️ 本系列专栏：Node.js从入门到精通 🖥️ TS知识总结：十万字超详细TS知识点总结 👉 你的一键三连是我更新的最大动力❤️&…

阅读更多...

【Java系列】一篇文章快速了解Java语言概述

【Java系列】一篇文章快速了解Java语言概述

Java语言概述1.Java简介2.JVM2.1JVM介绍2.2JVM特性3.Java特性4.搭建Java程序开发环境5.编写第一个Java应用程序6.小结第一个程序1.Java简介 java是面向对象的一门程序设计语言随着Java技术在web方面的不断成熟，已经成为Web应用程序的首选开发语言。后台开发&#x…

阅读更多...

FRP进阶篇之安全认证

FRP进阶篇之安全认证

目录一、前言二、通信加密 1、概述 2、使用三、BasicAuth 鉴权 1、概述 2、使用 2.1、客户端配置 2.2、启动客户端 2.3、效果验证四、TLS双向身份验证 1、概述 2、使用 2.1、生成证书 2.2、服务端配置 2.3、客户端配置一、前言通过上次的《FRP入门篇》相信…

阅读更多...

毕业设计-机器学习图像卡通动漫化图像风格迁移

毕业设计-机器学习图像卡通动漫化图像风格迁移

前言 📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利通过和节省时间与精力投…

阅读更多...

关于旅游景点主题的HTML网页设计——北京景点 7页(带订单购物车)Html+Css+javascript

关于旅游景点主题的HTML网页设计——北京景点 7页(带订单购物车)Html+Css+javascript

⛵ 源码获取文末联系 ✈ Web前端开发技术描述网页设计题材，DIVCSS 布局制作,HTMLCSS网页设计期末课程大作业 | 游景点介绍 | 旅游风景区 | 家乡介绍 | 等网站的设计与制作 | HTML期末大学生网页设计作业，Web大学生网页 HTML：结构 CSS&…

阅读更多...

redhat 新开启一个ssh端口

redhat 新开启一个ssh端口

查看是否安装ssh服务 rpm -qa |grep ssh2.开启ssh服务 systemctl start sshd.service3.修改ssh配置文件 vi /etc/ssh/sshd_config4.复制Port行并修改端口号此时已经新增了一个端口 5.启用新端口 sudo semanage port -a -t ssh_port_t -p tcp 22116.防火墙放开新增的端口 …

阅读更多...

最全面的SpringMVC教程（二）——SpringMVC核心技术篇

最全面的SpringMVC教程（二）——SpringMVC核心技术篇

前言本文为【SpringMVC教程】核心技术篇相关详细介绍，具体将对视图和模型拆分，重定向与转发，RequestMapping与其衍生注解，URL 模式匹配，牛逼的传参，设定字符集，返回json数据（序列…

阅读更多...

【Hack The Box】linux练习-- seal

【Hack The Box】linux练习-- seal

HTB 学习笔记【Hack The Box】linux练习-- seal 🔥系列专栏：Hack The Box 🎉欢迎关注🔎点赞👍收藏⭐️留言📝 📆首发时间：🌴2022年11月17日🌴 &#x1f36d…

阅读更多...

②【Maven】从0上手Maven的安装与配置 - 最全教程（下载 + 配置 + 环境变量）

②【Maven】从0上手Maven的安装与配置 - 最全教程（下载 + 配置 + 环境变量）

个人简介：Java领域新星创作者；阿里云技术博主、星级博主、专家博主；正在Java学习的路上摸爬滚打，记录学习的过程~ 个人主页：.29.的博客学习社区：进去逛一逛~ Maven >>> 下载、安装、配置一、下载…

阅读更多...

推荐文章

最新文章