信息熵,交叉熵,KL散度,互信息一网打尽

news2025/2/28 15:23:40

talk

一直以来都是自己有时候 想去搞明白就搜搜博客看,模棱两可,记忆也比较模糊,这次直接较为系统的记录一下,之后忘了也能看看~

1. 信息熵

这个概念是从信息论出现的,是香农定义的,根据事件发生的概率进行定义。具体上:

事件发生概率越小,包含的信息量越大。

意思就是,很少发生的事件,会让人surprise,维基百科Entropy很好的解释了这个,当时看到surprise开始不理解,查了之后具体就是 等价于 信息。 因为香农认为让人惊奇的事情包含信息量大,如 太阳每天东边升起,没什么信息量=0(必然事件,概率=1),中彩票,概率小,信息量大。
公式是: 根据对数定义,和事件发生的概率 是 成反比的。log满足了 p=1,信息量=0
在这里插入图片描述

一般就是这两种形式,对数 分数或者-log, 信息量有时候也被称为 编码长度,方便理解

在这里插入图片描述
熵被定义为= 相应事件的概率*事件的信息量
在这里插入图片描述

2. 交叉熵 wiki

含义: 数据是基于一个wrong的 q的编码长度 然而 数据真正是 遵循一个p分布。
在这里插入图片描述

p的期望*基于q的编码长度。 p一般是真实的数据分布概率,q的编码长度是 模型输出的,根据交叉熵,能够对模型输出的q一直进行调整,当p和q的 编码一致时,损失最小。(多分类,one-hot标签情况下)
在这里插入图片描述
知乎有个分类的例子去计算 ,真实标签作为p的期望,所得的概率,计算出编码长度和p的期望进行计算交叉熵。

3. KL散度

性质:不对称
衡量两个分布之间的距离,但这个不是常见的距离,这也是被称为散度,而不是距离的原因。 因为KL散度不符合距离的对称性,即KL(P||Q) != KL(Q||P) . 同时不满足三角不等式,因此不是距离,而是 divergence
在这里插入图片描述
上面是离散形式,底下是连续变量之间的。 通过离散形式的第二项(变成类似熵形式),可以看出KL散度=交叉熵-熵,这就是多分类里面常用交叉熵来代替KL散度的原因,因为KL散度第二项熵是 常量,因此可以省略。
在这里插入图片描述

解释:

KL散度本质上是 采用Q编码系统来解码 基于P编码系统的数据 所 额外需要 进行传输 的数据,即就是 交叉熵(Q解码P)-熵(P解码P)。当两者分布相同,交叉熵 H(P,Q)-熵H(P) =0, 即 通过Q解码数据P 和 通过P解码P一样。
这里 知乎或者csdn 有部分解答,但是很多都说错了。他们都是说 基于P去解码Q,只有一个对的,和wiki一样
这个链接是错的,就是底下这个 他说 是 基于P编码 Q
在这里插入图片描述
这个是对的KL散度解释, 两个不同之处就在于 是Q去编码P,开始一直疑惑这里到底谁是,
在这里插入图片描述
维基百科 这里很直接指出了:KL= 采用一个Q编码系统而不是 P编码系统 来去编码 P的数据 的差值,也就是 交叉熵-熵
在这里插入图片描述

4. 互信息 wiki

这个Venn图经典也直观,两个圆相交的区域 (紫色)就是互信息。性质:非负,对称。
在这里插入图片描述
互信息有很多种定义形式:

  1. 边缘分布和联合分布乘积之间的KL散度
    在这里插入图片描述 在这里插入图片描述

  2. 熵-条件熵 。

     这里从Venn图就可以看出来,紫色=左侧圆(熵)-左侧红色(条件熵)
    

在这里插入图片描述

  1. 2个熵-联合熵

    这里先指出:联合熵=上面Venn图中所有有颜色的区域,即两个圆面积-1*相交区域(紫色)。
    因此从 Venn图看出 MI= H(x)+H(Y)  - H(X,Y)。  前面两项把中间算2次-后面这项只算一次,就=中间紫色区域
    

在这里插入图片描述

  1. 联合熵-2个条件熵

     紫色=总面积-左边红-右边蓝
    

在这里插入图片描述

Proof:

从1推其余的 wiki里面的
在这里插入图片描述
从 其余的推1推导
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/9496.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

excel怎么设置密码?加密文件这么做!

我们都知道,很多时候需要我们在电脑上保存很多excel文件。为了避免在工作中出现意外,我们需要在文件中设置一个安全密码。那么,电子表格excel怎么设置密码呢?如果我们设置了密码,想要取消原本的密码或者重新设置一个密…

Windows无法启动这个硬件设备(代码19)怎么办?

在我们使用电脑的过程中,遇到“由于其配置信息(注册表中的)不完整或已损坏,Windows无法启动这个硬件设备(代码19)”的提示时该如何解决呢? Windows无法启动这个硬件设备(代码19),如何…

干货整理| 深度学习入门知识

一、深度学习的定义 深度学习(Deep Learning),简称:DL,是一种实现机器学习的技术。 人工智能(AI)的概念是在1955 年提出的;机器学习(ML)概念是在1990 年提出…

springboot 整合clickhouse

最近需要做一个项目 需要整合clickhouse 本来有现成的项目,复制一下就好了。但是想自己从头开始一个个文件搭建 但是还是遇到了很多坑, 这就是传说中的约定优于配置吗 1 首先第一步application启动的时候 启动完了,就会退出&#xff0c…

[附源码]计算机毕业设计JAVA房屋租赁管理系统

[附源码]计算机毕业设计JAVA房屋租赁管理系统 项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybati…

C++QT实现压缩文件、文件夹和解压缩操作

一、前言 QZipWriter是用来压缩文件的类,需要在安装Qt是选择Sources源码安装。否则,无法使用QZipWriter。 1. QZipWriter函数说明 1.1 构造方法: QZipWriter(const QString &fileName, QIODevice::OpenMode mode (QIODevice::WriteOnl…

控制游戏人物移动的细节到底有多少?

👨‍💻个人主页:元宇宙-秩沅 hallo 欢迎 点赞👍 收藏⭐ 留言📝 加关注✅! 本文由 秩沅 原创 收录于专栏 unity实战入门 在游戏中我们在做控制游戏物体移动时会碰到以下常见的几种情况: 文章目录在游戏中…

adb shell AT指令发送短信

开启两个,命令行窗口。都进入adb shell。 查看 /dev下的smd设备节点,选取一个进行读写操作 一个窗口用来进行读,另一个窗口进行写入指令操作,读取和写入的节点需要一致。 SH4-1:/ # ls /dev/smd* ls /dev/smd* /dev/smd11 /dev/…

隐式神经表示一:神经网络拟合图像Implicit Neural Representations with Periodic Activation Functions

文章目录1. Implicit Neural Representations with Periodic Activation Functions0. 什么是隐式神经表示1. 了解SineLayer的初始化,还是没了解。。。2. 均匀分布3. Lemma 1.14. 一个简单实验, 拟合图像4.1 网络模型代码如下,就是全连接网络,…

【自然语言处理(NLP)】基于BiLSTM+CRF的事件抽取

【自然语言处理(NLP)】基于BiLSTMCRF的事件抽取 作者简介:在校大学生一枚,华为云享专家,阿里云专家博主,腾云先锋(TDP)成员,云曦智划项目总负责人,全国高等学…

Centos 7 安装 wget

文章目录1. wget命令详解:2.查看帮助手册3.使用 wget 下载单个文件4.使用 wget -O 下载并以不同的文件名保存5.使用 wget -c 断点续传6.使用 wget -b 后台下载1. wget命令详解: wget是Linux中的一个下载文件的工具,wget是在Linux下开发的开放源代码的软件&#xff…

tomcat线程池-深度分析tomcat线程池设计与现实

1.概述 在正式进入Tomcat线程池之前,小伙伴们可以先回顾一下JDK中的线程池相关特性,对于JDK线程池的总结和源码的解析感兴趣的童鞋,也可参考博主的层层剖析线程池源码的这篇文章,文章主要讲述对线程池的生命周期,核心参…

五、事件系统-原生事件-react中的合成事件-详解事件的冒泡和捕获机制

目标 深入理解和掌握事件的冒泡及捕获机制理解react中的合成事件的本质在react组件中合理的使用原生事件 知识点 在原生的dom模型上触发的事件会进行事件传递。而所谓的事件传递指的是当在A元素上触发某一事件的时候,B元素如果满足了和A元素一定的关系的话&#xf…

freeswitch如何判断挂机方

概述 freeswitch作为VOIP的软交换平台,需要对呼叫的信息做判断和归类。 常见的呼叫信息中,挂机方向的信息对于话单统计有很大的用处。 但是fs的原始话单和日志中并没有挂机方向的信息。 环境 centos:CentOS7 freeswitch:v1.…

火遍国内外IT技术圈,豆瓣 9.7!这本技术书籍直接封神了

这是一本在国内外都被称为技术书籍巅峰之作的神书! 国内的豆瓣评分 9.7(满分 10.00),接近 90% 的人为这本书打了五星好评。 国外的 Goodreads(类似于豆瓣) 评分 4.72(满分 5.00) &a…

元宇宙:下一代互联网的“美丽新世界”

8月6日到8日,美国超人气歌手Ariana Grande在全球不同地区,连续举办了5场演唱会。与众不同的是,演出的举办地点在游戏《堡垒之夜》(Fortnite)中。全球上千万的玩家,使用自己的游戏角色盛装出席。演出中,一系列的小游戏贯穿了主线,最后粉丝在绚丽的场景中和“Ariana”一对…

42、Spring AMQP DirectExchange

1、DirectExchange 2、案例 3、通过配置类实现 1、配置类 2、Publisher 3、Consumer 4、测试结果 4、通过注解实现 1、Consumer添加Linstener 2、Publisher 执行测试方法 3、测试结果 4、总结分析 学习了DirectExchange之后,发现与FanoutExchange有些许差异&#…

腾讯程序员的手码K8S+Jenkins笔记

最近在GitHub上认识一个腾讯大佬,从他手上得到一份K8SJenkins笔记,好东西还是要共享的!希望这份笔记能让你技术更上一层! 从理论到实战深入K8S 学习K8S的学习笔记很少有比较齐全的,而这份K8S学习笔记,尽量…

谈了这么久的无代码到底是什么?

尽管我们一直在谈论关于“无代码”的方方面面,但却并没有专门谈及“无代码”是什么。不仅许多刚听到这个名词的人会感到疑惑,就算熟悉这一名词的可能也无法给出一个准确的定义,又或者常常将其与另一个相近的名词“低代码”弄混。 今天我们专…

Revit插件实现【快速扣减】的两种操作

翻模的过程中,我们在处理细节问题的时候,如果只是两个构件之间的重合,我们可以利用“连接”命令进行扣减。而如果是想让多个构件进行扣减操作,而不是整层或者整栋楼都按照同样的扣减顺序进行的话,我们可以利用橄榄山和…