熵与信息论

news2024/11/30 12:35:46

        经典信息论的核心概念是香农熵。假设我们得到了一个变量X的值,X的香农熵量化了我们在获悉 X的值时所能得到的平均信息量;另一种观点是将X的看作在我们获悉的值前对其不确定程度的度量。这两种观点是互补的;我们既可以将看作在我们获悉X的值前,对其不确定程度的度量,也可以看作在我们已经得到的值后,对获得信息量的度量。
        直觉上,随机变量的信息内容不应该依赖于随机变量取值的标签。例如,有一个随机变量取值为“头”和“尾”的概率分别为 1/4与3/4,另一个随机变量取值为0和1的概率分别为1/4与3/4,我们希望这两个随机变量包含相同的信息量。因此,随机变量的被定义为关于随机变量取值的概率的函数,且不受这些值的标签影响。我们经常将写作概率分布P1...Pn的函数这一概率分布的香农熵定义为

                                        H(X)\equiv H(p_{1},...p_{n})\equiv -\sum_{x}^{}p_{x}logp_{x}                                (1)

注意到\lim_{x\rightarrow 0}xlogx=0

        为什么要用这种方式表示熵呢?对熵的定义给出直观的论证,即熵的定义满足一些公理,这些公理是信息度量被期望拥有的性质。 更具体地说,假设有某个源(可能是无线电天线)正在产生某种类型的信息,比如以比特事的形式让我们考虑一个非常简单的模型,对于一个源:我们将它建立为一个产生一串独立同分布随机变量 X1,X2,… 的模型。大多数的真实信息源并不完全是这样的但这通常是对真实情况的一个很好的近似。香农的问题是我们最少需要多少资源来存储由源产生的这些信息,并使其在之后可以被重构。这个问题的答案被证明就是熵,也就是对每个源的符号我们需要 H(X)个比特,其中H(X)≡ (X1)≡ H(X)≡…..是源模型中每个随机变量的熵。这一结果被称为香农无噪声信道编码定理,我们将在第12章中证明它的经典与量子版本。
        我们举一个关于香农无噪声信道编码定理的具体例子,假设有一个信息源每次产生 1,2,3,4四个符号中的一个。在不进行压缩的情况下,每次使用源都需要消耗2比特的空间来存储4种可能的输出。然而,假设源产生符号1的概率是1/2,符号2的概率是1/4,符号3和4的概率是1/8,我们可以利用输出结果的这一偏向来压缩源,实现的方法是用较短的比特串来存储常见的符号例如1,而用较长的比特串来存储少见的符号例如3和4。一种可行的压缩方式是将1编码为比特串0,2为比特串10,3为比特串110,4为比特串111。可以注意到压缩后的串的平均长度就是每次使用源产生的信息量·1+·2+3+3=比特,这比用最普通直接的方式来存储源所需要的比特数要少!令人惊讶的是它恰好等于源的熵,即 H(X)=-1/2l0g(1/2)-1/4l0g(1/4)-1/8log(1/8)-1/8log(1/8)=7/4!此外,可以证明任何尝试更进一步地压缩源的企图都将不可避免地导致信息损失;因此熵量化了可能达到的最优压缩表示。

(定义的直观论证) 假定我们正在尝试量化在一次概率试验中可能发生的事件 E能够提供的信息量,我们通过使用一种取值由事件 E决定的“信息函数”I(E)来完成这件事。假定我们对这一函数有如下假设:
1.I(E)是一个只和事件 E的发生概率有关的函数,因此可以将其写作I=I(p),p表示取值
为0到1的概率。
2.I是关于概率的平滑函数。
3.当p,q>0时,I(pg)=I(p)+I(q)。(解释:当两个独立事件分别以概率p与q同时发生时所能获得的信息等于每个事件单独发生时所能获得的信息之和。)
        证明I(p)= klogp是满足以上假设的函数,其中k是一个常数。由此可以推出一组发生概率分别为p1...pn的互斥事件的平均信息增益等于k \sum_{i}^{}p_{i}logp_{i},而这恰好就等于香农熵乘以一个常数。

二元熵

        由于二值随机变量的熵非常有用,因此我们给它一个特殊的名字--二元熵,定义为
                                         H_{bin}(p)\equiv -plogp-(1-p)log(1-p)                                    (2)

其中p与1-p是输出两个值的概率。图 11-1展示了二元熵函数的图像。可以注意到 H(p)= H(1-p),并且当p=1/2时 H(p)达到最大值1。

        二元熵是用来理解熵的更一般性质的极好试验场。当我们混合两个或更多的概率分布时,会如何表现是一个特别令人感兴趣的性质。例如,想象一下Alice拥有两枚硬币,一枚是25 美分硬币,另一枚是I澳元硬币。两枚硬币都被调整过以便具有某种偏向,其中美元正面朝上的概率是PU,澳元正面朝上的概率是PA。假设Alice以q的概率掷美元,以1-q的概率掷澳元,并且告诉 Bob结果是正面朝上还是反面朝上。那么Bob平均能够获得多少信息量?直觉上,Bob得到的信息应该至少与掷美元或掷澳元得到的平均信息量相等。这一直觉用公式可以表达为
                            H(qpu+(1-q)p_{A})\geq qH(pu)+(1-q)H(p_{A})                               (3)
       大多时候上述不等式是严格的,因为Bob获得的信息不仅包括了硬币的值,也包括关于硬币特性的额外信息。比方说,如果pu=1/3,PA=5/6,并且结果是正面朝上,那么 Bob 就得到了一个相当明显的迹象,即硬币可能是澳元。

对于实值函数
                ​​​​​​​        ​​​​​​​                f(px+(1-p)y)\geq pf(x)+(1-p)f(y)
容易看出来二值函数是凹的、也可以通过检查图-1从面在视觉上捕提到这一性质,容易观察到的二元熵的图始终位于任意一条切测图的线条之上。作者的话(不要被上述育警式论证的前单所蒙蔽以致陷人虚安的自满之中:量子信息论中许多最深刻的结果都源自于经典或最子嫡的精妙应用。此外,对于量子熵而言,有时候很难证明直观上认为应当具有的回性)

总结

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2225879.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue3+ts+vite自动导入vue的依赖

Vue3tsvite自动导入vue的依赖 unplugin-auto-import 主要依赖 npm i -D unplugin-auto-import// vite.config.ts import AutoImport from unplugin-auto-import/viteexport default defineConfig({plugins: [AutoImport({ imports: ["vue", "vue-router"…

研发运营一体化(DevOps)能力成熟度模型

目录 应用设计 安全风险管理 技术运 持续交付 敏捷开发管理 基于微服务的端到端持续交付流水线案例 应用设计 安全风险管理 技术运 持续交付

智慧停车场导航系统架构及反向寻车系统解决方案

一、系统概述: 随着当前室内定位导航技术在大型公共场所如政务中心、商业综合体、车站中的应用越来越多,人们对智慧停车场的需求也日益凸显出来,并且智慧停车场对大型公共场所智慧化的整体建设起到重要作用。如何更有效提高停车效率&#xf…

图片处理达人使用图片格式转换器一键实现批量将 JPG 图片转换成 BMP 格式并调整图片质量,解决图片批量处理难题的利器

片处理达人的秘密武器——首助编辑高手软件的图片格式转换器!它能帮助你一键实现批量将JPG图片转换成BMP格式,高效解决图片批量处理难题,让你轻松成为图片处理高手! 1.导入图片‌:在软件的图片批量处理板块中点击“添…

文本配音怎么制作?推荐6款靠谱的文本配音工具,新手不可错过

文本配音怎么制作?相信有很多从事自媒体行业的小伙伴们有时对视频配音这个问题感到头疼,还有些喜欢听有声小说的朋友们,都会疑惑要怎么将文案文本转换成音频呢?其实文本配音不难,小编今天给大家整理了六款靠谱的文本配…

Python: Print Table on console

# encoding: utf-8 # 版权所有 2024 ©涂聚文有限公司 # 许可信息查看: # 描述: # Author : geovindu,Geovin Du 涂聚文. # IDE : PyCharm 2023.1 python 3.11 # OS : windows 10 # Datetime : 2024/10/28 22:08 # User : geo…

PSINS工具箱函数介绍——inserrplot

关于工具箱 i n s e r r p l o t inserrplot in

三维模型加载慢的问题优化

业务背景 在桂林XXX人民法院项目的XX法院三维模型应用开发中用户反馈模型加载慢的问题,要想优化该问题主要从两方面入手 硬件升级软件优化 硬件升级 可参考高院三维模型的超高分电脑配置 处理器:Hygon C86 3285 8-orecprocessor 3.00GHz&#xff08…

阿里云 SAE 应用引擎可观测性最佳实践

SAE 简介 Serverless 应用引擎 SAE(Serverless App Engine)是一款零代码改造、极简易用、自适应弹性的应用全托管平台。SAE 能够让用户免运维 IaaS 和 Kubernetes,秒级完成从源代码、代码包、Docker 镜像部署任意语言的在线应用(…

【面试题系列】MySQL 中 GROUP BY 和 DISTINCT 有什么区别?

在 MySQL 中,GROUP BY 和 DISTINCT 是两个常用的 SQL 子句,它们都用于处理数据的重复性,但在使用场景、语法、功能和性能方面存在显著差异。 本文将详细探讨这两者的区别,包括其语法、功能特点、使用场景及性能考虑,并…

Java类的static成员以及代码块(详细版)

文章目录 一、什么是static成员二、static修饰的成员有何意义三、static修饰成员变量四、static修饰成员方法4.1、静态成员变量不可以在方法内创建4.2、静态成员方法内部不可以访问非静态成员变量4.3、总结 五、static成员变量的初始化5.1、就地初始化5.2、静态代码块初始化 六…

Linux | Rsync 命令:16 个实际示例(下)

引言 Rsync(远程同步)是Linux/Unix系统中用于远程和本地复制及同步文件和目录的常用工具。 利用rsync命令,您可以轻松地在不同目录、硬盘和网络之间进行数据的远程和本地复制与同步,进行数据备份,以及在两台Linux系统间…

吃牛羊肉的季节来了,快来看看怎么陈列与销售!

一、肉品陈列基本原则 (一)新鲜卫生 1、保证商品在正确的温度、正确的方式下陈列 (1)正确的温度:冷藏柜-2℃-2℃;冷冻柜库-20℃-18℃ (2)正确的方式: 商品不遮挡冷气出风口&…

如何用 obdiag 排查 OceanBase数据库的卡合并问题——《OceanBase诊断系列》14

1. 背景 卡合并在OceanBase中是一个复杂的问题,其产生可能源于多种因素。目前,对于卡合并的明确界定尚不存在统一标准,一方面,我们界定超过36小时未完成合并为合并超时,此时RS会记录ERROR日志;另一方面&am…

图文详解ChatGPT-o1完成论文写作的全流程

学境思源,一键生成论文初稿: AcademicIdeas - 学境思源AI论文写作 本月中旬OpenAI发布了OpenAI o1系列新的AI模型。 据OpenAI介绍,这些模型旨在花更多时间思考后再做出反应,就像人一样。通过训练,它们学会改进思维过…

外包干了7天,技术明显退步。。。。。

先说一下自己的情况,本科生,22年通过校招进入南京某软件公司,干了接近2年的功能测试,今年年初,感觉自己不能够在这样下去了,长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了2年的功能测试&…

映射问题的解决办法(mybaitis)

最初我用的是注解来操控数据库&#xff08;注释掉的部分&#xff09; Mapper public interface ThreadMapper {// Select("SELECT * FROM thread LIMIT #{page}, #{size}")List<Thread> getListByPage(Param("page") int page, Param("size&qu…

ssm005基于SSM框架的购物商城系统的开发与实现(论文+源码)_kaic

设计题目&#xff1a;购物商城系统的设计与实现 摘 要 网络技术和计算机技术发展至今&#xff0c;已经拥有了深厚的理论基础&#xff0c;并在现实中进行了充分运用&#xff0c;尤其是基于计算机运行的软件更是受到各界的关注。加上现在人们已经步入信息时代&#xff0c;所以对…

[0152].第3节:IDEA中工程与模块

我的后端学习大纲 IDEA大纲 1、Project和Module的概念&#xff1a; 2、Module操作&#xff1a; 2.1.创建Module: 2.2.删除Module&#xff1a; 2.3.导入Module&#xff1a; 1.导入外来模块的代码&#xff1a; 查看Project Structure&#xff0c;选择import module&#xff1a…

部署DNS主从服务器

一。DNS主从服务器作用&#xff1a; DNS作为重要的互联网基础设施服务&#xff0c;保证DNS域名解析服务的正常运转至关重要&#xff0c;只有这样才能提供稳定、快速日不间断的域名查询服务 DNS 域名解析服务中&#xff0c;从服务器可以从主服务器上获取指定的区域数据文件&…