通信原理速成笔记(信息论及编码)

news2025/4/21 10:22:36

信息论基础

  • 信息的定义与度量
    信息是用来消除不确定性的内容。例如,在猜硬币正反的情境中,结果存在正反两种不确定性,而得知正确结果能消除这种不确定性,此结果即为信息。
  • 单个事件的信息量:对于离散信源中的事件xi​,若其发生概率为p(x_i),则信息量I(x_i)=-\log_2p(x_i),单位为比特(bit)。比如抛一枚均匀硬币,正面朝上概率p = 0.5,那么正面朝上这一事件的信息量I=-\log_20.5 = 1bit
  • 信息熵:信息熵代表信源的平均不确定性,是信源中每个事件信息量的统计平均值。对于离散信源x,其概率分布为\{p(x_i),i = 1,2,\cdots,n\},信息熵H(X)=-\sum_{i = 1}^{n}p(x_i)\log_2p(x_i) 。它反映了信源输出前的平均不确定性,也表示输出后每个符号携带的平均信息量。
    • 信息熵计算示例:假设有一个离散信源,包含三个符号A,B,C,概率分别为p(A)=0.5p(B)=0.3p(C)=0.2
      • 先计算每个符号的信息量:I(A)=-\log_20.5 = 1bitI(B)=-\log_20.3\approx1.74bitI(C)=-\log_20.2\approx2.32bit
      • 再计算信息熵H(X)H(X)= - p(A)\log_2p(A)-p(B)\log_2p(B)-p(C)\log_2p(C)= - 0.5×1 - 0.3×1.74 - 0.2×2.32 = 1.486bit
      • 用图表示如下:
离散信源
|-- A (p = 0.5, I = 1bit)
|-- B (p = 0.3, I = 1.74bit)
|-- C (p = 0.2, I = 2.32bit)
信息熵 H(X) = 1.486bit
  • 信道与信道容量
    • 信道模型:信道是信息传输的通道。常见的如二进制对称信道(BSC),在该信道中,输入为 0 或 1,受噪声干扰会出现错误,设错误概率为p 。即输入 0 时,以概率p输出 1,以概率1 - p输出 0;输入 1 时,以概率p输出 0,以概率1 - p输出 1。
      • 二进制对称信道示例图
输入 ------[噪声干扰,错误概率 p]------ 输出
| 0 |------------------| 0 (1 - p) | 1 (p) |
| 1 |------------------| 1 (1 - p) | 0 (p) |

信道分为无噪声信道(信息可准确传输)和有噪声信道(噪声干扰信号导致传输错误)。

  • 信道容量:信道容量C指信道能够传输的最大平均信息速率,单位为比特 / 秒(bit/s)。对于带宽为B(Hz)的加性高斯白噪声(AWGN)信道,信道容量的香农公式为C = B\log_2(1+\frac{S}{N}) ,其中S是信号平均功率,N是噪声平均功率,\frac{S}{N}​为信噪比。
    • 此公式表明,增加信道带宽或提高信噪比可提升信道容量,但增加带宽受物理条件限制,提高信噪比面临成本问题。例如在光纤通信中,通过提高光信号功率(增大S)和降低噪声(减小N)来提升信噪比,进而提高信道容量,实现高速数据传输。
    • 信道容量与信噪比关系示例图:以信道带宽B = 1MHz为例,绘制信道容量C随信噪比\frac{S}{N}​变化的曲线。当\frac{S}{N}从 1 增大到 100 时,依据香农公式C = B\log_2(1+\frac{S}{N}) ,计算出不同\frac{S}{N}​对应的C值。
\frac{S}{N}C(bit/s)
11×10^6×\log_2(1 + 1)\approx1×10^6
101×10^6×\log_2(1 + 10)\approx3.46×10^6
1001×10^6×\log_2(1 + 100)\approx6.65×10^6
|         .
|       .
|     .
|   .
| .
|.
|________________
信噪比(S/N)

可以看到,随着信噪比增大,信道容量逐渐增加,呈现对数增长趋势。

编码

  • 信源编码
    • 信源编码的目的:减少信源输出符号序列中的剩余度,提高符号的平均信息量,从而在不损失信息的前提下,用尽可能少的码元表示信源信息,达到数据压缩的目的。
    • 常见的信源编码方法
      • 香农编码:依据信源符号的概率分布进行编码。先将信源符号按概率从大到小排序,接着计算每个符号的累加概率,再将累加概率用二进制表示,取小数点后与该符号自信息量比特数相同的位数作为编码。例如,有三个信源符号a_1,a_2,a_3,概率分别为0.5,0.25,0.25,排序后,a_1的累加概率为 0,a_2​为0.5a_3​为0.75,转换为二进制并取对应位数,得到a_1​编码为 0,a_2​编码为 10,a_3​编码为 11。
      • 香农编码示例图:假设有信源符号x_1,x_2,x_3,x_4,概率分别为p(x_1)=0.4p(x_2)=0.3p(x_3)=0.2p(x_4)=0.1
        • 排序后:
x_1 (0.4)
x_2 (0.3)
x_3 (0.2)
x_4 (0.1)
  • 计算累加概率:
x_1:0
x_2:0.4
x_3:0.4 + 0.3 = 0.7
x_4:0.7 + 0.2 = 0.9
  • 计算自信息量:
I(x_1)=-\log_20.4\approx1.32$bit
I(x_2)=-\log_20.3\approx1.74$bit
I(x_3)=-\log_20.2\approx2.32$bit
I(x_4)=-\log_20.1\approx3.32$bit
  • 二进制表示累加概率并取对应位数编码:
x_1:0 (取1位,对应1.32bit,编码为0)
x_2:0.4 -> 0.0110011... (取2位,编码为01)
x_3:0.7 -> 0.1011001... (取3位,编码为101)
x_4:0.9 -> 0.1110011... (取4位,编码为1110)
  • 用图表示如下:
信源符号概率累加概率自信息量编码
X10.401.32bit0
X20.30.41.74bit01
X30.20.72.32bit101
X40.10.93.32bit1110
  • 哈夫曼编码:是一种最优前缀编码。构建哈夫曼树,将信源符号及其概率作为叶子节点,每次选取概率最小的两个节点合并为新节点,新节点概率为两节点概率之和,直至所有节点合并为根节点。从根节点到叶子节点的路径上,向左分支标记为 0,向右分支标记为 1,得到的路径编码就是该符号的哈夫曼编码。例如,对于信源符号x_1,x_2,x_3,x_4​,概率分别为0.4,0.3,0.2,0.1 ,构建哈夫曼树后,x_1​编码为 0,x_2​编码为 10,x_3​编码为 110,x_4编码为 111,能使平均码长最短,实现高效压缩。
  • 哈夫曼编码示例图:对于信源符号x_1,x_2,x_3,x_4​,概率分别为p(x_1)=0.4p(x_2)=0.3p(x_3)=0.2p(x_4)=0.1
    • 构建哈夫曼树过程:
      • 初始节点:
x_1 (0.4)
x_2 (0.3)
x_3 (0.2)
x_4 (0.1)
  • 第一次合并:选取x_3x_4​合并,新节点概率为0.2 + 0.1 = 0.3 ,此时节点:
x_1 (0.4)
x_2 (0.3)
新节点(0.3)
  • 第二次合并:选取x_2​和新节点 (0.3) 合并,新节点概率为0.3 + 0.3 = 0.6 ,此时节点:
x_1 (0.4)
新节点(0.6)
  • 第三次合并:选取x_1​和新节点 (0.6) 合并,得到根节点,概率为0.4 + 0.6 = 1 。
  • 编码过程:
    • 从根节点到x_1​:向左,编码为 0 。
    • 从根节点到x_2​:向右,再向左,编码为 10 。
    • 从根节点到x_3​:向右,再向右,再向左,编码为 110 。
    • 从根节点到x_4​:向右,再向右,再向右,编码为 111 。
  • 用图表示如下:
                   1
                 /   \
               0.4     0.6
              /       /   \
            x1      0.3     0.3
                        /   \
                      x2     0.2
                             / \
                           x3   x4

对应的编码:

信源符号编码
X10
X210
X3110
X4111
  • 信道编码
    • 信道编码的目的:通过在信息码元中增加冗余码元,使接收端能够检测和纠正传输过程中出现的错误,提高信息传输的可靠性。
    • 常见的信道编码方法
      • 奇偶校验码:分为奇校验和偶校验。奇校验使编码后的码组中 1 的个数为奇数,偶校验使编码后的码组中 1 的个数为偶数。例如,对于信息码组 1011,采用奇校验时,添加校验位 1,得到编码后的码组 10111;采用偶校验时,添加校验位 0,得到编码后的码组 10110。接收端通过检查码组中 1 的个数是否符合奇偶性来判断是否出现错误。
      • 汉明码:是一种能纠正一位错误的线性分组码。通过在信息位中插入校验位,形成特定的校验关系。例如,对于 4 位信息位D_1D_2D_3D_4 ,可以添加 3 位校验位P_1P_2P_3​ ,组成 7 位的汉明码C_1C_2C_3C_4C_5C_6C_7​ ,通过特定的校验方程计算校验位的值。接收端根据校验方程对接收码组进行校验,若校验结果不为 0,则可确定错误位置并进行纠正。
      • 汉明码校验示例图:假设信息位D_1D_2D_3D_4 = 1011 。
        • 确定校验位位置:校验位P_1​在第 1 位,P_2​在第 2 位,P_3​在第 4 位。信息位和校验位排列为C_1C_2D_1C_3D_2D_3D_4​ 。
        • 计算校验位:
          • P_1​校验C_1​、C_3​、D_1​、D_3​,使这些位中 1 的个数为偶数,P_1 = 1 。
          • P_2​校验C_2​、C_3D_2D_3​,使这些位中 1 的个数为偶数,P_2 = 0 。
          • P_3​校验C_3​、D_1​、D_2​、D_4,使这些位中 1 的个数为偶数,P_3 = 1 。
          • 编码后的汉明码为1011011 。
        • 接收端校验:假设接收码组为1011011 ,无错误时,各校验方程结果为 0 。若第 3 位D_1​变为 0,接收码组为1001011 。计算校验方程:
          • S_1​(对应P_1​校验方程)结果不为 0 。
          • S_2​(对应P_2校验方程)结果不为 0 。
          • S_3(对应P_3​校验方程)结果为 0 。
          • 根据S_1S_2S_3的值确定错误位置为第 3 位,可进行纠正。
        • 用图表示如下:
信息位: 1 0 1 1
校验位计算:
  P1: 1 (使 1, 3, 5, 7 位 1 的个数为偶数)
  P2: 0 (使 2, 3, 6, 7 位 1 的个数为偶数)
  P3: 1 (使 4, 5, 6, 7 位 1 的个数为偶数)
  • 循环码:是一种重要的线性分组码,具有循环移位特性,即任意一个许用码组经过循环移位后得到的码组仍为该码的一个许用码组。例如循环码组 1011000,循环左移一位得到 0110001,仍是该循环码码组。循环码有生成多项式g(x) ,通过信息多项式m(x)与生成多项式g(x)运算得到码多项式T(x) ,在光盘存储、数字通信等领域有广泛应用。

信息论与编码的应用案例

  1. 通信系统:在 5G 通信中,采用低密度奇偶校验码和极化码等信道编码技术来提高通信的可靠性。信源编码则用于压缩数据,提升频谱效率,从而实现高速、大容量的数据传输。
  2. 数据存储:在硬盘等数据存储设备中,运用纠错编码技术,确保数据在存储和读取过程中出现错误时,能够被检测和纠正,保证数据的完整性。
  3. 多媒体领域:以 MP3 音频编码为例,它依据信息论原理,去除人耳难以感知的信息,从而对音频数据进行压缩,大大减小了音频文件的大小,便于存储和传输。
  4. 网络安全:信息论为加密算法提供了理论支持。例如在区块链技术中,使用哈希编码来保证数据的不可篡改和安全性,通过复杂的数学运算和编码规则,确保信息在传输和存储过程中的完整性和保密性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2308577.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

云和恩墨亮相PolarDB开发者大会,与阿里云深化数据库服务合作

2025年2月26日,备受瞩目的阿里云PolarDB开发者大会于北京嘉瑞文化中心盛大举行,众多行业精英齐聚一堂,共襄技术盛会。云和恩墨作为阿里云重要的生态合作伙伴受邀参会。云和恩墨联合创始人兼技术研究院总经理杨廷琨与阿里云智能数据库产品事业…

Linux下的网络通信编程

在不同主机之间,进行进程间的通信。 1解决主机之间硬件的互通 2.解决主机之间软件的互通. 3.IP地址:来区分不同的主机(软件地址) 4.MAC地址:硬件地址 5.端口号:区分同一主机上的不同应用进程 网络协议…

AI数据分析:用DeepSeek做数据清洗

在当今数据驱动的时代,数据分析已成为企业和个人决策的重要工具。随着人工智能技术的快速发展,AI 驱动的数据分析工具正在改变我们处理和分析数据的方式。本文将着重介绍如何使用 DeepSeek 进行数据清洗。 数据清洗是数据分析的基础,其目的是…

把GB型材库放入solidwork中点击库无法应

1、文件夹的位置要选择对,如下图: 2、文件夹一定要嵌套三层,如下图

IP-----动态路由OSPF(2)

这只是IP的其中一块内容,IP还有更多内容可以查看IP专栏,前一章内容为动态路由OSPF ,可通过以下路径查看IP-----动态路由OSPF-CSDN博客,欢迎指正 注意!!!本部分内容较多所以分成了两部分在上一章 5.动态路…

《HelloGitHub》第 107 期

兴趣是最好的老师,HelloGitHub 让你对编程感兴趣! 简介 HelloGitHub 分享 GitHub 上有趣、入门级的开源项目。 github.com/521xueweihan/HelloGitHub 这里有实战项目、入门教程、黑科技、开源书籍、大厂开源项目等,涵盖多种编程语言 Python、…

计算机毕业设计Python+DeepSeek-R1大模型游戏推荐系统 Steam游戏推荐系统 游戏可视化 游戏数据分析(源码+文档+PPT+讲解)

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…

网络流算法: Dinic算法

图论相关帖子 基本概念图的表示: 邻接矩阵和邻接表图的遍历: 深度优先与广度优先拓扑排序图的最短路径:Dijkstra算法和Bellman-Ford算法最小生成树二分图多源最短路径强连通分量欧拉回路和汉密尔顿回路网络流算法: Edmonds-Karp算法网络流算法: Dinic算法 环境要求 本文所用…

Spring Boot 3.x 基于 Redis 实现邮箱验证码认证

文章目录 依赖配置开启 QQ 邮箱 SMTP 服务配置文件代码实现验证码服务邮件服务接口实现执行流程 依赖配置 <dependencies> <!-- Spring Boot Starter Web --> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spr…

PostgreSQL10 物理流复制实战:构建高可用数据库架构!

背景 PostgreSQL 10 在高可用架构中提供了物理复制&#xff0c;也称为流复制&#xff08;Streaming Replication&#xff09;&#xff0c;用于实现实例级别的数据同步。PostgreSQL 复制机制主要包括物理复制和逻辑复制&#xff1a;物理复制依赖 WAL 日志进行物理块级别的同步&…

从零开始开发纯血鸿蒙应用之语音朗读

从零开始开发纯血鸿蒙应用 〇、前言一、API 选型1、基本情况2、认识TextToSpeechEngine 二、功能集成实践1、改造右上角菜单2、实现语音播报功能2.1、语音引擎的获取和关闭2.2、设置待播报文本2.3、speak 目标文本2.4、设置语音回调 三、总结 〇、前言 中华汉字洋洋洒洒何其多…

奔图Pantum M7165DN黑白激光打印一体机报数据清除中…维修

故障描述: 一台奔图Pantum M7165DN黑白激光打印一体机开机自检正常,自检过后就不能工作了,按键面板无任何反应一直提示数据清除中…,如果快速操作的话也能按出菜单、功能啥的,不过一会又死机了,故障请看下图: 故障检修: 经分析可能是主板数据出现了问题,看看能不能快速…

TP-LINK路由器如何设置网段、网关和DHCP服务

目标 ①将路由器的网段由192.168.1.XXX改为192.168.5.XXX ②确认DHCP是启用的&#xff0c;并将DHCP的IP池的范围设置为排除自己要手动指定的IP地址&#xff0c;避免IP冲突。 01-复位路由器 路由器按住复位键10秒以上进行重置操作 02-进入路由器管理界面 电脑连接到路由器&…

神经网络代码入门解析

神经网络代码入门解析 import torch import matplotlib.pyplot as pltimport randomdef create_data(w, b, data_num): # 数据生成x torch.normal(0, 1, (data_num, len(w)))y torch.matmul(x, w) b # 矩阵相乘再加bnoise torch.normal(0, 0.01, y.shape) # 为y添加噪声…

TCP/IP 5层协议簇:网络层(IP数据包的格式、路由器原理)

目录 1. TCP/IP 5层协议簇 2. IP 三层包头协议 3. 路由器原理 4. 交换机和路由的对比 1. TCP/IP 5层协议簇 如下&#xff1a; 2. IP 三层包头协议 数据包如下&#xff1a;IP包头不是固定的&#xff0c;每一个数字是一个bit 其中数据部分是上层的内容&#xff0c;IP包头最…

echarts柱状图不是完全铺满容器,左右两边有空白

目录 处理前&#xff1a;echarts柱状图不是完全铺满容器&#xff0c;左右两边有空白处理前&#xff1a;通过调整 grid 组件配置处理后效果修改代码&#xff1a;1. 调整 grid 组件配置原理解决办法 2. 处理 xAxis 的 boundaryGap 属性原理解决办法 3. 调整 barMaxWidth 和 barMi…

ArcGIS Pro技巧实战:高效矢量化天地图地表覆盖图

在地理信息系统&#xff08;GIS&#xff09;领域&#xff0c;地表覆盖图的矢量化是一项至关重要的任务。天地图作为中国国家级的地理信息服务平台&#xff0c;提供了丰富且详尽的地表覆盖数据。然而&#xff0c;这些数据通常以栅格格式存在&#xff0c;不利于进行空间分析和数据…

西门子S7-1200比较指令

西门子S7-1200 PLC比较指令学习笔记 一、比较指令的作用 核心功能&#xff1a;用于比较两个数值的大小或相等性&#xff0c;结果为布尔值&#xff08;True/False&#xff09;。典型应用&#xff1a; 触发条件控制&#xff08;如温度超过阈值启动报警&#xff09;数据筛选&…

【AD】3-6 层次原理图

自上而下 1.放置-页面符号&#xff0c;并设置属性 2.放置-端口 可通过如下设置将自动生成关掉 3.放置-添加图纸入口&#xff0c;并创建图纸 自下而上 1.子图的原理图页设计 设计资原理图&#xff0c;复制网络标签&#xff0c;智能粘贴未PORT 2.新建主图原理图 创建框…

精品整理-2025 DeepSeek核心技术解析与实践资料合集(24份)

2025 DeepSeek核心技术解析与实践资料合集&#xff0c;共24份。 2025 DeepSeek 火爆背后的核心技术&#xff1a;知识蒸馏技术.pdf 2025 DeepSeek-R1详细解读&#xff1a;DeepSeek-R1-Zero和DeepSeek-R1分析.pdf 2025 DeepSeek-V3三个关键模块详细解读&#xff1a;MLAMoEMTP.pd…