数据结构—基础知识(16):哈夫曼编码
哈夫曼编码的主要思想
在进行数据压缩时,为了使压缩后的数据文件尽可能短,可采用不定长编码。其基本思想是:为出现次数较多的字符编以较短的编码。为确保对数据文件进行有效的压缩文件和对压缩文件进行正确的解码,可以利用哈夫曼树来设计二进制编码。
有关编码的概念
- 前缀编码:如果在一个编码方案中,任一个编码都不是其他任何编码的前缀(最左子串),则称编码是前缀编码。
- 哈夫曼编码:对一棵具有n个叶子的哈夫曼树,若对树中的每个左分支赋予0,右分支赋予1,则从根到每个叶子的路径上,各分支的赋值分别构成一个二进制串,该二进制串就称为哈夫曼编码。
哈夫曼编码满足两个性质:
性质1:哈夫曼编码是前缀编码。
性质2:哈夫曼编码是最优前缀编码。
例题:假设用于通信的电文仅由8个字母组成,字母在电文中出现的频率分别为7,19,2,6,32,3,21,10,试为这8个字母设计哈夫曼编码
字母编码 | 出现频率 | 哈夫曼编码 |
---|---|---|
1 | 7 | 1100 |
2 | 19 | 00 |
3 | 2 | 11110 |
4 | 6 | 1110 |
5 | 32 | 10 |
6 | 3 | 11111 |
7 | 21 | 01 |
8 | 10 | 1101 |