带权路径长度:
结点的权
有某种现实含义的数值(如表示结点的重要性等)
结点的带权路径长度
从树的根到该结点的路径长度(经过的边数)与该结点上权值的乘积
树的带权路径长度
树中所有的叶结点的带权路径长度之和(WPL,Weighted Path Length)
哈夫曼树的定义:
在含有n个带权叶结点的二叉树中,其中带权路径长度(WPL)最小的二叉树称为哈夫曼树,也称最优二叉树
哈夫曼树的构造
哈夫曼树的特点:
- 每个初始结点最终都成为叶结点,且权值越小的结点到根结点的路径长度越大
- 哈夫曼树的结点总数为2n-1
- 哈夫曼树中不存在度为1的结点
- 哈夫曼树并不唯一,单WPL必然相同且为最优
例;
哈夫曼编码:
固定长度编码——每个字符用相等长度的二进制位表示
可变长度编码——允许对不同字符用不等长的二进制位表示
若没有一个编码是另一个编码的前缀,则称这样的编码为前缀编码
由哈夫曼树得到哈夫曼编码——字符集中的每个字符作为一个叶子结点,各个字符出现的频度作为结点的权值,根据之前介绍的方法构造哈夫曼树
注:哈夫曼树不唯一,故哈夫曼编码也不唯一
哈夫曼编码的作用:数据压缩
例题:用哈夫曼编码求最简化abcd字符传递
练习题:
总结: