十二、树结构的实际应用—赫夫曼树

news2025/1/11 7:50:46

1、赫夫曼树

1.1 基本介绍

  • 给定 n 个权值作为 n 个叶子节点,构造一棵二叉树,若该树的带权路径长度(wpl)达到最小,称这样的二叉树为最优二叉树,也称哈夫曼树(Huffman Tree),有的翻译为霍夫曼树、赫夫曼树
  • 赫夫曼树是带权路径长度最短的树,权值较大的节点离根节点较近

1.2 重要概念

  • 路径和路径长度:在一棵树中,从一个节点往下可以达到的孩子或者孙子节点之间的通路,称为路径。通路中分支的数目称为路径长度。若规定根节点的层数为1,则从根节点到第 L 层节点的路径长度为 L-1
  • 节点的权及带权路径长度:若将树中节点赋给一个有着某种含义的数值,则这个数值称为该节点的权。节点的带权路径长度为:从根节点到该节点之间的路径长度与该节点的权的乘积
  • 树的带权路径长度:树的带权路径长度规定为所有叶子节点的带权路径长度之和,记为 WPL(Weighted Path Length)。权值越大的节点离根节点越近的二叉树才是最优二叉树

下面是一些 WPL 计算的例子:(长度为59的是最优二叉树)
在这里插入图片描述

1.3 赫夫曼树构建思路图解

要求:给你一个数列 {13, 7, 8, 29, 6, 1} ,要求转化为一颗赫夫曼树

构成赫夫曼树的步骤:

  • 将数列从小到大进行排序,每个数据都是一个节点,每个节点可以看成是一棵最简单的二叉树
  • 取出根节点权值最小的两棵二叉树
  • 组成一棵新的二叉树,该新的二叉树的根节点的权值是前面两棵二叉树根节点的权值和
  • 再将这棵新的二叉树。以根节点的权值大小,再次排序,不断重复这四个步骤(上面三个+当前一个),直到数列中所有的数据都被处理,就得到了一颗赫夫曼树

下面是示意图:
在这里插入图片描述

1.4 赫夫曼树代码实现

public class HuffmanTreeDemo {

	public static void main(String[] args) {
		 int arr[]=new int[]{13,7,8,3,29,6,1};
		 Node root = createHuffmanTree(arr);
		 preSort(root);
	}
	
	public static void preSort(Node root) {
		if (root != null) {
			root.preSort();
		}else {
			 System.out.println("该赫夫曼树是空树");
		}
	}
	
	public static Node createHuffmanTree(int[] arr) {
		//第一步:为了操作方便:
		/**
		 * 1、遍历arr数组
		 * 2、将arr的每个元素构建成一个Node
		 * 3、将Node放到ArrayList中
		 */
		List<Node> nodes = new ArrayList<Node>();
		for (int value : arr) {
			nodes.add(new Node(value));
		}
		
		while (nodes.size() > 1) {//这个主要是因为nodes一直在remove,到最后就剩一个节点。
			Collections.sort(nodes);
			
			//取出根节点权值最小的两个二叉树
            //(1)取出权值最小的节点(二叉树),一个节点也可以看作是一个最简单的二叉树
			Node leftNode = nodes.get(0);
			 //(2)取出权值第二小的节点(二叉树)
			Node rightNode = nodes.get(1);
			 //(3)构建一个新的二叉树
			Node parent = new Node(leftNode.value + rightNode.value);//左右节点权值的加和才是父节点
			parent.left = leftNode;
			parent.right = rightNode;
			 //(4)从ArrayList中删除处理过的二叉树
			nodes.remove(leftNode);
			nodes.remove(rightNode);
			//(5)将parent加入nodes
			nodes.add(parent);
		}
		
		  //返回哈夫曼树的root节点,其实最后也就剩一个节点了
        return nodes.get(0);

	}

}

class Node implements Comparable<Node>{
	
	int value; //节点权值
	Node left; //指向左子节点
	Node right; //指向右子节点
	
	public Node(int value) {
		this.value = value;
	}
	
	@Override
	public String toString() {
		return "Node [value=" + value + "]";
	}

	public void preSort() {
		System.out.println(this);
		if (this.left != null) {
			this.left.preSort();
		}
		if (this.right != null) {
			this.right.preSort();
		}
	}

	@Override
	public int compareTo(Node o) {
		// 从小到大排序
		return this.value - o.value;
	}
	
}

2、赫夫曼编码

2.1 基本介绍

  • 赫夫曼编码也翻译为哈夫曼编码(Huffman Coding),又称霍夫曼编码,是一种编码方式,属于一种程序算法
  • 赫夫曼编码是哈夫曼树在电讯通信中的经典的应用之一
  • 赫夫曼编码广泛地用于数据文件压缩。其压缩率通常在20%~90%之间
  • 赫夫曼编码是可变字长编码(VLC)地一种,Huffman 于 1952 年提出一种编码方法,称之为最佳编码

2.2 原理剖析

通信领域中信息地处理方式1:定长编码
[参考ASCII码表]
在这里插入图片描述
通信领域中信息地处理方式2:变长编码
在这里插入图片描述
通信领域中信息地处理方式3:赫夫曼编码
在这里插入图片描述
最后得到的赫夫曼树为:
在这里插入图片描述
在这里插入图片描述
此编码需满足前缀编码,即字符的编码都不能是其他字符编码的前缀。不然会造成匹配的多义性,赫夫曼编码是无损处理方案。
注意,这个赫夫曼树根据排序方法不同,也可能不太一样,这样对应赫夫曼编码也不完全一样,但是 WPL 是一样的,都是最小的,最后生成的赫夫曼编码的长度是一样的,

2.3 最佳实践:数据压缩

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/196420.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java工厂模式

定义&#xff1a;将创建对象的权利交给工厂类实现&#xff0c;解耦对象使用者和对象创建过程。 工厂模式有三种&#xff1a; 1、简单工厂模式 2、工厂方法模式 3、抽象工厂模式 使用工厂模式作用&#xff1a; 1、客户类和对象之间的耦合关系转移到了工厂方法和对象之间 …

pl/sql篇之變量的定義

簡述本篇文章主要介紹pl/sql的變量的簡單數據類型&#xff0c;複雜數據類型定義和調用方法&#xff0c;希望能對讀者有些許作用數據類型介紹變量的定義和調用在pl/sql中&#xff0c;定義的變量在聲明之後&#xff0c;可以直接在後續的sql調用&#xff0c;使用上非常方便簡單數據…

图解 MySQL MVCC 实现原理

文章目录MVCC 产生背景InnoDB 引擎表的隐藏列Undo 回滚版本链一致性视图MVCC 实现原理举例说明 MVCC 实现过程MVCC 产生背景 最早的数据库系统,只有读读之间可以并发,读写,写读,写写之间都要阻塞。而 MVCC (Muti Version Concurrency Control) , 是一种多版本并发控制机制。在…

Pandas+Pyecharts | 全国吃穿住行消费排行榜,最‘抠门’的地区居然是北京!!!

文章目录&#x1f3f3;️‍&#x1f308; 1. 导入模块&#x1f3f3;️‍&#x1f308; 2. Pandas数据处理2.1 读取数据2.2 计算各项占比&#x1f3f3;️‍&#x1f308; 3. Pyecharts数据可视化3.1 全国各地区人均收入、消费支出排行榜3.2 全国各地区人均可支配收入地图3.3 全国…

HCIA之ARP协议

ARP协议1、原理2、ARP工作过程3、ARP分类1、原理 根据已知的地址来获取与其对应的另一种地址 2、ARP工作过程 目标MAC全F&#xff0c;对于交换机&#xff0c;会洪泛&#xff1b;对于所有主机&#xff0c;都会以为是找自己的。 发送者PC1&#xff1a;发出广播帧&#xff0c;源I…

大型CRM客户管理系统带小程序、H5 java源码(spring boot 后台 前端vue)

功能介绍 1、系统管理&#xff1a;员工管理、角色管理、菜单管理、部门管理、岗位管理、字典管理、参数设置、日志管理 2、系统监控&#xff1a;在线用户、定时任务、数据监控、服务监控 3、系统工具&#xff1a;表单构建、代码生成、系统接口 4、平台配置&#xff1a;配置…

python - 密码加密与解密

Python之密码加密与解密 - 对称算法一、对称加密1.1 安装第三方库 - PyCrypto1.2 加密实现二、非对称加密三、摘要算法3.1 md5加密3.2 sha1加密3.3 sha256加密3.4 sha384加密3.5 sha512加密3.6 “加盐”加密由于计算机软件的非法复制&#xff0c;通信的泄密、数据安全受到威胁。…

车载音频系统方案的组合设计

现代数学可以分为两大类:一类是研究连续对象的,如分析学、方程等,另一类就是研究离散对象的数学。 有人认为广义的组合数学就是离散数学,也有人认为离散数学是狭义的组合数学和图论、代数结构、数理逻辑等的总称。但这只是不同学者在叫法上的区别,随着计算机科学的日益发…

实现支付宝网站登录

不推荐使用沙箱环境&#xff0c;因为问题太多&#xff0c;如果使用沙箱环境请注意一下几点 alipay.user.info.auth&#xff08;用户登录授权接口&#xff09;的 return_url 必传&#xff0c;建议检查是否设置 return_url。return_url 与应用中的授权回调地址一致。再换沙箱环境…

图解最常用的 10 个机器学习算法

在机器学习领域&#xff0c;有种说法叫做“世上没有免费的午餐”&#xff0c;简而言之&#xff0c;它是指没有任何一种算法能在每个问题上都能有最好的效果&#xff0c;这个理论在监督学习方面体现得尤为重要。 举个例子来说&#xff0c;你不能说神经网络永远比决策树好&#…

5.4 单管放大电路的频率响应

一、单管共射放大电路的频率响应 考虑到耦合电容和结电容的影响&#xff0c;图5.4.1(a)所示电路的等效电路如图(b)所示。在分析放大电路的频率响应时&#xff0c;为了方便起见&#xff0c;一般将输入信号的频率范围分为中频、低频和高频三个频段。在中频段&#xff0c;极间电容…

Win10系统打开控制面板出现闪退怎么回事?

Win10系统打开控制面板出现闪退怎么回事&#xff1f;有用户开启自己电脑的控制面板时&#xff0c;突然间页面初选了闪退的情况&#xff0c;导致无法进行相关设置的操作。那么我们怎么去进行控制面板闪退问题的解决呢&#xff1f;一起来看看以下的解决方法吧。 解决方法 1、更换…

Python | 文件操作和异常处理

博主简介&#x1f647;&#xff1a;&#x1f393;本科大二学生&#x1f393;&#xff0c;立志成为一名全栈开发工程师&#x1f38f;&#x1f38f;分类专栏&#x1f4d8;&#xff1a;Python从入门到精通&#x1f33b;&#x1f33b; 知识目录一、文件操作1.1 打开和关闭文件1.2 读…

如何使用TCPA300电流放大器和电流探头进行电流测试

为了进行正确电流测试&#xff0c;工程师需要在使用前对电流探头进行消磁和校零调节&#xff0c;消磁可以消除电流探头的寄生磁场&#xff0c;否则会产生零点的漂移和测量误差&#xff0c;每次进行消磁后&#xff0c;都需要调节探头的零点&#xff0c;消除存在的偏移。电流探头…

垃圾桶溢出识别系统 opencv

垃圾桶溢出识别系统通过Opencvyolo网络模型深度学习技术&#xff0c;对垃圾桶垃圾溢出行为现象进行识别&#xff0c;监测到垃圾桶存在垃圾溢出时&#xff0c;立即抓拍存档 告警及时清理。OpenCV基于C实现&#xff0c;同时提供python, Ruby, Matlab等语言的接口。OpenCV-Python是…

JGroups介绍及入门实战

我们在开发集群系统的过程中&#xff0c;往往需要在多个进程间同步很多状态&#xff0c;比如每个服务器进程的负载状况、数据队列长度等等……。还有一些情况&#xff0c;我们需要把不同的进程分类&#xff0c;然后分发不同的通知消息&#xff0c;最常见的是发出一些运维命令&a…

「YGG Japan」宣布已完成约 295 万美元的新股权私募

ForN&#xff08;总部位于东京都港区&#xff1b;CEO 藤原哲哉&#xff1b;以下简称 “ForN” &#xff09;今天宣布&#xff0c;与 ForN 合作的区块链游戏平台 YGG Japan 已完成价值约 295 万美元的私募轮融资&#xff0c;投资方共有 18 家公司。加上本轮融资&#xff0c;YGG …

多种汉语方言语音落地应用,微软智能语音解锁更多交互场景

多年来&#xff0c;微软持续探索 AI 语音合成与识别技术&#xff0c;获得了大量成果&#xff1a;Azure Neural TTS&#xff08;text-to-speech&#xff0c;语音合成&#xff09;与 STT&#xff08;speech-to-text&#xff0c;语音识别&#xff09;支持的语言区域达到 140 余个&…

GItOps - k8s的微服务实战1 - 构建业务镜像

概述 在学习了容器化、docker和k8s的 Ingress-Nginx 、server 和pod 知识后&#xff0c;开启了 k8s的微服务实战第三篇&#xff0c;在搭建环境废了一点周折&#xff0c;这次实战的目的是集成在gitlab里&#xff0c;实现自动打包、发布的功能。 Mac M2芯 搭建k8s(minikube)超详…

puzzle(0332)色块拼图、物换星移、移星掠形

目录 一&#xff0c;纯色块拼图——旋转 二&#xff0c;物换星移 三&#xff0c;六边形纯色块拼图——旋转 四&#xff0c;纯色块拼图——轮换 五&#xff0c;移星掠形 练习模式 策略 比赛模式 一&#xff0c;纯色块拼图——旋转 这种纯粹就是数字拼图——旋转的简化版…