数据结构与算法之(赫夫曼树,哈夫曼树,压缩软件)

news2024/12/26 15:18:50

一:思考

        1.电报发送:二战的时候大家都知道那时候普遍会应用电报,如果让你来设计一个电报的发送编码你该如何设计呢?

        2.压缩算法:给你10000个字符(每个字符1btye,也就是8bit)的文件,你怎么存储可以尽可能的节省空间呢?

        我相信大家肯定能想到的一个思路就是用某个字符来代替(映射)。比如在压缩算法里面我们可以用二进制来代替 假设字符是 a b c d 4种 那我们假定 a=000 b=001 c=010 d=100,这样我们每个字符就变成了3bit的二进制,那么10000个字符就是30000bit,比起原来的80000bit是不是缩小了很多的存储空间?

        缩小了将近3倍。

        100000001:dab Abcdaaaaaaaaa:n*3个bit位

        A:0

        B:101

        C:110

        D:100

Abcdaaaaaaaaa:010111010000000000=>abcdaaaaaa Aaa,前缀。 但是这样做的话会有一个什么问题呢?是不是还有更优的方法呢?

        问题:是否会出现解码失败?如何判断是否是某个解码字符。

        解决:哈夫曼编码,也叫前缀编码 

  二:引入最优二叉树(二叉树的带权路径长度总和最小)

        满二叉树:除了叶子节点,其他的都有两个子节点,1 2 4 8这样的节点 2^n个点

        完全二叉树:除了最底层都有两个子节点,而且叶子节点是靠左连续的

        2.1 计算下面三颗二叉树的带权路径长度总和:

        其中每个点的权重为: a:7 b:5 c:2 d:4

        WPL(a):7*2+5*2+2*2+4*2=36()

        WPL(b):7*3+5*3+2*1+4*2=46()

        WPL(c):7*1+5*2+2*3+4*3=35()

        给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。 那么这个赫夫曼树和压缩又有什么关系呢?

        二叉树:二叉,这时候你要想到二进制,二叉分左右嘛。

        左节点的边设置为0,右节点的边设置为1

 三:如何实现?(贪心算法:最优解(就是排序))

        核心思想:贪心算法:利用局部最优推出全局最优,把频率出现多的用短码表示,频率出现小的就用长一点。而且,任何一个字符的编码都不是另一个的前缀,在解压缩的时候,我们每次会读取尽可能长的可解压的二进制串,所以在解压缩的时候也不会产生歧义。

        具体实现思路:

                1.每次取数值最小的两个节点,将之组成为一颗子树。

                2.移除原来的两个点

                3.然后将组成的子树放入原来的序列中

                4.重复执行1 2 3 直到只剩最后一个点

        例子: a:3 b:24 c:6 d:20 e:34 f:4 g:12 根据以上权重来实现哈夫曼树(代码实现)

        结点数据结构:

package tree.哈夫曼;

public class HfmNode implements Comparable<HfmNode>{		//优先队列,小的我把你优先级调高
	
	String chars;		//节点里面的字符
	int fre;		//表示是频率,也是权重
	HfmNode left;
	HfmNode right;
	HfmNode parent;	//用来找上层的

	/**
	 * 用于在优先队列中比较节点的权重。
	 * @param o the object to be compared.
	 * @return
	 */
	@Override
	public int compareTo(HfmNode o) {
		return this.fre - o.fre;
	}
	
}

        哈夫曼:(实现编码,解码,生成哈夫曼)

                这里使用了一个JDK的PriorityQueue,在 Java 中,该类是 Java 集合框架的一部分,用于创建优先级队列数据结构。优先级队列是一个专用队列,其中元素根据其优先级进行排序。具有最高优先级的元素始终位于队列的前面,并且是第一个要删除的元素。

package tree.哈夫曼;

import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.PriorityQueue;

public class HuffmenTree {

	HfmNode root;
	List<HfmNode> leafs; // 叶子节点
	Map<Character, Integer> weights; // 叶子节点的权重, a,b,c,d,e

	public HuffmenTree(Map<Character, Integer> weights) {
		this.weights = weights;
		leafs = new ArrayList<HfmNode>();
	}

	public String decode(Map<Character, String> code, String encodedStr) { // 解码 不会给你们写的,留给课后作业
		StringBuilder decodedStr = new StringBuilder();
		HfmNode currentNode = root;
		for (int i = 0; i < encodedStr.length(); i++) {
			char c = encodedStr.charAt(i);
			if (c == '0') {
				currentNode = currentNode.left;
			} else if (c == '1') {
				currentNode = currentNode.right;
			}
			if (currentNode.left == null && currentNode.right == null) {
				decodedStr.append(currentNode.chars);
				currentNode = root;
			}
		}
		return decodedStr.toString();
	}

	public void encode() { // 解码 不会给你们写的,留给课后作业

	}

	// 叶子节点进行编码
	public Map<Character, String> code() {

		Map<Character, String> map = new HashMap<Character, String>();
		for (HfmNode node : leafs) {
			String code = "";
			Character c = new Character(node.chars.charAt(0)); // 叶子节点肯定只有一个字符
			HfmNode current = node; // 只有一个点
			do {
				if (current.parent != null && current == current.parent.left) { // 说明当前点是左边
					code = "0" + code;
				} else {
					code = "1" + code;
				}
				current = current.parent;
			} while (current.parent != null); // parent == null就表示到了根节点
			map.put(c, code);
			System.out.println(c + ":" + code);
		}
		return map;

	}

	public void creatTree() {
		Character keys[] = weights.keySet().toArray(new Character[0]); // 拿出所有的点
		PriorityQueue<HfmNode> priorityQueue = new PriorityQueue<HfmNode>(); // jdk底层的优先队列
		for (Character c : keys) {
			HfmNode hfmNode = new HfmNode();
			hfmNode.chars = c.toString();
			hfmNode.fre = weights.get(c); // 权重
			priorityQueue.add(hfmNode); // 首先把我们的优先队列初始化进去
			leafs.add(hfmNode);
		}

		int len = priorityQueue.size();
		for (int i = 1; i <= len - 1; i++) { // 每次找最小的两个点合并
			HfmNode n1 = priorityQueue.poll(); //
			HfmNode n2 = priorityQueue.poll(); // 每次取优先队列的前面两个 就一定是两个最小的

			HfmNode newNode = new HfmNode();
			newNode.chars = n1.chars + n2.chars; // 我们把值赋值一下,也可以不复制
			newNode.fre = n1.fre + n2.fre; // 把权重相加

			// 维护出树的结构
			newNode.left = n1;
			newNode.right = n2;
			n1.parent = newNode;
			n2.parent = newNode;

			priorityQueue.add(newNode);
		}
		root = priorityQueue.poll(); // 最后这个点就是我们的根节点
		System.out.println("构建完成");
	}

	public static void main(String[] args) {
		// a:3 b:24 c:6 d:20 e:34 f:4 g:12
		Map<Character, Integer> weights = new HashMap<Character, Integer>();
		//一般来说:动态的加密,最开始是不知道里面有什么内容的。我们需要一个密码本,往往就是某个字典。如果是英文就用英文字典,统计次数。
		//换密码本
		//静态的文件。针对性的做编码.图像加密,没有特性的。hash加密(MD5)
		weights.put('a', 3);
		weights.put('b', 24);
		weights.put('c', 6);
		weights.put('d', 1);
		weights.put('e', 34);
		weights.put('f', 4);
		weights.put('g', 12);

		HuffmenTree huffmenTree = new HuffmenTree(weights);
		huffmenTree.creatTree();
		Map<Character, String> code = huffmenTree.code();
		String str = "aceg";
		System.out.println("编码后的:");
		String decode = huffmenTree.decode(code,"00");
		System.out.println(decode);
		char s[] = str.toCharArray();
	}
/*
 a:10110
b:01
c:1010
d:00
e:11
f:10111
g:100

 * *
 */
}

        四:小结

        学完赫夫曼树,现在可以回到我们的思考题,这两个问题是不是就迎刃而解了。

        电报的设计:

                1.电报加密后越短越好,发送快。

                2.破解难

                3.解码容易

                4.换加密树也要快 、

                5.可逆的。 什么叫不可逆:MD5这样的Hash加密,简单的MD5已经破解了,穷举:很大的库。Md5(paswd)=-> 接口的密码加密 从前端传到后端我要加密这个密码,Hash函数的了。后面讲 ,数据传输的时候回来怎么办?

        所以我们现在的很多数字通信里面很多都采用了哈夫曼编码。 压缩我相信大家就更能理解了,只要你明白了哈夫曼编码这个压缩算法其实就很容易了,相信你也可以很快就能实现出来。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1004453.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++:类的六个默认成员函数

文章目录 前言一、构造函数概念特性 二、析构函数概念特性 三、拷贝构造函数概念特性 四、赋值运算符重载运算符重载赋值运算符重载 五、取地址及const取地址操作符重载const成员取地址及const取地址操作符重载 总结 个人主页 &#xff1a; 个人主页 个人专栏 &#xff1a; 《数…

项目工单管理系统有什么用?“的修”报修系统在工单管理方面的优势是什么?

项目工单管理系统主要用于管理和协调项目中的任务和活动&#xff0c;它以帮助企业在项目管理、客户服务、资源优化和团队协作等多个方面实现显著提升&#xff0c;因此被越来越多的企业所采用。 企业使用项目工单管理系统的原因主要有以下几点&#xff1a;   提升工作效率&…

JOSEF约瑟 JL-A/41DK JL-A/42DK JL-A/43DK 无辅源电流继电器 过负荷

JL-A、B DK系列无辅源电流继电器 JL-A/11DK JL-A/31DK JL-A/12DK JL-A/32DK JL-A/13DK JL-A/33DK JL-A/21DK JL-A/22DK JL-A/23DK JL-A/34DK JL-A/35DK JL-A/41DK JL-A/42DK JL-A/43DK JL-A、B/41 DK无辅源电流继电器概述 JL-A、B/41 DK无辅源电流继电器作为继电保护元…

《Web安全基础》06. 逻辑漏洞越权

web 1&#xff1a;逻辑漏洞2&#xff1a;逻辑越权3&#xff1a;修复防御方案4&#xff1a;越权问题4.1&#xff1a;商品购买4.2&#xff1a;找回重置机制4.3&#xff1a;接口安全问题4.4&#xff1a;验证安全 5&#xff1a;相关资源 本系列侧重方法论&#xff0c;各工具只是实现…

LAND 所有路者线图——2023 年 9 月更新

来自世界各地的 LAND 所有者社区&#xff0c;你们好&#xff0c;欢迎阅读我们最新的路线图更新&#xff01; 我们很高兴能回顾一下我们为实现元宇宙所做的一切努力。让我们开始吧&#xff01; 简要介绍&#xff1a; ● 社区为每个地点提供专用赋能&#xff0c;促进品牌和用户之…

【C++】结构体内存对齐规则

一、结构体内存对齐(重要) 结构体内存对齐是结构体大小的计算规则&#xff0c;是校招笔试和面试过程中一个十分热门的考点&#xff0c;希望大家认真对待。 在学习结构体内存对齐之前&#xff0c;我们先给两组计算结构体大小的题目&#xff0c;看看你能否做对&#xff1a; //…

口袋参谋:淘宝不限类目,透视竞品实时销量!快试试这个插件

​在运营一家店铺之前&#xff0c;可以先了解各类目宝贝的市场行情&#xff0c;及时掌握不同类目宝贝的价格、销售情况&#xff0c;根据需求制定出属于自己的营销策略。 【可跨类目竞店透视】功能&#xff1a; 支持一键获取任意店铺宝贝概况信息 【跨类目竞店透视】功能使用 …

WavJourney:进入音频故事情节生成世界的旅程

推荐&#xff1a;使用 NSDT场景编辑器快速搭建3D应用场景 若要正确查看音频生成的强大功能&#xff0c;请考虑以下方案。我们只需要提供一个简单的指令&#xff0c;描述场景和场景设置&#xff0c;模型就会生成一个扣人心弦的音频脚本&#xff0c;突出与原始指令的最高上下文相…

如何应对数字时代的网络安全新挑战?

随着数字时代的来临&#xff0c;我们迎来了无限的机遇&#xff0c;同时也伴随着网络安全领域新的挑战。网络攻击变得更加智能化和复杂化&#xff0c;威胁也在不断演化。为了应对这些新挑战&#xff0c;我们必须采取创新的网络安全策略和技术。本文将探讨数字时代网络安全的新挑…

Windows关闭zookeeper、rocketmq日志输出以及修改rocketmq的JVM内存占用大小

JDK-1.8zookeeper-3.4.14rocketmq-3.2.6 zookeeper 进入到zookeeper的conf目录 清空配置文件&#xff0c;只保留下面这一行。zookeeper关闭日志输出相对简单。 log4j.rootLoggerOFFrocketmq 进入到rocketmq的conf目录 logback_broker.xml <?xml version"1.0&q…

电脑c盘满了怎么清理?最新方法分享!(2023版)

“电脑c盘满了真的太恐怖了&#xff01;我平常没有什么清理的习惯&#xff0c;但是今天用电脑的时候&#xff0c;电脑变得异常卡顿。一看才发现是c盘满了&#xff01;但是我电脑中太多重要文件了&#xff0c;有什么比较简单又不容易误删文件的c盘清理方法推荐吗&#xff1f;” …

0门槛限制!快来领取你的专属元宇宙虚拟展厅!

数字化时代中&#xff0c;元宇宙虚拟展厅仿佛成为了一种新的潮流&#xff0c;虚拟展厅的出现为我们呈现出了一个超越现实的全新世界。元宇宙虚拟展厅以其多样性、互动性、沉浸式展示为特点&#xff0c;同产品进行交互&#xff0c;创造出逼真的虚拟环境&#xff0c;为广大用户打…

c++结构体调用类的构造函数

结构体初始化会调用构造函数 using namespace std;class cls{ public:cls(){c 5;cout << "cls init" << endl;};int c; };struct s{s(){cout << a << endl;cout << b.c << endl;};int a;cls b; };int main(){s s1; }结构体构造…

无涯教程-JavaScript - DB函数

描述 DB函数使用固定余额递减法返回指定期间内资产的折旧。 语法 DB (cost, salvage, life, period, [month])争论 Argument描述Required/OptionalCostThe initial cost of the asset.RequiredSalvageThe value at the end of the depreciation (sometimes called the salv…

docker搭建redis哨兵集群和分片集群

搭建哨兵集群 环境准备拉取镜像 搭建目标 &#xff1a; 一主而从三哨兵集群 docker pull redis:6.2.6 创建文件夹及配置文件 我这里在/usr/local/docker/redis目录下 在 redis-master、redis-slave1、redis-slave2 下分别建立data、 redis.conf、 sentinel.conf redis配置文件…

mysql5.8 免安装版(压缩包)win10 安装

目录 1、下载MySQL5.82、如何安装、配置my.ini配置注意 3初始化mysql3.1. 初始化mysql3.2. 安装mysql服务3.3. 启动mysql3.4. 登录mysql3.5. 修改root密码3.6. 配置远程连接 Mysql5.8安装踩坑记录&#xff0c;推荐使用Docker安装&#xff0c;我是电脑虚拟化可能会蓝屏没用这个功…

vue3+ts+uniapp小程序封装获取授权hook函数

vue3tsuniapp小程序封装获取授权hook函数 小程序授权的时候&#xff0c;如果点击拒绝授权&#xff0c;然后就再也不会出现授权了&#xff0c;除非用户手动去右上角…设置打开 通过uni官方api自己封装一个全局的提示: uni.getSetting :http://uniapp.dcloud.io/api/other/settin…

【Mysql系列】mysql中删除数据的几种方法

写在前面 在MySQL数据库中&#xff0c;删除数据是一个常见的操作&#xff0c;它允许从表中移除不再需要的数据。在执行删除操作时&#xff0c;需要谨慎&#xff0c;以免误删重要数据。 方法介绍 以下是MySQL中删除数据的几种方法&#xff1a; DELETE语句DROP TABLE语句TRUNCAT…

【紫光同创国产FPGA教程】——【PGL22G第八章】HDMI输出彩条实验例程

本原创教程由深圳市小眼睛科技有限公司创作&#xff0c;版权归本公司所有&#xff0c;如需转载&#xff0c;需授权并注明出处 适用于板卡型号&#xff1a; 紫光同创PGL22G开发平台&#xff08;盘古22K&#xff09; 一&#xff1a;盘古22K开发板&#xff08;紫光同创PGL22G开…

数据结构与算法基础-学习-34-基数排序(桶排序)

目录 一、基本思想 二、算法思路 1、个位排序 &#xff08;1&#xff09;分配 &#xff08;2&#xff09;收集 2、十分位排序 &#xff08;1&#xff09;分配 &#xff08;2&#xff09;收集 三、源码分享 1、InitMyBucket 2、DestroyMyBucket 3、ClearMyBucket 4、…