霍夫曼树:霍夫曼编码(Huffman Tree:Huffman Coding)

news2025/1/12 16:13:07

预计阅读时间:10分钟

一、简介

        霍夫曼树常处理符号编写工作。根据整组数据中符号出现的频率高低,决定如何给符号编码。如果符号出现的频率越高,则给符号的码越短,相反符号的号码越长。

相关术语

路径:从书中一个节点到另一个节点之间的分支构成这两个节点的路径。

路径长度:即路径上有多少个分支。

树的路径长度:从树根到每一个节点的路径长度之和。

带权路径长度:从根节点到叶子节点的路程长度与该节点权值的积。

树的带权路径长度:树中所有带权叶子节点的路径长度之和。

        霍夫曼编码就是再霍夫曼树上进行实现的。

        从树根开始,从待译电文中逐个取码。若编码为0,就往左走;编码为1,就往右走,一旦到达了叶子节点,就是译出了一个字符;在从根出发,直到电文结束。 

图1

T:00 ;:00 A:10 C:110 S:111

参考图1:

电文是{CAS;CAT;SAT;AT}

编码就是11010111011101000011111000011000

电文如果是1101000

译文就是CAT

        假设我们要给一个英文单字"FORGET"进行霍夫曼编码。

演算过程

(一)进行编码前,要先创建一个霍夫曼树。

⒈将每个英文字母依照出现频率由小排到大,最小在左,如Fig.1;

⒉每个字母都代表一个终端节点(叶节点),比较F.O.R.G.E.T六个字母中每个字母的出现频率,将最小的两个字母频率相加合成一个新的节点。如Fig.2所示,发现FO的频率最小,故相加2+3=5;

⒊比较5.R.G.E.T,发现RG的频率最小,故相加4+4=8;

⒋比较5.8.E.T,发现5E的频率最小,故相加5+5=10;

⒌比较8.10.T,发现8T的频率最小,故相加8+7=15;

⒍最后剩10.15,没有可以比较的对象,相加10+15=25。

最后产生的树状图就是霍夫曼树。

(二)进行编码

1.给霍夫曼树的所有左链接'0'与右链接'1';

2.从树根至树叶依序记录所有字母的编码。

二、代码实现 

#include <bits/stdc++.h>
using namespace std;
//霍夫曼树的结构
typedef struct
{
    //叶子结点权值
    unsigned int weight;
    //指向双亲,和孩子结点的指针
    unsigned int parent;
    unsigned int lChild;
    unsigned int rChild;
}Node,*HuffmanTree;
//动态分配数组,存储哈夫曼编码
typedef char *HuffmanCode;
//选择两个parent为0,且weight最小的结点s1和s2的方法实现
//n 为叶子结点的总数,s1和 s2两个指针参数指向要选取出来的两个权值最小的结点
void select(HuffmanTree *huffmanTree,int n,int *s1,int *s2)
{
    //标记i
    int i=0;
    //记录最小权值
    int min;
    //遍历全部结点,找出单节点
    for(i=1; i<=n; i++)
    {
        //如果此结点的父亲没有,那么把结点号赋值给 min,跳出循环
        if((*huffmanTree)[i].parent==0)
        {
            min=i;
            break;
        }
    }
    //继续遍历全部结点,找出权值最小的单节点
    for(i=1; i<=n; i++)
    {
        //如果此结点的父亲为空,则进入 if
        if((*huffmanTree)[i].parent==0)
        {
            //如果此结点的权值比 min 结点的权值小,那么更新 min 结点,否则就是最开始的 min
            if((*huffmanTree)[i].weight<(*huffmanTree)[min].weight)
            {
               min=i;
            }
        }
    }
    //找到了最小权值的结点,s1指向
    *s1=min;
    //遍历全部结点
    for(i=1; i<=n; i++)
    {
        //找出下一个单节点,且没有被 s1指向,那么i 赋值给 min,跳出循环
        if((*huffmanTree)[i].parent==0&&i!=(*s1))
        {
            min=i;
            break;
        }
    }
    //继续遍历全部结点,找到权值最小的那一个
    for(i=1; i<=n; i++)
    {
        if((*huffmanTree)[i].parent==0&&i!=(*s1))
        {
            //如果此结点的权值比 min 结点的权值小,那么更新 min 结点,否则就是最开始的 min
            if((*huffmanTree)[i].weight<(*huffmanTree)[min].weight)
            {
                 min=i;
            }
        }
    }
    //s2指针指向第二个权值最小的叶子结点
    *s2=min;
}
//创建霍夫曼树并求霍夫曼编码的算法如下,w数组存放已知的n个权值
void createHuffmanTree(HuffmanTree *huffmanTree, int w[], int n)
{
    //m为哈夫曼树总共的结点数,n为叶子结点数
    int m=2*n-1;
    //s1和s2为两个当前结点里,要选取的最小权值的结点
    int s1;
    int s2;
    //标记
    int i;
    //创建哈夫曼树的结点所需的空间,m+1,代表其中包含一个头结点
    *huffmanTree=(HuffmanTree)malloc((m+1)*sizeof(Node));
    //1--n号存放叶子结点,初始化叶子结点,结构数组来初始化每个叶子结点,初始的时候看做一个个单个结点的二叉树
    for(i=1; i<=n; i++)
    {
        //其中叶子结点的权值是 w[n]数组来保存
        (*huffmanTree)[i].weight=w[i];
        //初始化叶子结点(单个结点二叉树)的孩子和双亲,单个结点,也就是没有孩子和双亲,==0
        (*huffmanTree)[i].lChild=0;
        (*huffmanTree)[i].parent=0;
        (*huffmanTree)[i].rChild=0;
    }
    //非叶子结点的初始化
    for(i=n+1; i<=m; i++)
    {
        (*huffmanTree)[i].weight=0;
        (*huffmanTree)[i].lChild=0;
        (*huffmanTree)[i].parent=0;
        (*huffmanTree)[i].rChild=0;
    }
    printf("\n HuffmanTree: \n");
    //创建非叶子结点,建哈夫曼树
    for(i=n+1; i<=m; i++)
    {
        //在(*huffmanTree)[1]~(*huffmanTree)[i-1]的范围内选择两个parent为0
        //且weight最小的结点,其序号分别赋值给s1、s2
        select(huffmanTree,i-1,&s1,&s2);
        //选出的两个权值最小的叶子结点,组成一个新的二叉树,根为 i 结点
        (*huffmanTree)[s1].parent=i;
        (*huffmanTree)[s2].parent=i;
        (*huffmanTree)[i].lChild=s1;
        (*huffmanTree)[i].rChild=s2;
        //新的结点i的权值
        (*huffmanTree)[i].weight=(*huffmanTree)[s1].weight + (*huffmanTree)[s2].weight;
        printf("%d (%d, %d)\n",(*huffmanTree)[i].weight,(*huffmanTree)[s1].weight,(*huffmanTree)[s2].weight);
    }   
    printf("\n");
}
//哈夫曼树建立完毕,从 n 个叶子结点到根,逆向求每个叶子结点对应的哈夫曼编码
void creatHuffmanCode(HuffmanTree *huffmanTree, HuffmanCode *huffmanCode, int n)
{
    //指示biaoji
    int i;
    //编码的起始指针
    int start;
    //指向当前结点的父节点
    int p;
    //遍历 n 个叶子结点的指示标记 c
    unsigned int c;
    //分配n个编码的头指针
    huffmanCode=(HuffmanCode *)malloc((n+1) * sizeof(char *));
    //分配求当前编码的工作空间
    char *cd = (char *)malloc(n * sizeof(char));
    //从右向左逐位存放编码,首先存放编码结束符
    cd[n-1] = '\0';
    //求n个叶子结点对应的哈夫曼编码
    for(i = 1; i <= n; i++)
    {
        //初始化编码起始指针
        start = n - 1;
        //从叶子到根结点求编码
        for(c = i, p = (*huffmanTree)[i].parent; p != 0; c = p, p = (*huffmanTree)[p].parent)
        {
            if( (*huffmanTree)[p].lChild == c)
            {
                //从右到左的顺序编码入数组内
                 cd[--start] = '0';  //左分支标0
            }
            else
            {
                cd[--start] = '1';  //右分支标1
            }
        }// end of for
        //为第i个编码分配空间
        huffmanCode[i] = (char *)malloc((n - start) * sizeof(char));
        strcpy(huffmanCode[i], &cd[start]);
    }
    free(cd);
    //打印编码序列
    for(i=1; i<=n; i++)
    {
         printf("HuffmanCode of %3d is %s\n", (*huffmanTree)[i].weight, huffmanCode[i]);
    }
    printf("\n");
}
int main()
{
    HuffmanTree HT;
    HuffmanCode HC;
    int *w,i,n,wei,m;
    printf("\nn = " );
    scanf("%d",&n);
    w=(int *)malloc((n+1)*sizeof(int));
    printf("\ninput the %d element's weight:\n",n);
    for(i=1; i<=n; i++)
    {
        printf("%d: ",i);
        fflush(stdin);
        scanf("%d",&wei);
        w[i]=wei;
    }
    createHuffmanTree(&HT, w, n);
    creatHuffmanCode(&HT,&HC,n);
    return 0;
}

参考文献:

【C++】霍夫曼树与编码(原理详细&代码注释)_米莱虾的博客-CSDN博客哈夫曼树(最优二叉树)❥分享大一所做笔记❥知识点解析WPL:树的所有叶结点的带权路径长度之和,称为树的带权路径长度表示为WPL不带权值的话,完全(满)二叉树的路径长度最小最优二叉树 != 最佳判定树权值相等或不存在的话,最优二叉树就是完全二叉树代码(注释详细)#include <bits/stdc++.h>using namespace std;//haffman 树的结构ty...https://blog.csdn.net/Luoxiaobaia/article/details/122460555以上就是本文的全部内容啦!感谢阅读!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/60275.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Docker安装可视化管理器Portainer

Docker安装可视化管理器Portainer Portainer 提供状态显示面板、应用模板快速部署、容器镜像网络数据卷的基本操作&#xff08;包括上传下载镜像&#xff0c;创建容器等操作&#xff09;、事件日志显示、容器控制台操作、Swarm 集群和服务等集中管理和操作、登录用户管理和控制…

Linux/Windows Redis的下载与安装

Redis简介 参考视频教程: https://www.bilibili.com/video/BV13a411q753?p143 Redis下载与安装 Windows版 下载地址: https://github.com/microsoftarchive/redis/releases Linux版下载地址: https://download.redis.io/releases/ 1. Window版本 1.1 redis下载 官网下载…

用ACL实现防火墙功能

目录 实验目的&#xff1a; 实验所需软硬件 实验步骤&#xff1a; 1、按以下拓扑接好线路。 2、配置好设备的IP地址和静态路由&#xff0c;使得所有设备可以互通。&#xff08;配置截图&#xff09; PC2 PC0 Router0 Router1​编辑 Server 3、测试各PC/服务器互联状…

基于KubeSphere图形编辑面板构建微服务项目的DevOps 系统

文章目录相关文章部署过程准备工作创建 DevOps 项目创建凭证创建流水线编辑流水线JAVA后端微服务拉取源码构建源码构建镜像推送镜像部署项目VUE前端拉取源码构建源码构建镜像推送镜像部署项目运行流水线查看流水线详情完整流水线脚本微服务后端VUE前端参考相关文章 kubernetes…

Grafana+Prometheus打造运维监控系统(一)-安装篇

1. Prometheus、Grafana介绍 Prometheus是一个开源的系统监控和报警系统&#xff0c;Grafana 是一个开源的监控数据分析和可视化套件&#xff0c;利用GrafanaPrometheus组合&#xff0c;打造运维日常的各种指标监控以及数据可视化。 2. Prometheus 2.1 下载 访问&#xff1…

专利-分析方法总结

目录 一、专利分析的意义 二、专利分析的方法&#xff1a; 2.1、行业专利信息分析 2.1.1、专利技术发展趋势分析 2.1.2、专利区域分布分析 2.1.3、专利相关人分析 2.1.4、专利技术主题分析 2.1.5、技术发展路线分析 2.1.6、专利技术功效分析 2.1.7、专利运营分析 3.…

node环境的搭建

一、node的安装&#xff08;可以去文末直接安装nvm管理器&#xff0c;就不用配置了&#xff09; 1 下载 | Node.js,也可以下载以往版本,window是以msi结尾的文件 2 安装,直接一直安装就行,如果有之前安装的版本,先进行卸载,然后再进行安装 3 安装完成后查看版本号 node -vnp…

Linux下文件目录权限管理chmod, chown, chgrp,umask命令使用总结

在Linux系统下常用的文件目录权限管理命令有chmod, chown, chgrp,umask&#xff0c;一直以来都在用&#xff0c;但是没有太注意它们的区别&#xff0c;今天就在这篇文章做个总结。 目录 1. chmod 2. chown 3. chgrp 4. umask 1. chmod 作用&#xff1a;修改某个目录或文件…

C语言实现学生管理系统(顺序表版)

前言 设计知识 使用语言&#xff1a;C语言 数据结构类型&#xff1a;顺序表 内容导图 效果展示 内容目录前言设计知识内容导图效果展示静态管理系统菜单的实现选择功能实现静态开辟空间实现增删功能增加功能实现删除功能实现实现查找功能实现修改功能实现排序功能动态管理系…

rollup打包工具快速入门

0.开始 教学视频出处 https://www.bilibili.com/video/BV1w84y1z77V?p3&spm_id_frompageDriver&vd_source0f7f337dd5a99bb975b88a48ae1b3711 日期&#xff1a;2022/12/3 rollup目前版本&#xff1a; "rollup": "^3.5.1"1.rollup概述 官网 http…

N32G45之串口+DMA数据收发

N32G45之串口DMA数据收发 1.串口简介   通用同步异步收发器(USART)提供了一种灵活的方法与使用工业标准NRZ异步串行数据格式的外部设备之间进行全双工数据交换。 USART利用分数波特率发生器提供宽范围的波特率选择。它支持同步单向通信和半双工单线通信&#xff0c;也支持LI…

【云原生】nacos权限制认证

鉴权 服务端如何开启鉴权 非Docker环境 按照官方文档配置启动,默认是不需要登录的&#xff0c;这样会导致配置中心对外直接暴露。而启用鉴权之后&#xff0c;需要在使用用户名和密码登录之后&#xff0c;才能正常使用nacos。 开启鉴权之前&#xff0c;application.properti…

0115 查找算法Day4

剑指 Offer 03. 数组中重复的数字 在一个长度为 n 的数组 nums 里的所有数字都在 0&#xff5e;n-1 的范围内。数组中某些数字是重复的&#xff0c;但不知道有几个数字重复了&#xff0c;也不知道每个数字重复了几次。请找出数组中任意一个重复的数字。 示例 1&#xff1a; …

Linux-CPU之平均负载

一般我们觉得系统变慢了&#xff0c;都会执行 top 或者 uptime 命令&#xff0c;来了解系统的负载情况。 uptime11:29:06 up 0 min, 2 users, load average: 1.21, 0.29, 0.10// 当前时间 // 系统运行时间 // 正在登录用户数 //1 分钟、5 分钟、15 分钟的平均负载概念&…

补知识点:Stream API

一、创建Stream 首先创建Stream的话&#xff0c;有四种创建方式&#xff1a; 注&#xff1a; 第一种集合的方式是最常用的 package com.atguigu.gulimall.gateway;import com.atguigu.gulimall.streamapi.Employee; import com.atguigu.gulimall.streamapi.EmployeeData; impo…

【应用】Docker

DockerDocker 的安装基本安装流程配置镜像加速Docker 常用命令镜像相关命令容器相关命令DockerfileDockerfile 常用指令Dockerfile 简单使用案例Dockerfile 构建 java 项目镜像Docker ComposeDocker compose 基本参数services 配置参数Docker 的安装 基本安装流程 使用虚拟机…

Linux JDK8下载安装

JDK安装 整体步骤介绍 操作步骤: 1 查看自己linux版本位 getconf LONG_BIT(64位) 2. 下载jdk的安装包 这里提供三种方法下载: (以jdk-8u171-linux-x64.tar.gz为例) 2.1 官网下载jdk: 官网: https://www.oracle.com/downloads/ jdk最新版本下载: https://www.oracle.com…

带你玩转序列模型之seq2seq模型定向(集束)搜索

目录 一.基础模型 二.选择最可能的句子 三.定向搜索 四.改进定向搜索 五.定向搜索的误差分析 一.基础模型 在这一周&#xff0c;你将会学习seq2seq&#xff08;sequence to sequence&#xff09;模型&#xff0c;从机器翻译到语音识别&#xff0c;它们都能起到很大的作用…

【数据结构1】数据结构的基本概念

数据结构的基本概念 数据&#xff1a;数据是信息的载体&#xff0c;是描述客观事物属性的数、字符及所有能输入到计算机中并被计算机程序识别和处理的符号的集合。数据是计算机程序加工的原料。 数据元素、数据项&#xff1a;数据元素是数据的基本单位&#xff0c;通常作为一…

以太网 TCP协议(TCP交互过程中出现丢包时的解决机制-列举部分)

2.7.3 以太网 TCP协议&#xff08;TCP交互过程中出现丢包时的解决机制-列举部分&#xff09; 参考&#xff1a;CSDN_TCP的重传机制_博主.Pr Young&#xff0c;对描述进行了整理与结合个人的理解进行编写。 一、超时重传机制 在发送数据时&#xff0c;设定一个定时器&#xff0c…