【数据结构】前缀树的模拟实现

news2025/1/9 17:09:21

目录

1、什么是前缀树?

2、模拟实现

2.1、前缀树节点结构

2.2、字符串的添加

2.3、字符串的查寻

2.3.1、查询树中有多少个以字符串"pre"作为前缀的字符串

2.3.2、查询某个字符串被添加过多少次 

2.4、字符串的删除

3、完整代码


 

1、什么是前缀树?

前缀树又名字典树,单词查找树,Trie树,是一种多路树形结构,是哈希树的变种,和hash效率有一拼,是一种用于快速检索的多叉树结构,。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词颛统计。

它的优点:最大限度地减少无谓的字符比较,查询效率比哈希表还高。
Trie的核心思想是空间换时间。利用字符串的公共前缀来降低査询时间的开销以达到提高效率的目的。
Trie树的缺点:Trie树的内存消耗非常大。
性质:不同字符串的相同前缀只保存一份。
操作:查找,插入,删除。

注:本文章的前缀树功能都是基于字符串的

举个例子,例1:假设有:“abc”,“adf”,“cf”,“abcf”,“adf” 这五个字符串,则前缀树结构入下所示

2、模拟实现

以下的解析都是以上面的例1作为例子

2.1、前缀树节点结构

解释:创建一个前缀树节点类,前缀树节点中,我们并不放值,也就是并不放字符。我们把值,也就是字符,防止当前节点通往父节点的路上。前缀树节点类中有三个属性:int整形 pass、int整形 end  和  前缀树节点数组 nextS。

pass:pass用于记录当前这个节点经历过多少次,也就是上一级节点到当前节点的这条路通过了几次,这非常有助于查询树中有多少个字符串以某个字符串作为前缀。

end:记录这个节点是多少个字符串的结尾节点,这非常有助于查询某个字符串被加入过多少次。

节点数组 nextS[ ]:这是一个前缀树节点数组,用于记录当前这个节点通向下一个节点的路,比如:nextS[0] == null 没有走向'a’的路;nextS[0] != null 有走向'a’的路;......;nextS[25]!= nu1l 有走向'z’的路。这里数组中下标与字符的对应关系为:0->a; 1->b; 2->c; ......; 24->y; 25->z ,这钟关系在代码中的转换方式为:先定义一个下标变量index,然后每次要访问数组时,先让下标变量index等于要转换的字符减去字符‘a’就可以了,即:比如字符‘c’的转换为 index = 'c' - 'a'; 这条语句执行完后index会等于2,也就成功把字符'c'转换成数字2了。

节点结构代码

//前缀树的节点结构类
    public static class TreeNode {
        public int pass;  //pass用于记录当前这个点经历过多少次
        public int end;  //表示这个节点是多少个字符串的结尾节点
        //nextS是当前节点的下级节点,本实例中数组中的元素个数为26,从a到z
        public TreeNode[] nextS;  // HashMap<Char, TreeNode> nextS; 当字符种类特别多的时候,可以用HashMap

        public TreeNode() {
            pass = 0;
            end = 0;
            // nextS[0] == null 没有走向'a’的路
            // nextS[0] != null 有走向'a’的路
            // ...
            // nextS[25]!= null 有走向'z’的路
            nextS = new TreeNode[26];
        }
    }

2.2、字符串的添加

字符串的添加从root节点开始,先把要添加的字符串转换成字符数组,然后从左往右开始遍历添加。

如当前节点node要添加一个字符,添加的规则为:

注:数组nextS[ ]中的数组元素都是前缀树节点类型,其实就是节点

当node的nextS[ ]中与该字符对应的数组元素为空时:那就要先为这个数组元素初始化,给这个数组元素new一个实例对象,这个实例对象起始就是一个新创建的节点,然后来到这个新建的节点,让这个节点的pass加一,然后看当前添加的这个字符在字符数组是不是最后一个字符:如果是,则还需要让这个节点的end加一;如果不是,则按这种规则继续添加字符数组中后面还没添加的字符。

当node的nextS[ ]中与该字符对应的数组元素不为空时:那就直接来到这个数组元素,也就是这个节点,让这个节点的pass加一,然后看当前添加的这个字符在字符数组是不是最后一个字符:如果是,则还需要让这个节点的end加一;如果不是,则按这种规则继续添加字符数组中后面还没添加的字符。

实现代码: 

//把字符串word加入到树中
        public void insert(String word) {
            if (word == null) {
                return;
            }
            char[] chs = word.toCharArray();  //把字符串word转换成字符数组
            TreeNode node = root;
            node.pass++;
            int index = 0;
            for (int i=0; i<chs.length; i++) {  //从左往右遍历字符
                index = chs[i] - 'a';  //由字符对应成要走哪条路
                if (node.nextS[index] == null) {
                    //当node的nextS[ ]中与该字符对应的数组元素为空时
                    node.nextS[index] = new TreeNode();
                }
                node = node.nextS[index];  //来到下一个节点
                node.pass++;
            }
            //当for循环结束了,就说明字符数组中的最后一个字符也添加完了,所以当前节点的end加一
            node.end++;
        }

2.3、字符串的查寻

2.3.1、查询树中有多少个以字符串"pre"作为前缀的字符串

例:比如我们要查询例1中的五个字符串中有多少个字符串以空字符串“ ”作为前缀,我们只需要返回root节点的pass,可以理解为root节点通往上一级节点的路为空,和空字符串对应,所以直接返回root节点的pass;

例:再比如我们要查询例1中的五个字符串中有多少个字符串以字符串“ab”作为前缀,我们先查看root下的a这条路是不是为空,如果为空就直接返回0,不为空就来到a这条路连接的下一个节点,然后我们查看来到的这个节点下的b这条路是不是为空,如果为空就直接返回0,不为空就来到b这条路连接的下一个节点,然后返回b这条路连接的下一个节点的pass,也就是2,这样我们就查询到了例1中的五个字符串中有2个字符串以字符串“ab”作为前缀。

以上两个例子都是在树中存在以字符串"pre"作为前缀的字符串的情况,如果不存在,那么在遍历字符数组时就会遇到有node的nextS[ ]中与当前查询字符对应的数组元素为空的情况,这时候直接返回0,因为这种情况就是表面树中不存在字符串“pre”,那就跟不可能存在以字符串"pre"作为前缀的字符串了

例:比如我们要查询例1中的五个字符串中有多少个字符串以字符串“aec”作为前缀,当我们来到a这条路连接的这个节点时,我们会发现这个节点的nextS数组中与字符‘e’对应的数组元素是空的,所以直接返回0。

实现代码: 

//查询所有加入的字符串中,有多少字符串是以字符串pre作为前缀的
        public int prefixNumber(String pre) {
            if (pre == null) {
                return 0;
            }
            char[] chs = pre.toCharArray();  //把字符串word转换成字符数组
            TreeNode node = root;
            int index = 0;
            for (int i=0; i<chs.length; i++) {
                index = chs[i] - 'a';
                if (node.nextS[index] == null) {
                    return 0;
                }
                node = node.nextS[index];  //来到下一个节点
            }
            return node.pass;
        }

2.3.2、查询某个字符串被添加过多少次 

查询某个字符串被添加过多少次 和 查询树中有多少个以字符串"pre"作为前缀的字符串的规则是一样的,只是返回的节点属性不同,这里要返回的是节点的end,当字符数组遍历完后就会来到要查询的字符串的最后一个字符所对应的节点,然后返回这个节点的end就是这个字符串被添加过多少次 的结果了。

实现代码:

//查询word这个字符串加入过几次
        public int search(String word) {
            if (word == null) {
                return 0;
            }
            char[] chs = word.toCharArray();  //把字符串word转换成字符数组
            TreeNode node = root;
            int index = 0;
            for (int i=0; i<chs.length; i++) {
                index = chs[i] - 'a';
                if (node.nextS[index] == null) {
                    return 0;
                }
                node = node.nextS[index];  //来到下一个节点
            }
            return node.end;
        }

2.4、字符串的删除

删除字符串和添加字符串规则相似,只是添加时是对节点的pass和end进行加一,而删除时是对节点的pass和end进行减一

实现代码: 

//删除字符串
        public void delete(String word) {
            if (search(word) != 0) {  //确定树中确实加入过word,才去执行删除操作
                char[] chs = word.toCharArray();
                TreeNode node = root;
                node.pass--;  //当前节点的pass减一
                int index = 0;
                for (int i=0; i<chs.length; i++) {
                    index = chs[i] - 'a';
                    if (--node.nextS[index].pass == 0) {
                        //java会自动去释放内存空间,所以java里可以直接把node下级的路直接标空
                        node.nextS[index] = null;
                        return;
                    }
                    node = node.nextS[index];
                }
                node.end--;  //node已经来到了字符串word中的最后一个字符,然后这个node的end减一
            }
        }

3、完整代码

public class Code01_TrieTree {

    //前缀树的节点结构类
    public static class TreeNode {
        public int pass;  //pass用于记录当前这个点经历过多少次
        public int end;  //这个节点是多少个字符串的结尾节点
        //nextS是当前节点的下级节点,本实例中数组中的元素个数为26,从a到z
        public TreeNode[] nextS;  // HashMap<Char, TreeNode> nextS; 当字符种类特别多的时候,可以用HashMap

        public TreeNode() {
            pass = 0;
            end = 0;
            // nextS[0] == null 没有走向'a’的路
            // nextS[0] != null 有走向'a’的路
            // ...
            // nextS[25]!= null 有走向'z’的路
            nextS = new TreeNode[26];
        }
    }

    //前缀树的类,内涵前缀树的构造方法和字符串的加入、删除、查找字符串加入了几次和以字符串pre作为前缀的字符串有多少个
    public static class Tree {
        private TreeNode root;

        public Tree() {
            root = new TreeNode();
        }

        //把字符串word加入到树中
        public void insert(String word) {
            if (word == null) {
                return;
            }
            char[] chs = word.toCharArray();  //把字符串word转换成字符数组
            TreeNode node = root;
            node.pass++;
            int index = 0;
            for (int i=0; i<chs.length; i++) {  //从左往右遍历字符
                index = chs[i] - 'a';  //由字符对应成要走哪条路
                if (node.nextS[index] == null) {
                    //当node的nextS[ ]中与该字符对应的数组元素为空时
                    node.nextS[index] = new TreeNode();
                }
                node = node.nextS[index];  //来到下一个节点
                node.pass++;
            }
            //当for循环结束了,就说明字符数组中的最后一个字符也添加完了,所以当前节点的end加一
            node.end++;
        }

        //删除字符串
        public void delete(String word) {
            if (search(word) != 0) {  //确定树中确实加入过word,才去执行删除操作
                char[] chs = word.toCharArray();
                TreeNode node = root;
                node.pass--;  //当前节点的pass减一
                int index = 0;
                for (int i=0; i<chs.length; i++) {
                    index = chs[i] - 'a';
                    if (--node.nextS[index].pass == 0) {
                        //java会自动去释放内存空间,所以java里可以直接把node下级的路直接标空
                        node.nextS[index] = null;
                        return;
                    }
                    node = node.nextS[index];
                }
                node.end--;  //node已经来到了字符串word中的最后一个字符,然后这个node的end减一
            }
        }

        //查询word这个字符串加入过几次
        public int search(String word) {
            if (word == null) {
                return 0;
            }
            char[] chs = word.toCharArray();  //把字符串word转换成字符数组
            TreeNode node = root;
            int index = 0;
            for (int i=0; i<chs.length; i++) {
                index = chs[i] - 'a';
                if (node.nextS[index] == null) {
                    return 0;
                }
                node = node.nextS[index];  //来到下一个节点
            }
            return node.end;
        }

        //查询所有加入的字符串中,有多少字符串是以字符串pre作为前缀的
        public int prefixNumber(String pre) {
            if (pre == null) {
                return 0;
            }
            char[] chs = pre.toCharArray();  //把字符串word转换成字符数组
            TreeNode node = root;
            int index = 0;
            for (int i=0; i<chs.length; i++) {
                index = chs[i] - 'a';
                if (node.nextS[index] == null) {
                    return 0;
                }
                node = node.nextS[index];  //来到下一个节点
            }
            return node.pass;
        }

    }
    
}

 

推荐:

java数据结构(哈希表—HashMap)含LeetCode例题讲解-CSDN博客icon-default.png?t=N7T8https://blog.csdn.net/m0_65277261/article/details/134712832?spm=1001.2014.3001.5501【计算机组成原理】存储器知识-CSDN博客icon-default.png?t=N7T8https://blog.csdn.net/m0_65277261/article/details/134770339?spm=1001.2014.3001.5501【计算机网络】(网络层)定长掩码和变长掩码_定长子网掩码和变长子网掩码-CSDN博客icon-default.png?t=N7T8https://blog.csdn.net/m0_65277261/article/details/134606175?spm=1001.2014.3001.5501

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1486715.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

(资源篇)2025届暑假实习春招全攻略路线

绝对的全攻略&#xff0c;资源完善程度绝对的全网唯一。 觉得有帮助的&#xff1a;随手一键三连关注就是对up主最大的激励。 绝对的宝藏up主&#xff01;&#xff01;&#xff01;&#xff0c;up主每天都会进行更新视频&#xff0c;算法视频or校招信息or八股讲解。 【暴躁老…

数字化转型导师坚鹏:如何制定证券公司数字化转型年度培训规划

如何制定与实施证券公司数字化转型年度培训规划 ——以推动证券公司数字化转型战略落地为核心&#xff0c;实现知行果合一 课程背景&#xff1a; 很多证券公司都在开展数字化转型培训工作&#xff0c;目前存在以下问题急需解决&#xff1a; 缺少针对性的证券公司数字化转型…

账单怎么记账软件下载,佳易王账单记账汇总统计管理系统软件教程

账单怎么记账软件下载&#xff0c;佳易王账单记账汇总统计管理系统软件教程 一、前言 以下软件以 佳易王账单记账汇总统计管理系统软件V17.0为例说明 软件文件下载可以点击最下方官网卡片——软件下载——试用版软件下载 软件特色&#xff1a; 1、功能实用&#xff0c;操作…

第二天 Kubernetes落地实践之旅

第二天 Kubernetes落地实践之旅 本章学习kubernetes的架构及工作流程&#xff0c;重点介绍如何使用Workload管理业务应用的生命周期&#xff0c;实现服务不中断的滚动更新&#xff0c;通过服务发现和集群内负载均衡来实现集群内部的服务间访问&#xff0c;并通过ingress实现外…

one4all 排坑记录

one4all 排坑记录 任务踩坑回顾动作踩坑动作踩坑动作新一步测试Habitat-sim 测试habitat-lab继续ONE4ALL 任务 看了《One-4-All: Neural Potential Fields for Embodied Navigation》这篇论文&#xff0c;感觉挺有意思&#xff0c;他也开源了代码。视觉语言导航是我一直想做的…

CSS_实现三角形和聊天气泡框

如何用css画出一个三角形 1、第一步 写一个正常的盒子模型&#xff0c;先给个正方形的div&#xff0c;便于观察&#xff0c;给div设置宽高和背景颜色 <body><div class"box"></div> </body> <style>.box {width: 100px;height: 100px…

第三百七十九回

文章目录 1. 概念介绍2. 使用方法3. 代码与效果3.1 示例代码3.2 运行效果 4. 内容总结 013pickers2.gif 我们在上一章回中介绍了"如何实现Numberpicker"相关的内容&#xff0c;本章回中将介绍wheelChoose组件.闲话休提&#xff0c;让我们一起Talk Flutter吧。 1. 概念…

sql 注入 之sqli-labs/less-5 双注入,也称:报错注入

该关卡返回正确或者错误页面,还有错误的代码&#xff0c;所以可以使用报错注入。报错注入的方式&#xff1a; updatexml 函数注入&#xff1a; mysql5.1.5 版本以上支持该函数&#xff0c;返回数据限制32位 模板&#xff1a;select * from user where id1 and (updatexml(&q…

MySQL:开始深入其数据(三)DQL的后续

上一章学习mysql语句里的where和join,这一章我们开始分析group by ,having,order by,limit语句。 three,too,one,go! 文章目录 重温select语法having:order by:limit 重温select语法 SELECT [ALL | DISTINCT] { * | table.* | [ table.field1 [ as alias1] [, table.field2 [a…

[通用] iPad 用于 Windows 扩展屏解决方案 Moonlight + Sunshine + Easy Virtual Display

文章目录 前言推流端 Sunshine 安装设置接收端安装 Moonlight安装虚拟屏幕软件 Easy Virtual Display 前言 上期博客讲了如何利用原生的 NVIDIA’s GameStream 传输协议实现 iPad 当作 Windows 副屏&#xff0c;对于非N卡用户&#xff0c;有一个软件 Sunshine 可以代替 Nvidia…

【详识JAVA语言】面向对象程序三大特性之二:继承

继承 为什么需要继承 Java中使用类对现实世界中实体来进行描述&#xff0c;类经过实例化之后的产物对象&#xff0c;则可以用来表示现实中的实体&#xff0c;但是 现实世界错综复杂&#xff0c;事物之间可能会存在一些关联&#xff0c;那在设计程序是就需要考虑。 比如&…

GO泛型相关

通过引入 类型形参 和 类型实参 这两个概念&#xff0c;我们让一个函数获得了处理多种不同类型数据的能力&#xff0c;这种编程方式被称为 泛型编程。 2. Go的泛型 类型形参 (Type parameter)类型实参(Type argument)类型形参列表( Type parameter list)类型约束(Type constr…

【IEEEE会议征稿】第六届下一代数据驱动网络国际学术会议(NGDN 2024)

第六届下一代数据驱动网络国际学术会议&#xff08;NGDN 2024&#xff09; The Sixth International Conference on Next Generation Data-driven Networks 基于前几届在英国埃克塞特 (ISPA 2020) 、中国沈阳 (TrustCom 2021) 和中国武汉(IEEETrustCom-2022)成功举办的经验&a…

048 异常

什么是异常 异常体系结构 异常的继承关系 Error Exception 异常处理机制 try&#xff1a;用{}将可能产生异常的代码包裹catch&#xff1a;与try搭配使用&#xff0c;捕获try包裹代码中抛出的异常并进行后续动作finally&#xff1a;跟在try后&#xff0c;在try和catch之后执行…

使用 Grafana 使用JSON API 请求本地接口 报错 bad gateway(502)解决

一 . 问题&#xff1a; 在用docker部署Grafana 来实现仪表盘的展示&#xff0c;使用到比较多的就是使用JAON API插件调用本地部署的API&#xff0c;比如访问localhost下的 /test_data 接口&#xff0c;一般我们使用的是http://localhost:8080/test_data&#xff0c; 但是在访…

java 使用easyui开发导出excle打开错误

解决&#xff1a; contentType 加字符编码 ;charsetutf-8 就好了

[AutoSar]BSW_Com08 CAN driver 模块介绍及参数配置说明 (一)

目录 关键词平台说明一、缩写和定义二、CAN driver 所在位置三、CAN 模块的主要功能四、功能规格4.1 Driver State Machine4.2 CAN控制器状态机4.3 CAN控制器状态机转换4.3.1 调用function Can_Init 导致的状态转换4.3.2 调用Can_ChangeBaudrate导致的状态转换4.3.3 调用Can_Se…

无穷积分例子

以下几个题容易出错&#xff0c;特意记录一下。 判断积分式的敛散性 ∫ − ∞ ∞ 1 x 2 e 1 x d x \int _{-\infty } ^ {\infty} \frac{1}{x^2} e ^{\frac{1}{x}} dx ∫−∞∞​x21​ex1​dx 要注意瑕点0的处理。无穷积分&#xff0c;一般将积分域按瑕点拆分并分别积分。 判断…

谷粒商城【成神路】-【8】——商品上架

目录 1.数据模型封装 1.es数据模型 2.将es数据模型封装为JAVA bean 3.根据前端发送请求,编写controller 2.模型实现 2.1服务controller 2.2服务service 2.3服务远程调用接口 2.4检索服务controller 2.5检索服务保存到es 2.6库存查询服务 1.数据模型封装 1.es数据模…

Linux多线程服务端编程:使用muduo C++网络库 学习笔记 附录D 关于TCP并发连接的几个思考题与试验

前几天作者在新浪微博上出了两道有关TCP的思考题&#xff0c;引发了一场讨论&#xff08;http://weibo.com/1701018393/eCuxDrtaONn&#xff09;。 第一道初级题目是&#xff1a;有一台机器&#xff0c;它有一个IP&#xff0c;上面运行了一个TCP服务程序&#xff0c;程序只侦听…