Java数据结构之第十五章、Trie(前缀树/单词查找树)

news2025/1/8 15:44:53

一、前缀树

1.1前缀树相关知识

1.前缀树的概念:前缀树又叫字典树或单词查找树(高效的存储和查找字符串集合的数据结构)。

2.主要应用场景:给定一个字符串集合构建一颗前缀树,然后给定一个字符串,判断前缀树中是否包含该字符串或者该字符串的前缀。

3.存储形式:存储的字符串可能:全是 小写字母 或全是 大写字母 或全是 数字 或全是 0和1 

4.字典树的核心思想是:利用字符串之间的公共前缀来节省存储空间和提高查询效率。它是一棵多叉树,每个节点代表一个字符串的前缀,从根节点到叶子节点的路径组成一个字符串。字典树的根节点不包含字符,每个子节点代表一个字符,从根节点到任意一个节点所经过的路径上的字符连接起来即为该节点所代表的字符串。每个节点可以存储一个或多个字符串,通常使用一个标志来标记一个节点代表的字符串是否存在。当需要在一组字符串中查找某个字符串时,可以利用字典树来实现高效的查找操作。

1.2前缀树的举例

  • 根结点不保存字符
  • 前缀树是一颗多叉树
  • 前缀树的每个节点保存一个字符
  • 具有相同前缀的字符串保存在同一条路径上
  • 字符串的尾处相应的在前缀树上也有结束的标志


二、前缀树的实现

2.1数组实现前缀树

2.1.1插入字符串

    private static final int[][] son=new int[100000][26];//26个字母,一共100000个数据
    private static final int[] count=new int[100000];//存储以当前这个点结尾的单词有多少个
    private int index=0;//下标为0的点,既是根节点,又是空节点
    public void insert(char[] str){
        int parent=0;
        for(int i=0;i<str.length;i++){
            int cur=str[i]-'a';
            if(son[parent][cur]==0){
                son[parent][cur]=++index;
            }
            parent=son[parent][cur];
        }
        count[parent]++;
    }

2.1.2查找字符串

    private static final int[][] son=new int[100000][26];//26个字母,一共100000个数据
    private static final int[] count=new int[100000];//存储以当前这个点结尾的单词有多少个
    private int index=0;//下标为0的点,既是根节点,又是空节点
public int query(char[] str){
        int parent=0;
        for(int i=0;i<str.length;i++){
            int cur=str[i]-'a';
            if(son[parent][cur]==0){
                return 0;
            }
            parent=son[parent][cur];
        }
        return count[parent];
    }

2.1.3代码实现

import java.util.Scanner;

class Trie {
    private int[][] son=new int[100010][26];//26个字母,一共100000个数据
    private int[] count=new int[100010];//存储以当前这个点结尾的单词有多少个
    private int index=0;
    public Trie() {
    }
    
    public void insert(String word) {
        char[] str=word.toCharArray();
        //parent表示行
        int parent=0;
        for(int i=0;i<str.length;i++){
            //cur表示列,列表示字符串的开头元素
            int cur=str[i]-'a';
            if(son[parent][cur]==0){
                son[parent][cur]=++index;
            }
            parent=son[parent][cur];
        }
        count[parent]++;
    }
    
    public boolean search(String word) {
        char[] str=word.toCharArray();
        int parent=0;
        for(int i=0;i<str.length;i++){
            int cur=str[i]-'a';
            if(son[parent][cur]==0){
                return false;
            }
            parent=son[parent][cur];
        }
        return count[parent]!=0;

    }
    
    public boolean startsWith(String prefix) {
        char[] str=prefix.toCharArray();
        int parent=0;
        for(int i=0;i<str.length;i++){
            int cur=str[i]-'a';
            if(son[parent][cur]==0){
                return false;
            }
            parent=son[parent][cur];
        }
        return true;
    }
}

2.2哈希表实现前缀树

2.2.1插入字符串

public void insert(String word) {
            Trie trie = this;//获得根结点
            for (char c : word.toCharArray()) {
                if (trie.next.get(c) == null) {//当前结点不存在
                    trie.next.put(c, new Trie());//创建当前结点
                }
                trie = trie.next.get(c);//得到字符c的结点,继续向下遍历
            }
            trie.isEnd = true;
        }

2.2.2查找字符串

public boolean search(String word) {
            Trie trie = this;//获得根结点
            for (char c : word.toCharArray()) {
                if (trie.next.get(c) == null) {//当前结点不存在
                    return false;
                }
                trie = trie.next.get(c);//得到字符c的结点,继续向下遍历
            }
            return trie.isEnd;

        }

2.2.3查找前缀

public boolean startsWith(String prefix) {
            Trie trie = this;//获得根结点
            for (char c : prefix.toCharArray()) {
                if (trie.next.get(c) == null) {//当前结点不存在
                    return false;
                }
                trie = trie.next.get(c);//得到字符c的结点,继续向下遍历
            }
            return true;

        }

2.2.4代码实现

public class Trie {
        Map<Character, Trie> next;
        boolean isEnd;

        public Trie() {
            this.next = new HashMap<>();
            this.isEnd = false;
        }


        public void insert(String word) {
            Trie trie = this;//获得根结点
            for (char c : word.toCharArray()) {
                if (trie.next.get(c) == null) {//当前结点不存在
                    trie.next.put(c, new Trie());//创建当前结点
                }
                trie = trie.next.get(c);//得到字符c的结点,继续向下遍历
            }
            trie.isEnd = true;
        }

        public boolean search(String word) {
            Trie trie = this;//获得根结点
            for (char c : word.toCharArray()) {
                if (trie.next.get(c) == null) {//当前结点不存在
                    return false;
                }
                trie = trie.next.get(c);//得到字符c的结点,继续向下遍历
            }
            return trie.isEnd;

        }
        public boolean startsWith(String prefix) {
            Trie trie = this;//获得根结点
            for (char c : prefix.toCharArray()) {
                if (trie.next.get(c) == null) {//当前结点不存在
                    return false;
                }
                trie = trie.next.get(c);//得到字符c的结点,继续向下遍历
            }
            return true;

        }
    }

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/644580.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Flink 流批一体在 Shopee 的大规模实践

摘要&#xff1a;本文整理自 Shopee 研发专家李明昆&#xff0c;在 Flink Forward Asia 2022 流批一体专场的分享。本篇内容主要分为四个部分&#xff1a; 1. 流批一体在 Shopee 的应用场景 2. 批处理能力的生产优化 3. 与离线生态的完全集成 4. 平台在流批一体上的建设和演进 …

华为OD机试 JavaScript 实现【扑克牌大小】【牛客练习题 HJ88】,附详细解题思路

一、题目描述 扑克牌游戏大家应该都比较熟悉了&#xff0c;一副牌由54张组成&#xff0c;含3~A、2各4张&#xff0c;小王1张&#xff0c;大王1张。牌面从小到大用如下字符和字符串表示&#xff08;其中&#xff0c;小写joker表示小王&#xff0c;大写JOKER表示大王&#xff09…

JavaScript笔记——快速了解 ES6 新增数组方法,开箱即用(含案例)

文章目录 &#x1f4cb;前言&#x1f3af;Array.from()&#x1f3af;Array.of()&#x1f3af;Array.find()&#x1f3af;Array.findIndex()&#x1f3af;Array.includes()&#x1f3af;Array.flat()&#x1f3af;Array.flatMap()&#x1f3af;Array.every()&#x1f3af;Array.…

MQTT相关知识点

目录 一、简述 二、设计规范 三、MQTT协议原理 3.1 MQTT协议实现方式 3.2 网络传输与应用消息 3.3 MQTT客户端 3.4 MQTT服务器 3.5 MQTT协议中的订阅、主题、会话 3.6 MQTT协议中的方法 四.MQTT脑图 五.体验MQTT 搭建MQTT服务器&#xff08;Broker&#xff09; MQT…

MFC 工具栏SOP 线程创建非模式化窗口 实现拓展工具栏

自己在学习工具栏的时候&#xff0c;做的笔记 1 实现基本工具栏 1.1 在Dlg.h文件中声明变量和定义资源ID #define ID_BUTTONS 501CToolBar m_toolbar; //工具栏 CImageList m_imageList; //工具栏图片 CImageList m_hotImageList; //工具栏热点图片 CReBar m_Rebar; //…

Jenkins安装以及部署

本文基于war包形式部署的 需要提前下载Jenkins的war包 Jenkins 的安装和设置下载内容 https://mirrors.jenkins.io/war 版本对应 目录 1.初始化环境 2.安装jdk 安装git Maven配置 安装Jenkins 使用DockerFile的方式进行部署 1.初始化环境 mkdir -p /home/soft 2.安装…

Python零基础入门(一)——Python简介与基础语法

系列文章目录 个人简介&#xff1a;机电专业在读研究生&#xff0c;CSDN内容合伙人&#xff0c;博主个人首页 Python入门专栏&#xff1a;《Python入门》欢迎阅读&#xff0c;一起进步&#xff01;&#x1f31f;&#x1f31f;&#x1f31f; 码字不易&#xff0c;如果觉得文章不…

智慧食堂如何建造?手把手教你

智慧食堂是现代科技与餐饮行业相结合的创新应用。随着技术的不断发展&#xff0c;许多企业和机构正积极采用智慧收银系统来改进食堂管理和收银流程。 引入智慧收银系统不仅可以提高企业食堂的运营效率&#xff0c;降低错误率&#xff0c;还能为企业带来更多的商机和竞争优势。 …

开源客户沟通平台Chatwoot

什么是 Chatwoot &#xff1f; Chatwoot 是一个开源客户沟通平台&#xff0c;可帮助公司在其网站、Facebook 页面、Twitter、Whatsapp、SMS、电子邮件等上吸引客户。 它是 Intercom、Zendesk、Salesforce Service Cloud 等的开源替代品。 很多网站的右侧或者右下角&#xff0c;…

中银国际在以太坊上发行代币化票据?三种可能,扑朔迷离!

* * * 原创&#xff1a;刘教链 * * * 号外&#xff1a;今天在“刘教链Pro”发表了一篇内参文章&#xff0c;《内参&#xff1a;对币本位高抛低吸策略的一点儿思考》&#xff08;次条&#xff09;&#xff0c;以及一篇原创文章《他提案将SEC主席Gary Gensler撤职》&#xff08;…

加速44%!RT-DETR量化无损压缩优秀实战

RT-DETR 模型是飞桨目标检测套件 PaddleDetection 最新发布的 SOTA 目标检测模型。其是一种基于 DETR 架构的端到端目标检测器&#xff0c;在速度和精度上均取得了 SOTA 性能。在实际部署中&#xff0c;为了追求“更准、更小、更快”的效率能力&#xff0c;本文使用飞桨模型压缩…

单元测试:构建可靠软件的关键步骤

点击上方“程序猿技术大咖”&#xff0c;关注并选择“设为星标” 回复“加群”获取入群讨论资格&#xff01; 引言&#xff1a; 在当今快节奏的软件开发环境中&#xff0c;构建可靠的软件是至关重要的。单元测试作为软件开发过程中的关键步骤之一&#xff0c;能够帮助开发者发现…

006、体系结构之TiKV读取和Coprocessor

TiKV读取和Coprocessor 1、数据的读取1.1、ReadIndex Read1.2、Follower Read 协同处理器(Coprocessor) 1、数据的读取 1.1、ReadIndex Read 例如此时要读取 key 1 的内容&#xff0c;它不能直接去kv中读取&#xff0c;因为它是分布式的&#xff0c;它经过TiDB Server 收到读…

认识ASP.NET MVC的5种AuthorizationFilter

一、IAuthorizationFilter 所有的AuthorizationFilter实现了接口IAuthorizationFilter。如下面的代码片断所示&#xff0c;IAuthorizationFilter定义了一个OnAuthorization方法用于实现授权的操作。作为该方法的参数filterContext是一个表示授权上下文的AuthorizationContext对…

机器学习笔记 - 基于深度学习的多种目标跟踪检测框架简述

一、 目标跟踪 对象跟踪是执行一组初始对象检测的任务,为每个初始检测创建唯一的 ID,然后在每个对象在视频中的帧中移动时跟踪它们,从而维护 ID 分配。最先进的方法涉及融合来自RGB和基于事件的相机的数据,以产生更可靠的对象跟踪。仅使用RGB图像作为输入的基于CNN的模型也…

【JUC基础】17. 并发编程常见问题

目录 1、前言 2、上下文切换问题 2.1、什么是上下文切换 2.2、上下文切换过程 2.3、上下文切换的原因 2.4、上下文切换的开销和影响 2.5、注意事项和改进策略 3、死锁问题 3.1、什么是死锁 3.2、死锁示例 3.3、改进策略 4、竞态条件 5、内存可见性 6、小结 1、前言…

Hinton:我对“青蛙”创造出“人”这件事的后果很紧张丨全文整理+视频

假如青蛙创造了人&#xff0c;那现在是青蛙控制人类&#xff0c;还是人类控制青蛙&#xff1f;我不知道如何防止这种情况发生。我老了&#xff0c;希望像你们这样年轻而才华横溢的研究人员弄清楚如何拥有这些超级智能&#xff0c;并使我们的生活在不受超级智能控制的情况下变得…

Servlet+jsp+Layui图书管理系统

项目介绍 介绍 使用到了jsp&#xff0c;servlet&#xff0c;Mysql&#xff0c;Java&#xff0c;layui。 大致功能 关于用户&#xff1a; 登录&#xff0c;申请注册&#xff0c;查看搜索图书&#xff0c;查看有关用户的借阅记录&#xff0c;丢失记录&#xff0c;预借记录。对…

详解3DMAX室内建筑效果图的制作渲染过程

如果你并不了解室内、建筑效果图的制作渲染过程,本文将可能对你有一些帮助。 ​什么是 3DMax 渲染? 渲染是利用3dmax软件创建与原始建筑设计或模型精确的 3D 图片的技术。最终效果图在逼真度、精度、细节和真实性方面准确地反映了真实材料和光线。具有经验和专业知识的室内…

Elastic 8.8 版引入了全新的 Learned Sparse Encoder 模型,并宣布正式推出合成监测

作者&#xff1a;Brian Bergholm 2023年5月25日 今天&#xff0c;我们非常高兴地宣布 Elastic 8.8 版正式发布。 新增功能 Elastic 企业搜索可帮助开发人员利用 Elasticsearch 实现强大的现代搜索和发现体验。 请在 “Elastic 企业搜索亮点” 博文或 8.8 版发行说明中&#…