【算法基础:数据结构】2.2 字典树/前缀树 Trie

news2024/11/25 10:42:27

文章目录

  • 知识点
    • cpp结构体模板
  • 模板例题
    • 835. Trie字符串统计❤️❤️❤️❤️❤️(重要!模板!)
    • 143. 最大异或对😭😭😭😭😭(Trie树的应用)
  • 相关题目练习
    • 208. 实现 Trie (前缀树)
    • 1804. 实现 Trie (前缀树) II
  • 参考资料

知识点

用于高效地存储和查找字符串集合的数据结构——Trie树

https://oi-wiki.org/string/trie/
在这里插入图片描述
可以发现,这棵字典树用边来代表字母,而从根结点到树上某一结点的路径就代表了一个字符串。举个例子, 1 → 4 → 8 → 12 1\to4\to 8\to 12 14812 表示的就是字符串 caa

这类题目,字母的种类不会很多。

cpp结构体模板

struct trie {
  int nex[100000][26], cnt;
  bool exist[100000];  // 该结点结尾的字符串是否存在

  void insert(char *s, int l) {  // 插入字符串
    int p = 0;
    for (int i = 0; i < l; i++) {
      int c = s[i] - 'a';
      if (!nex[p][c]) nex[p][c] = ++cnt;  // 如果没有,就添加结点
      p = nex[p][c];
    }
    exist[p] = 1;
  }

  bool find(char *s, int l) {  // 查找字符串
    int p = 0;
    for (int i = 0; i < l; i++) {
      int c = s[i] - 'a';
      if (!nex[p][c]) return 0;
      p = nex[p][c];
    }
    return exist[p];
  }
};

模板例题

835. Trie字符串统计❤️❤️❤️❤️❤️(重要!模板!)

https://www.acwing.com/activity/content/problem/content/883/

在这里插入图片描述

代码模板在于 insertquery 这两个方法的写法。

除此之外要理解数组 soncnt 和变量 idx 的含义。(含义已经写在代码注释里了

son[][] 的第一维是可能出现的字符**数量**的最大值;第二维是可能出现的字符**种类**的最大值。
cnt[] 的大小是可能出现的字符数量的最大值,也就是记录每个节点作为了几次字符串的末尾。
idx 记录出现了几个新的节点。
import java.io.BufferedInputStream;
import java.io.BufferedWriter;
import java.io.IOException;
import java.io.OutputStreamWriter;
import java.util.*;

public class Main {
    static final int N = 100010;    // 所有输入的字符串总长度不超过 10^5
    static int[][] son;
    static int[] cnt;
    static int idx;             // idx递增作为节点的序号
    static {
        son = new int[N][26];   // 记录各个节点的儿子
        cnt = new int[N];       // 记录各个节点作为结尾的次数
    }


    public static void main(String[] args) throws IOException {
        Scanner sin = new Scanner(new BufferedInputStream(System.in));
        BufferedWriter bw = new BufferedWriter(new OutputStreamWriter(System.out));
        int n = sin.nextInt();
        while (n-- > 0) {
            char op = sin.next().charAt(0);
            String s = sin.next();
            if (op == 'I') {
                insert(s.toCharArray());
            } else {
                System.out.println(query(s.toCharArray()));
            }
        }

        bw.flush();
    }

    // 插入一个字符串
    static void insert(char[] str) {
        int p = 0;
        for (int i = 0; i < str.length; ++i) {		// 枚举每个字符
            int u = str[i] - 'a';
            if (son[p][u] == 0) son[p][u] = ++idx;  // 如果当前层不存在u的话,新建一个节点
            p = son[p][u];
        }
        cnt[p]++;           // 作为结尾的情况+1
    }

    static int query(char[] str) {
        int p = 0;
        for (int i = 0; i < str.length; ++i) {
            int u = str[i] - 'a';
            if (son[p][u] == 0) return 0;
            p = son[p][u];
        }
        return cnt[p];
    }
}

143. 最大异或对😭😭😭😭😭(Trie树的应用)

https://www.acwing.com/problem/content/145/

在这里插入图片描述

异或运算:相同得 0 ,不同得 1。(俗称不进位加法)

从高位开始比较。

检查到有反的,就可以 += 1 << i;

import java.util.Scanner;

public class Main {
    final static int M = 31 * 100010;   // M 是 Trie树中最多可能的节点数量
    static int[][] son = new int[M][2];
    static int idx = 0;

    public static void main(String[] args){
        Scanner scanner = new Scanner(System.in);
        int n = scanner.nextInt(), ans = 0;
        for (int i = 0; i < n; ++i) {
            int a = scanner.nextInt();
            ans = Math.max(find(a), ans);
            insert(a);
        }
        System.out.println(ans);
    }
    
    // 从高位到低位插入
    public static void insert(int x) {
        int p = 0;
        for (int i = 30; i >= 0; --i) {
            int u = x >> i & 1;
            if (son[p][u] == 0) son[p][u] = ++idx;
            p = son[p][u];
        }
    }

    public static int find(int x) {
        int p = 0, res = 0;
        for (int i = 30; i >= 0; --i) {
            int u = x >> i & 1;         // 获得当前位
            if (son[p][u ^ 1] != 0) {   // 检查当前位有没有取反的
                res += 1 << i;
                p = son[p][u ^ 1];
            } else p = son[p][u];
        }
        return res;
    }
}

相关题目练习

208. 实现 Trie (前缀树)

https://leetcode.cn/problems/implement-trie-prefix-tree/
在这里插入图片描述
提示:

1 <= word.length, prefix.length <= 2000
word 和 prefix 仅由小写英文字母组成
insert、search 和 startsWith 调用次数 总计 不超过 3 * 10^4 次

一道练习Trie树模板的题目。

class Trie {
    final int N = 200001 + 1;
    int[][] son = new int[N][26];
    int[] cnt = new int[N];
    int idx = 0;

    public Trie() {

    }
    
    public void insert(String word) {
        int p = 0;
        for (char ch: word.toCharArray()) {
            int u = ch - 'a';
            if (son[p][u] == 0) son[p][u] = ++idx;
            p = son[p][u];
        }
        ++cnt[p];
    }
    
    public boolean search(String word) {
        int p = 0;
        for (char ch: word.toCharArray()) {
            int u = ch - 'a';
            if (son[p][u] == 0) return false;
            p = son[p][u];
        }
        return cnt[p] > 0;
    }
    
    public boolean startsWith(String prefix) {
        int p = 0;
        for (char ch: prefix.toCharArray()) {
            int u = ch - 'a';
            if (son[p][u] == 0) return false;
            p = son[p][u];
        }
        return true;
    }
}

/**
 * Your Trie object will be instantiated and called as such:
 * Trie obj = new Trie();
 * obj.insert(word);
 * boolean param_2 = obj.search(word);
 * boolean param_3 = obj.startsWith(prefix);
 */ 

1804. 实现 Trie (前缀树) II

1804. 实现 Trie (前缀树) II

在这里插入图片描述
提示:

1 <= word.length, prefix.length <= 2000
word 和 prefix 只包含小写英文字母。
insert、 countWordsEqualTo、 countWordsStartingWith 和 erase 总共调用最多 3 * 10^4 次。
保证每次调用 erase 时,字符串 word 总是存在于前缀树中。

相比上一题,多开一个数组 cnt2 记录一下各个节点被经过了多少次就好了

class Trie {
    int[][] son = new int[30000][26];
    int[] cnt = new int[30000], cnt2 = new int[30000];
    int idx = 0;

    public Trie() {

    }
    
    public void insert(String word) {
        int p = 0;
        for (char ch: word.toCharArray()) {
            int u = ch - 'a';
            if (son[p][u] == 0) son[p][u] = ++idx;
            p = son[p][u];
            cnt2[p]++;
        }
        cnt[p]++;
    }
    
    public int countWordsEqualTo(String word) {
        int p = getP(word);
        return cnt[p];
    }
    
    public int countWordsStartingWith(String prefix) {
        int p = getP(prefix);
        return cnt2[p];
    }
    
    public void erase(String word) {
        int p = 0;
        for (char ch: word.toCharArray()) {
            int u = ch - 'a';
            p = son[p][u];
            cnt2[p]--;
        }
        cnt[p]--;
    }

    public int getP(String s) {
        int p = 0;
        for (char ch: s.toCharArray()) {
            int u = ch - 'a';
            if (son[p][u] != 0) p = son[p][u];
            else return 0;
        }
        return p;
    }
}

/**
 * Your Trie object will be instantiated and called as such:
 * Trie obj = new Trie();
 * obj.insert(word);
 * int param_2 = obj.countWordsEqualTo(word);
 * int param_3 = obj.countWordsStartingWith(prefix);
 * obj.erase(word);
 */

参考资料

https://oi-wiki.org/string/trie/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/771759.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

河北幸福消费金融基于 Apache Doris 构建实时数仓,查询提速 400 倍!

本文导读&#xff1a; 随着河北幸福消费金融的客户数量和放贷金额持续上升&#xff0c;如何依托大数据、数据分析等技术来提供更好决策支持、提高工作效率和用户体验&#xff0c;成为了当前亟需解决的问题。基于此&#xff0c;公司决定搭建数据中台&#xff0c;从基于 TDH 的离…

IIS Express本地开发测试如何映射到外网访问?

1.IIS Express是什么 IIS Express是为开发人员优化的轻量级、自包含版本的IIS。它具有IIS 7及以上的所有核心功能&#xff0c;以及为简化网站开发而设计的附加功能。 IIS Express&#xff08;跟ASP.NET开发服务器一样&#xff09;可以快速地从硬盘上的某个文件夹上启动网站…

GO语言Metex

Mutex互斥锁 type Mutex struct{state int32 // 0表示未加锁 1表示加锁&#xff0c;原子操作sema uint32 // 信号量&#xff0c;用作等待队列 } Mutex正常模式: 尝试加锁的G会先自旋几次,若获不到锁,则加入等待队列. 正常模式下,自选和等待队列的一起竞争 因为G频繁的挂起…

适合小公司的自动化部署脚本

背景&#xff08;偷懒&#xff09; 在小小的公司里面&#xff0c;挖呀挖呀挖。快挖不动了&#xff0c;一件事重复个5次&#xff0c;还在人肉手工&#xff0c;身体和心理就开始不舒服了&#xff0c;并且违背了个人的座右铭&#xff1a;“偷懒”是人类进步的第一推动力。 每次想…

2023版7月软件测试面试题(800道)【附带答案】持续更新...

又到了立flag的时候&#xff0c;你的目标是拿下大厂offer&#xff1f;还是多少万年薪&#xff1f;其实这些都离不开日积月累的过程。 为此我特意整理出一份&#xff08;超详细笔记/面试题&#xff09;它几乎涵盖了所有的测试开发技术栈&#xff0c;非常珍贵&#xff0c;人手一…

数智领航 信创强基 | GBASE南大通用携手金仕达共助金融用户合规风控

GBASE南大通用董事长丁明峰先生应邀出席大会并在主论坛发表题为《去全球化背景下的中国数据库发展策略》的主题分享。 技术的迭代发展是经济增长、产业升级的核心动力。纵观近现代社会史&#xff0c;信息技术和通信技术的迅猛发展&#xff0c;帮助人类实现了PC互联网到移动互联…

初识C++(上)——“C++”

各位CSDN的uu们你们好呀&#xff0c;小雅兰的全新专栏又来啦&#xff0c;这次的专栏主要介绍的是C&#xff0c;下面&#xff0c;让我们进入C的世界吧&#xff01;&#xff01;&#xff01; 什么是C C语言是结构化和模块化的语言&#xff0c;适合处理较小规模的程序。对于复杂的…

TMS FlexCel for VCL FMX Crack

TMS FlexCel for VCL & FMX Crack 强大、广泛和灵活的组件套件&#xff0c;用于VCL和FireMonkey的本地Excel报告、文件生成和操作。 FlexCel for VCL/FireMonkey是一套允许操作Excel文件的Delphi组件。它包括一个广泛的API&#xff0c;允许本地读/写Excel文件。如果您需要在…

无极低代码,免费工具在线实用工具分享

在当今数字化的时代&#xff0c;我们需要尽可能地减少手动操作&#xff0c;提高工作效率。这就是为什么我们需要一些在线工具来帮助我们完成一些繁琐的任务。以下是一些无极低代码网集成的在线工具&#xff0c;可以帮助您更快、更轻松地完成任务。 项目管理 项目周期计算&…

【自监督预训练 2023】MCL

【自监督预训练 2023】MCL 论文题目&#xff1a;Multi-Level Contrastive Learning for Dense Prediction Task 中文题目&#xff1a;稠密预测任务的多级对比学习 论文链接&#xff1a;https://arxiv.org/abs/2304.02010 论文代码&#xff1a;https://github.com/GuoQiushan/MC…

基于Web API drap事件的简单拖拽功能

基于Web API drap事件的简单拖拽功能 效果示例图代码示例 效果示例图 代码示例 <!DOCTYPE html> <html><head><meta charset"utf-8"><title></title><style type"text/css">* {padding: 0px;margin: 0px;box-s…

CSS学习简记(更新中~)

CSS定义 层叠样式表&#xff08;Cascading Style Sheets, 缩写为CSS&#xff09;,是一种样式表语言&#xff0c;用来描述HTML文档的呈现&#xff08;美化内容&#xff09; CSS书写规则 选择器 {属性名:属性值; } CSS引入方式 内部样式表 CSS代码直接写在style标签内外部样式…

你真的会用async和await么?

背景 背景就是遇到了一个比较烦人的模块&#xff0c;里面的涉及到了大量的async 和 awiat。发现大多人对这个语法糖一知半解&#xff0c;然后大量的滥用&#xff0c;整理一下 async 前置知识&#xff1a; Promise.resolve(foo) new Promise(resolve > resolve(foo)…

面试题汇总——Java集合(Collection和Map)

1简单介绍一下Java集合类 位置:Java的所有集合类都在java.util包下,从JDK5.0开始为了处理多线程环境下的并发安全问题,又在java.util.concurrent包下提供了一些多线程支持的集合类。 内容:Java的集合类主要有两个接口派生而出:Collection和Map。 1.1Collection Collect…

5年经验之谈 —— 功能测试和性能测试的区别是什么?

刚刚入门软件测试的宝子&#xff0c;可能经常会看到&#xff1a;功能测试、性能测试&#xff0c;这些到底是什么呀&#xff1f;那我就带大家了解一下~ 一、定义 功能测试 功能测试就是对产品的各功能进行验证&#xff0c;根据功能测试用例&#xff0c;逐项测试&#xff0c;检…

二叉树的右视图

给定一个二叉树的 根节点 root&#xff0c;想象自己站在它的右侧&#xff0c;按照从顶部到底部的顺序&#xff0c;返回从右侧所能看到的节点值。 示例 1: 输入: [1,2,3,null,5,null,4] 输出: [1,3,4] 示例 2: 输入: [1,null,3] 输出: [1,3] 示例 3: 输入: [] 输出: [] 代…

dbever找到对应的密码【dbever找到对应的密码图文java代码版本】

String file “C:\Users\test\AppData\Roaming\DBeaverData\workspace6\mydeaver\.dbeaver\”; 填写自己对应的路径 <dependency><groupId>com.alibaba</groupId><artifactId>fastjson</artifactId><version>1.2.83</version> &l…

Linux 安装oracle_11g保姆级安装教程及安装Oracle常见问题处理

一 安装linux 1 Linux系统 安装前的准备 linux安装建议&#xff1a; 1&#xff09;脑内存1G&#xff0c;交换空间是物理内存的两倍&#xff0c;空闲空间&#xff08;/tmp目录&#xff09;至少1G 2&#xff09;选择服务时&#xff0c;建议全部选中&#xff0c;关闭防火墙&am…

【图像分割 2023 CVPR】CFNet

文章目录 【图像分割 2023 CVPR】CFNet摘要1. 简介2. 相关工作2.1 稠密预测的主干网设计2.2 多尺度特征融合 3. 方法3.1 整体架构3.2 过渡块3.4 结构变体 【图像分割 2023 CVPR】CFNet 论文题目&#xff1a;CFNet: Cascade Fusion Network for Dense Prediction 中文题目&#…

el-table找出当前单元格与对应的上下列的值

当前单元格与对应的上下列的值如果不相同就设置个红色边框 当前单元格与对应的上下列的值如果不相同就设置个红色边框 当前单元格与对应的上下列的值如果不相同就设置个红色边框 以下是示例代码&#xff0c;对tableData数据的name字段进行处理 如果当前name值与上一条数据的na…