字典树总结

news2025/2/28 19:47:00

字典树

一、概念

字典树 (Trie) 是一种用于实现字符串快速存储和检索的多叉树结构;

Trie 的每个节点都拥有若干个字符指针,若在插入或检索字符串时扫描到一个字符 c c c ,就沿着当前节点的 c c c 字符指针,走向该指针指向的节;

即 Trie 中的每一条边都表示一个字符,用点将这些字符连起来;

如图所示,

字典树概念及作用-1

即 Trie 中,字符数据都体现在树的边上,树的节点仅保存一些额外信息,如字符串结尾标记等;

空间复杂度是 O ( N ∗ C ) O(N*C) O(NC) ,其中 N N N 为节点个数, C C C 为字符集的大小;

时间复杂度是 O ( T ∗ l e n ) O(T*len) O(Tlen) ,其中 T T T 为串的个数, l e n len len 为串的长度;

二、操作

1. 初始化

一棵空的 Trie 仅包含一个根节点,该节点的字符指针均直向空;

int trie[MAXN][MAXX], tot = 1; // trie,节点编号 
bool end[MAXN]; // 末尾标记 

关于 MAXN 的大小,

  1. 若已知所有插入字符串长度之和,那么 MAXN 就是这个总长度;
  2. 若未知,则计算节点个数,由于深度为 k k k 的满二叉树的节点个数为 2 k − 1 2^{k} - 1 2k1 ,那么深度为 k k k 的满三叉树的节点个数为 3 k − 1 2 \frac{3^{k} - 1}{2} 23k1 ,则深度为 k k k 的满 n n n 叉树的节点个数为 n k − 1 n − 1 \frac{n^{k} - 1}{n - 1} n1nk1 ,则如果 Trie 中存小写字母,那最大就是一棵满 26 叉树,而 k k k 为最长串的长度;

关于 MAXX 的大小根据 Trie 存储的内容判断,若存储小写字母,则开 26 即可;

2. 插入

插入一个字符串 s s s 时,令一个指针 p p p 初始时指向根节点,然后依次扫描 s s s 中的每一个字母 c c c

  1. p p p c c c 字符指针指向一个已经存在的节点 q q q ,则令 p = q p = q p=q ,将 p p p 指针继续传递;
  2. p p p c c c 字符指针指向空节点,则新建一个节点 q q q ,令 p p p c c c 字符节点指向 q q q ,然后令 p = q p = q p=q ,将 p p p 指针继续传递;

s s s 中的字符扫描完毕时,在当前节点 p p p 上标记其是一个字符串的末尾,以免出现因存在后缀单词而无法检索的情况;

代码如下,

void insert1(char *str) { // 传入字符串 
	int len = strlen(str), p = 1; // 定义指针 p 最初指初始节点 
	for (int i = 0; i < len; i++) {
		int ch = str[i] - 'a'; // 当前字符指针 
		if (trie[p][ch] == 0) trie[p][ch] = ++tot; // 创建新节点 
		p = trie[p][ch]; // 指向下一个节点 
	}
	end[p] = true; // 标记结尾标记 
	return;
}

3. 检索

检索一个字符串 s s s 在 Trie 中是否存在时,令一个指针 p p p 初始时指向根节点,然后依次遍历 s s s 中的每个字符 c c c

  1. p p p c c c 字符指针指向空,则说明 s s s 没有被插入过 Trie 中,结束检索;
  2. p p p c c c 字符指针指向一个已经存在的节点 q q q ,则令 p = q p = q p=q ,将 p p p 指针继续传递;

s s s 中的字符扫描完毕后,

  1. 若当前节点 p p p 被标记为一个字符串的末尾,则说明 s s s 在Trie中存在;

  2. 若没有被标记,则说明 s s s 没有被插入过 Trie,只是为已插入过的单词的前缀;

bool search(char *str) { // 传入字符串 
	int len = strlen(str), p = 1; // 定义指针 p 最初指初始节点 
	for (int i = 0; i < len; i++) {
		p = trie[p][str[i] - 'a']; // 指向下一个节点 
		if (p == 0) return false; // 判断指针是否指向空 
	}
	return end[p]; // 判断是否标记末尾 
}

三、例题

1. 前缀统计

题目

给定 N N N 个字符串 S 1 , S 2... S N S1,S2...SN S1,S2...SN ,接下来进行 M M M 次询问,每次询问给定一个字符串 T T T ,求 S 1 ~ S N S1~SN S1SN 中有多少个字符串是T的前缀;

输入字符串的总长度不超过10^6,仅包含小写字母;

分析

把这 n n n 个字符串插入一棵 Trie 树中,Trie 树的每个节点上存储一个整数 c n t cnt cnt ,记录该节点是多少个字符串的末尾节点;

对于每个询问,在 Trie 树中检索 T T T ,在检索过程中累加途径中的每个节点的 c n t cnt cnt 值,就是该询问的答案;

代码

#include <cstdio>
#include <cstring>
#include <algorithm>
#define MAXN 1000005
using namespace std;
int n, m;
int trie[MAXN][35], tot = 1, cnt[MAXN];
void insert1(char *str) {
	int len = strlen(str), p = 1;
	for (int i = 0; i < len; i++) {
		int ch = str[i] - 'a';
		if (trie[p][ch] == 0) trie[p][ch] = ++tot;
		p = trie[p][ch];
	}
	cnt[p]++; // 存储以给节点为末尾的字符串数量 
	return;
}
int search(char *str) {
	int len = strlen(str), p = 1, ans = 0;
	for (int i = 0; i < len; i++) {
		p = trie[p][str[i] - 'a'];
		if (p == 0) return ans;
		ans += cnt[p]; // 将以该节点为末尾的字符串数量累加 
	}
	return ans;
}
int main() {
	scanf("%d %d", &n, &m);
	for (int i = 1; i <= n; i++) {
		char s[MAXN];
		scanf("%s", s);
		insert1(s);
	}
	for (int i = 1; i <= m; i++) {
		char s[MAXN];
		scanf("%s", s);
		printf("%d\n", search(s));
	}
	return 0;
}

2. The XOR Largest Pair

题目

在给定的 N N N 个整数 A 1 , A 2 , . . . , A N A_1, A_2, ... , A_N A1,A2,...,AN 中选出两个进行异或运算,得到的结果最大是多少?

分析

由于求异或值,可以把每个整数看作长度为 32 位的 01 串(不足32位时补前导0);

A 1 , . . . , A N A_1, ..., A_N A1,...,AN 对应的 32 位二进制插入一棵 Trie 树中(其中最低二进制位为叶子节点);

接下来,对于 A i A_i Ai 对应的 32 位二进制串,在 Trie 树中进行一次检索的过程;

每一步都尝试沿着与 A i A_i Ai 的当前位相反的字符指针向下访问;

若与 A i A_i Ai 的当前位相反的字符指针指向空节点,则访问与 A i A_i Ai 的当前位相同的字符指针延续路径,继续向下走;

根据异或运算的性质,即可找出与 A i A_i Ai 做异或运算结果最大的 A 1 ∼ A i − 1 A1 \sim Ai-1 A1Ai1

可以在每次检索完成后更新 ans ,再把当前 A i A_i Ai 插入 Trie 树中,继续遍历;

代码

#include <cstdio>
#include <cstring>
#include <algorithm>
#define MAXX 3100005
#define MAXN 100005
using namespace std;
int n, a[MAXN], ans = -1;
int trie[MAXX][5], tot = 1;
void insert1(int x) {
	int p = 1;
	for (int i = 30; i >= 0; i--) {
		int h = (x >> i) & 1;
		if (trie[p][h] == 0) trie[p][h] = ++tot;
		p = trie[p][h];
	}
	return;
}
int search(int x) {
	int p = 1, ans = 0;
	for (int i = 30; i >= 0; i--) {
		int h = (x >> i) & 1;
		if (trie[p][!h]) {
			p = trie[p][!h];
			ans = ans * 2 + 1;
		} else {
			p = trie[p][h];
			ans = ans * 2;
		}
	}
	return ans;
}
int main() {
	scanf("%d", &n);
	for (int i = 1; i <= n; i++) {
		scanf("%d", &a[i]);
		insert1(a[i]);
	}
	for (int i = 1; i <= n; i++) {
		ans = max(ans, search(a[i]));
	}
	printf("%d\n", ans);
	return 0;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/155320.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

支持向量机(SVM)入门(六,解决遗留问题)

但也出现了如下结果&#xff0c;看来任务没完没了&#xff08;svm深似海&#xff1f;&#xff09;&#xff0c;还得下功夫&#xff1a;前面我们的支持向量机到此便止步了&#xff0c;一晃两年&#xff0c;这几天有空&#xff0c;顺便研究了一下&#xff0c;问题有进展&#xff…

基于yolov5-v7.0开发构建汽车车损实例分割检测识别分析系统

在之前的文章中我们已经做了很多基于yolov5完成实例分割的项目&#xff0c;感兴趣的话可以自行移步阅读&#xff1a;《基于YOLOv5-v7.0的药片污染、缺损裂痕实例分割检测识别分析系统》《基于yolov5-v7.0开发构建裸土实例分割检测识别模型》《基于yolov5-v7.0开发实践实例分割模…

NSThead的进阶使用和简单探讨

概述 NSThread类是一个继承于NSObjct类的轻量级类。一个NSThread对象就代表一个线程。它需要管理线程的生命周期、同步、加锁等问题&#xff0c;因此会产生一定的性能开销。 使用NSThread类可以在特定的线程中被调用某个OC方法。当需要执行一个冗长的任务&#xff0c;并且不想…

文件minio进阶 分页查询

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录前言一、minio使用二、代码1.mino版本是最新的,那么pom中也要最新的2. 部分代码总结前言 就是现在通过minio管理文件,然后不需要其他信息,所以我也就没有用传统方式…

探究视频标注如何支持自动驾驶汽车

自动驾驶汽车技术有望使我们的道路更安全&#xff0c;同时提高运输和交付服务的效率。安全性和可靠性是自动驾驶汽车广泛采用所必需的关键因素。为了保证汽车在现实复杂的交通条件下导航能够有效运行&#xff0c;必须使用标注数据来训练基于计算机视觉的模型&#xff0c;这些数…

verilog学习笔记- 10)按键控制 LED 灯实验

目录 简介&#xff1a; 实验任务&#xff1a; 硬件设计&#xff1a; 程序设计&#xff1a; 下载验证 &#xff1a; 总结与反思&#xff1a; 简介&#xff1a; 按键开关是一种电子开关&#xff0c;属于电子元器件类。我们的开发板上有两种按键开关&#xff1a;第一种是本实…

NeRF制作数据集最后的踩坑

之前对数据集渲染的时候一直出现模糊的问题&#xff1a; 学长说可能是摄像机和poses没有对应。但是为什么会这样呢 后来我发现&#xff0c;确实在制作的过程中&#xff0c;某一步出了问题&#xff0c;导致下标的数字&#xff0c;跟理想的不一样&#xff1a; 原来的12&#xf…

基于yolov5-v7.0开发构建工业机械齿轮瑕疵实例分割检测识别分析系统

在之前的文章中我们已经做了很多基于yolov5完成实例分割的项目&#xff0c;感兴趣的话可以自行移步阅读&#xff1a;《基于YOLOv5-v7.0的药片污染、缺损裂痕实例分割检测识别分析系统》《基于yolov5-v7.0开发构建裸土实例分割检测识别模型》《基于yolov5-v7.0开发实践实例分割模…

深度学习PyTorch 之 DNN-回归(多变量)

深度学习&PyTorch 之 DNN-回归中使用HR数据集进行了实现&#xff0c;但是HR数据集中只有一个变量&#xff0c;这里我们使用多变量在进行模拟一下 流程还是跟前面一样 #mermaid-svg-LN8ayy7UjtqZ6dSj {font-family:"trebuchet ms",verdana,arial,sans-serif;font…

计算机原理三_进程管理

目录儿四、进程管理4.1 什么是进程4.1.1 进程的结构4.1.2 进程的特征4.1.3 进程与线程4.1.4 线程的实现方式用户级线程内核支持线程组合线程的调度4.2 进程是怎么运行的4.2.1 进程状态4.2.2 进程控制4.2.2.1 原语的概念4.2.2.2 挂起与激活4.2.3 进程调度4.2.3.1 调度层次4.2.3.…

CSS入门一、初识

零、文章目录 文章地址 个人博客-CSDN地址&#xff1a;https://blog.csdn.net/liyou123456789个人博客-GiteePages&#xff1a;https://bluecusliyou.gitee.io/techlearn 代码仓库地址 Gitee&#xff1a;https://gitee.com/bluecusliyou/TechLearnGithub&#xff1a;https:…

【BP靶场portswigger-服务端9】服务端请求伪造SSRF漏洞-7个实验(全)

前言&#xff1a; 介绍&#xff1a; 博主&#xff1a;网络安全领域狂热爱好者&#xff08;承诺在CSDN永久无偿分享文章&#xff09;。 殊荣&#xff1a;CSDN网络安全领域优质创作者&#xff0c;2022年双十一业务安全保卫战-某厂第一名&#xff0c;某厂特邀数字业务安全研究员&…

Episode 02 对称密码基础

一、从文字密码到比特序列密码 1、使用对称密钥进行加密 为了使原来的明文无法被推测出来&#xff0c;就要尽可能地打乱密文&#xff0c;这样才能达到加密的目的。密文打乱的是比特序列&#xff0c;无论是文本&#xff0c;图片还是音乐&#xff0c;只要能够将数据转换比特序列…

MSF后渗透持续后门

持续后门 ○ 利用漏洞取得的meterpreter shell运行于内存中&#xff0c;重启失效 ○ 重复exploit漏洞可能造成服务崩溃 ○ 持久后门保证漏洞修复后仍可远程控制 Meterpreter后门 run metsvc -A #删除-r use exploit/multi/handler set PAYLOAD windows/metsvc_bind_tcp se…

[22]. 括号生成

[22]. 括号生成题目算法设计&#xff1a;回溯算法设计&#xff1a;空间换时间题目 传送门&#xff1a;https://leetcode.cn/problems/generate-parentheses/ 算法设计&#xff1a;回溯 括号问题可以分成俩类&#xff1a; 括号的合法性判断&#xff0c;主要是用栈括号的合法生…

【自然语言处理】Word2Vec 词向量模型详解 + Python代码实战

文章目录一、词向量引入二、词向量模型三、训练数据构建四、不同模型对比4.1 CBOW4.2 Skip-gram 模型4.3 CBOW 和 Skip-gram 对比五、词向量训练过程5.1 初始化词向量矩阵5.2 训练模型六、Python 代码实战6.1 Model6.2 DataSet6.3 Main6.4 运行输出一、词向量引入 先来考虑一个…

IDEA远程快速部署SpringBoot项目到Docker环境

1.LInux上先安装docker环境 https://blog.csdn.net/YXWik/article/details/128643662 2.配置Docker远程连接端口 1. vim /usr/lib/systemd/system/docker.service 2. 找到ExecStar 在后面添加 -H tcp://0.0.0.0:2375 3. 退出编辑界面&#xff1a;先按esc&#xff0c;然后"…

【JAVA程序设计】(C00100)基于Springboot+html的前后端分离停车场管理系统

基于Springboothtml的前后端分离停车场管理系统项目简介项目获取开发环境项目技术运行截图项目简介 基于SpringBoothtml的前后端分离的停车场管理系统&#xff0c;本系统分为二种角色&#xff1a;管理员和收银员。 1&#xff0e;登录&#xff1a;管理员可以通过系统分配的账号…

Android 系统框架结构

目录 1.应用层(System Apps)&#xff1a; 2.应用框架层(Java API Framework)&#xff1a; 3.系统运行库层(Native)&#xff1a; 4.硬件抽象层(HAL)&#xff1a; 5.Linux内核层&#xff08;Linux Kernel&#xff09;&#xff1a; 大部分开发的同学是不太清楚Android的系统的…

解决企业微信启动报错:0x0000142无法打开

解决企业微信启动报错&#xff1a;0x0000142无法打开1.问题描述2.问题查找3.问题解决4.事后感悟系统&#xff1a;Win10 WXWork&#xff1a;4.0.20.6020 1.问题描述 不知道从啥时候开始&#xff0c;打开企业微信会报错&#xff08;见下图&#xff09;&#xff0c;报错代码是&am…