算法通关(4)-- 前缀树

news2024/11/28 3:45:37

前缀数原理和代码

原理

前缀树(Trie树),也称为字典树,是一种用于高效存储和检索字符串的数据结构。它是一种树形结构,能够利用字符串的公共前缀来减少存储空间和查询时间。

现在有“acb”,"cba","acc","ac"四个字符串,利用这四个字符串构出一颗前缀树。根节点不包含任何字符,是所有字符串的公共前缀;每个节点包含pass信息,代表加节点的时候路过了几次,还有一个end信息表示多少个字符串是以当前字符串结尾的。举个例子:
 

 插入完成后得到的树形结构:

那么现在问:字符串acb出现了几次。由前缀树的end的得知出现了1次,当然,哈希表也能做到,但是如果说以ac开头的字符串出现了几次,这样子哈希表并不能做到,前缀树可以,出现了3次,依据p值 。

没有路就新建节点,有路就复用节点

那么前缀树的优缺点就体现出来了
优点:根据前缀信息选择树上的分支,可以节省大量空间。
缺点:比较浪费空间,和总字符数量有关,还和字符的种类有关

类的方式实现

需要实现的方法:

1.Trie() 初始化前缀树对象

首先是每个节点,需要pass,以及end来进行记录,nexts数组记录该节点后应该连接哪一个点

class TrieNode {
public:
	int pass;			// 通过该节点的字符串数量
	int end;			// 以该节点为结尾的字符串数量
	vector<TrieNode*>nexts;	// 子节点指针数组
	TrieNode() :pass(0), end(0), nexts(26, nullptr) {};
};

前缀树初始化的时候就是把头节点建出来就可以了。

private:
	TrieNode root;

public:
	Trie() {
		root = TrieNode();
	}

2.void insert(String word)字符串插入
 

void insert(const string &word) {
	// 向前缀树插入word
	TrieNode* node = &root;
    // 根节点路过++
	node->pass++;
    // 遍历每个字符
	for (char c : word) {
        // 'a' --> 0
        // 'b' --> 1
        // ...
        // 'z' --> 25
		int index = c - 'a';
		if (node->nexts[index] == nullptr) {
			// 没有就新建
			node->nexts[index] = new TrieNode();
		}
		// 有就复用
		node = node->nexts[index];
		node->pass++;
	}
    // 字符遍历完了,end++
	node->end++;
}

3.int search(String word) 返回前缀树字符串word的实例个数

int search(const string &word) {
	// 返回前缀树中字符串word的实例个数
	TrieNode* node = &root;
    // 一个一个字符寻找
	for (char c : word) {
        // 按照插入的index
		int index = c - 'a';
        // 没找到,返回0,表示0个
		if (node->nexts[index] == nullptr) {
			return 0;
		}
        // 找到了,继续走
		node = node->nexts[index];
	}
    // 走完了,返回end
	return node->end;
}

4.int prefixNumber(String prefix)返回前缀树以prefix为开头的个数

和search相同,只是返回值不同

int predixNumber(const string& prefix) {
	// 返回前缀树以prefix为前缀的字符串个数
	TrieNode* node = &root;
	for (char c : prefix) {
		int index = c - 'a';
		if (node->nexts[index] == nullptr) {
			return 0;
		}
		node = node->nexts[index];
	}
	return node->pass;
}

5.void delete(String word)移除字符串word

要删除某个字符串,首先要查询一下前缀树中是否有该字符串,有字符串才能够删除

// 单词是否插入过前缀树
bool countWord(const string &word) {
	TrieNode* node = &root;
	for (char c : word) {
		int index = c - 'a';
		if (node->nexts[index] == nullptr) {
			return false;
		}
		node = node->nexts[index];
	}
    // pass大于0,才能表示插入过
	return node->pass > 0;
}

void to_delete(const string &word) {
	// 从前缀树移除字符串word
    // 存在才移除
	if (countWord(word)) {
		// 插入过前缀树
		TrieNode* node = &root;
		node->pass--;
		for (char c : word) {
			int index = c - 'a';
			if (--node->nexts[index]->pass == 0) {
				// a->b->c
				//	   ->e->f 现在删除a,b,e,f,当看到--e为空,直接附空,后面不用看了
				delete node->nexts[index];  
				node->nexts[index] = nullptr;
				return;
			}
            // 如果不是,沿途的每个pass都--
			node = node->nexts[index];
		}
		node->end--;
	}
	else {
		cout << "没有 " << word << " 这个单词! " << endl;
	}
}

静态数组的方式实现

先申请一个足够大的空间Tree,假设整个字符集只有三种字符a,b,c,那么申请出的二维数组为Tree[N][3],初始全为0,3代表去三个字符的路

初始

图中的1,2,3... 可以看作节点编号 
还有一个计算器cnt,表示节点编号,初始值为1,赋给根节点,当插入字符串“acb”时,对于第一个字符'a',走第一列,看到(a,1)位置为0,表示没有路,cnt++变成2,那么此处的0变成2;对于'c',2号节点走向c,那么(c,2)位置的0变成3;同理,(b,3)位置变成4;

 再次插入"ab",a是有的(1编号的a位置是2),b是没得(2编号的b位置是0),因此可以得到如下图:

 字典树的实现_牛客题霸_牛客网
代码如下:

public static int MAXN = 150001;
    // 26个英文字母
	public static int[][] tree = new int[MAXN][26];
    // end和pass申请空间,存每个节点
	public static int[] end = new int[MAXN];
	public static int[] pass = new int[MAXN];
    // 每个节点的编号
	public static int cnt;
    // 头节点
	public static void build() {
		cnt = 1;
	}

	public static void insert(String word) {
		int cur = 1;
		pass[cur]++;
		for (int i = 0, path; i < word.length(); i++) {
            // 找编号
			path = word.charAt(i) - 'a';
			if (tree[cur][path] == 0) {
                // 找不到新建
				tree[cur][path] = ++cnt;
			}
            // 找到利用
			cur = tree[cur][path];
			pass[cur]++;
		}
		end[cur]++;
	}

	public static int search(String word) {
		int cur = 1;
		for (int i = 0, path; i < word.length(); i++) {
			path = word.charAt(i) - 'a';
            // 路断了
			if (tree[cur][path] == 0) {
				return 0;
			}
			cur = tree[cur][path];
		}
		return end[cur];
	}

	public static int prefixNumber(String pre) {
		int cur = 1;
		for (int i = 0, path; i < pre.length(); i++) {
			path = pre.charAt(i) - 'a';
			if (tree[cur][path] == 0) {
				return 0;
			}
			cur = tree[cur][path];
		}
		return pass[cur];
	}

	public static void delete(String word) {
		if (search(word) > 0) {
			int cur = 1;
			for (int i = 0, path; i < word.length(); i++) {
				path = word.charAt(i) - 'a';
				if (--pass[tree[cur][path]] == 0) {
					tree[cur][path] = 0;
					return;
				}
				cur = tree[cur][path];
			}
			end[cur]--;
		}
	}
    // 初始化全部是0
	public static void clear() {
		for (int i = 1; i <= cnt; i++) {
			Arrays.fill(tree[i], 0);
			end[i] = 0;
			pass[i] = 0;
		}
	}

	public static int m, op;

	public static String[] splits;

	public static void main(String[] args) throws IOException {
		BufferedReader in = new BufferedReader(new InputStreamReader(System.in));
		PrintWriter out = new PrintWriter(new OutputStreamWriter(System.out));
		String line = null;
		while ((line = in.readLine()) != null) {
			build();
			m = Integer.valueOf(line);
			for (int i = 1; i <= m; i++) {
				splits = in.readLine().split(" ");
				op = Integer.valueOf(splits[0]);
				if (op == 1) {
					insert(splits[1]);
				} else if (op == 2) {
					delete(splits[1]);
				} else if (op == 3) {
					out.println(search(splits[1]) > 0 ? "YES" : "NO");
				} else if (op == 4) {
					out.println(prefixNumber(splits[1]));
				}
			}
			clear();
		}
		out.flush();
		in.close();
		out.close();
	}

相关题目

题目1:

接头密匙_牛客题霸_牛客网

将得到的新数组进行前缀树的插值,为了正确的插入1,而不是11,字符串改为1#1#1#1#1#,表示相隔一个字符终止一次,将所有的a数组的每个小数组的值构成前缀树,那么利用b数组中的字符串查找b相关的字符串出现了几次,每查一个b中的小数组记录一次,总记录得到的就是答案。
那么如果a数组的值相差很大呢,例如[1,1000,10000],得到的是[999,9999],那么是不是开10000个,不能,这样子有空间浪费;我们应该将数字转为字符串,"999#","9999#",可以这样子构建前缀树,如图

const int MAXN = 2000001;
// 12代表 0~9 10个 + 1 个负号 + 1 个符号(#)
int tree[MAXN][12];
int pass[MAXN];
int cnt;
// 静态数组的方式构建
void build() {
	cnt = 1;
}
// 12条路进行匹配
int path(char cha) {
	if (cha == '#') {
		return 10;
	}
	else if (cha == '-') {
		return 11;
	}
	else {
		return cha - '0';
	}
}

void insert(const string& word) {
	int cur = 1;
	pass[cur]++;
	for (char c : word) {
		int p = path(c);
		if (tree[cur][p] == 0) {
			tree[cur][p] = ++cnt;
		}
		cur = tree[cur][p];
		pass[cur]++;
	}
}

int count(const string& pre) {
	int cur = 1;
	for (char c : pre) {
		int p = path(c);
		if (tree[cur][p] == 0) {
			return 0;
		}
		cur = tree[cur][p];
	}
	return pass[cur];
}

void clear() {
	memset(tree, 0, sizeof(tree));
	memset(pass, 0, sizeof(pass));
	cnt = 1;
}

vector<int> countConsistentKeys(vector<vector<int>>& b, vector<vector<int>>& a) {
	build();
	string builder;
	// for循环的作用
	// [3,5,20,15] --> 2#15#-5
	for (const auto& nums : a) {
		builder.clear();
		for (size_t i = 1; i < nums.size(); ++i) {
			builder += to_string(nums[i] - nums[i - 1]) + "#";
		}
		// 将2#15#-5加到前缀树中
		insert(builder);
	}
	// b数组也是这样的变化,每次查询收集一个答案
	vector<int> ans(b.size());
	for (size_t i = 0; i < b.size(); ++i) {
		builder.clear();
		const auto& nums = b[i];
		for (size_t j = 1; j < nums.size(); ++j) {
			builder += to_string(nums[j] - nums[j - 1]) + "#";
		}
		ans[i] = count(builder);
	}
	clear();
	return ans;
}

题目2:

421. 数组中两个数的最大异或值 - 力扣(LeetCode)

如何得到最大值?拿一个数字举例,为了方便,拿8为二进制举例,最高位是0,表示正数

 由于'^'是遇到与自己不相同的是0,要想得到的数字尽可能地大,那么高位尽可能地是1;那么就把每个数字转化为二进制数,每个数构造成一颗前缀树

int findMaximumXOR(const vector<int>& nums) {
	// 每个数字构成前缀树
	build(nums);
	// 最小值是0,自己和自己^
	int ans = 0;
	for (int num : nums) {
		// 找最大结果
		ans = max(ans, maxXor(num));
	}
	clear();
	return ans;
}
void build(const vector<int>& nums) {
	// 不需要了end和pass
	// 头节点
	cnt = 1;
	// 找最大值
	int mx = INT_MIN;
	for (int num : nums) {
		mx = max(num, mx);
	}
	// 找最大值二进制有多少个前缀0,如果所有位置前面都是0,那么没有意义,0^0还是0
	// 0 0 0 0 0 1 0
	// 0 0 0 0 1 0 0  那么前4位就没有意义,和算最大值无关
	// 每个位置都是从high位置插入
	unsigned long index;

	// 使用 _BitScanReverse 来找到第一个1的位置
	if (_BitScanReverse(&index, mx)) {
		high = 31 - index; // 31是int类型的位数减1
	}
	for (int num : nums) {
		insert(num);
	}
}
void insert(int num) {
	int cur = 1;
	// 从固定位置插入
	for (int i = high; i >= 0; --i) {
		// 判断当前位置i是0还是1
		int path = (num >> i) & 1;
		if (tree[cur][path] == 0) {
			// 如果tree数组对应位置是0,新建一条路
			tree[cur][path] = ++cnt;
		}
		// 不是0,就用原来的
		cur = tree[cur][path];
	}
}
int maxXor(int num) {
	// 使异或结果尽量大
	int ans = 0;
	// 从头结点开始
	int cur = 1;
	// high位开始
	for (int i = high; i >= 0; --i) {
		// 取第i为的状态,是0还是1
		int status = (num >> i) & 1;
		// 想要的
		// 1要0  0要1
		int want = status ^ 1;
		// 如果不能达成
		if (tree[cur][want] == 0) {
			// 恢复为status,被迫接受
			want ^= 1;
		}
		// want是真的向下走的路
		// (status^want) == 0 或者 1
		// << i 放到i位置上取
		// ans |= 放到ans里去
		ans |= (status ^ want) << i;
		cur = tree[cur][want];
	}
	return ans;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2235684.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【CSS】“flex: 1“有什么用?

flex 属性的组成 flex 属性是一个复合属性&#xff0c;包含以下三个子属性&#xff1a; flex-grow&#xff1a;决定元素在容器中剩余空间的分配比例。默认值为 0&#xff0c;表示元素不会扩展。当设置为正数时&#xff0c;元素会按照设定比例扩展。flex-shrink&#xff1a;决…

【dvwa靶场:XSS系列】XSS (Stored)低-中-高级别,通关啦

更改name的文本数量限制大小&#xff0c; 其他我们只在name中进行操作 【除了低级可以在message中进行操作】 一、低级low <script>alert("假客套")</script> 二、中级middle 过滤了小写&#xff0c;咱们可以大写 <Script>alert("假客套…

大数据-212 数据挖掘 机器学习理论 - 无监督学习算法 KMeans 基本原理 簇内误差平方和

点一下关注吧&#xff01;&#xff01;&#xff01;非常感谢&#xff01;&#xff01;持续更新&#xff01;&#xff01;&#xff01; 目前已经更新到了&#xff1a; Hadoop&#xff08;已更完&#xff09;HDFS&#xff08;已更完&#xff09;MapReduce&#xff08;已更完&am…

神经网络基础--什么是正向传播??什么是方向传播??

前言 本专栏更新神经网络的一些基础知识&#xff1b;这个是本人初学神经网络做的笔记&#xff0c;仅仅堆正向传播、方向传播就行了了一个讲解&#xff0c;更加系统的讲解&#xff0c;本人后面会更新《李沐动手学习深度学习》&#xff0c;会更有详细讲解;案例代码基于pytorch&a…

【大模型系列】Grounded-VideoLLM(2024.10)

Paper&#xff1a;https://arxiv.org/pdf/2410.03290Github&#xff1a;https://github.com/WHB139426/Grounded-Video-LLMHuggingface&#xff1a;https://huggingface.co/WHB139426/Grounded-Video-LLMAuthor&#xff1a;Haibo Wang et al. 加州大学&#xff0c;复旦 动机&a…

IDEA2024下安装kubernetes插件并配置进行使用

【1】安装插件 其实2024.2.3下默认已经安装了kubernetes插件&#xff0c;如果你发现自己IDEA中没有&#xff0c;在市场里面检索并下载即可。 【2】kubernetes配置 ① 前置工作 首先你要准备一个config文件和一个kubectl.exe 。 config文件类似如下&#xff1a; apiVersi…

onnx-web + yolov8n 在视频流里做推理

顺着我上一篇文章 使用onnxruntime-web 运行yolov8-nano推理 继续说&#xff0c;有朋友在问能不能接入 视频流动&#xff0c;实时去识别物品。 首先使用 getUserMedia 获取摄像头视频流 getUserMedia API 可以访问设备的摄像头和麦克风。你可以使用这个 API 获取视频流&#…

Python练习11

Python日常练习 题目&#xff1a; 编写一个石头剪刀布游戏&#xff0c;该程序要求完成如下功能&#xff1a; (1) 显示游戏规则&#xff0c;提醒用户输入一个1-3的整数或者直接回车。 用户输入回车时游戏结束。 用户输入不合法&#xff08;包括输入的…

航展畅想:从F35机载软件研发来看汽车车载软件研发

两款经典战机的机载软件 F-22和F-35战斗机的研制分别始于1980年代和1990年代末&#xff0c;F-22项目在1981年启动&#xff0c;主要由洛克希德马丁&#xff08;Lockheed Martin&#xff09;和波音公司&#xff08;Boeing&#xff09;合作开发&#xff0c;以满足美军“先进战术战…

实践出真知:MVEL表达式empty的坑

目录标题 背景为什么呢&#xff1f;验证下empty的含义case1case2case3 结论具体解释&#xff1a; 背景 //是否白名单 if(goodInfo.?isWhite ! empty){showList.add(["label": "是否白名单","value":["text":(goodInfo.?isWhite tr…

RPC核心实现原理

目录 一、基本原理 二、详细步骤 三、额外考虑因素 RPC&#xff08;Remote Procedure Call&#xff0c;远程过程调用&#xff09;是一种计算机通信协议&#xff0c;也是一种用于实现分布式系统中不同节点之间进行通信和调用的技术。其实现原理主要可以分为以下几个步骤&…

Kaggle生物信息学挑战:酶稳定性预测大赛

背景介绍 酶的稳定性是影响其实际应用的关键因素之一。通过定点突变可以改善酶的稳定性,但实验筛选稳定性突变体的成本较高。预测突变对酶稳定性的影响,加速筛选稳定性更高的酶突变体。 概念解释 X 残基&#xff1a;假设 它用 红色表示 &#xff0c; Y 残基&#xff1a;假设…

【开发工具——依赖管理工具——Maven】

1. Maven介绍 Apache Maven 的本质是一个软件项目管理和理解工具。基于项目对象模型 (Project Object Model&#xff0c;POM) 的概念&#xff0c;Maven 可以从一条中心信息管理项目的构建、报告和文档。 对于开发者来说&#xff0c;Maven 的主要作用主要有 3 个&#xff1a; …

vue3+vite搭建脚手架项目本地运行electron桌面应用

1.搭建脚手架项目 搭建Vue3ViteTs脚手架-CSDN博客 2.创建完项目后&#xff0c;安装所需依赖包 npm i vite-plugin-electron electron26.1.0 3.根目录下创建electron/main.ts electron/main.ts /** electron/main.ts */import { app, BrowserWindow } from "electron&qu…

鸿蒙ArkTS中的获取网络数据

一、通过web组件加载网页 在C/S应用程序中&#xff0c;都有网络组件用于加载网页&#xff0c;鸿蒙ArkTS中也有类似的组件。   web组件&#xff0c;用于加载指定的网页&#xff0c;里面有很多的方法可以调用&#xff0c;虽然现在用得比较少&#xff0c;了解还是必须的。   演…

无人车之路径规划篇

无人车的路径规划是指在一定的环境模型基础上&#xff0c;给定无人车起始点和目标点后&#xff0c;按照性能指标规划出一条无碰撞、能安全到达目标点的有效路径。 一、路径规划的重要性 路径规划对于无人车的安全、高效运行至关重要。它不仅能够提高交通效率&#xff0c;减少交…

C语言心型代码解析

方法一 心型极坐标方程 爱心代码你真的理解吗 笛卡尔的心型公式&#xff1a; for (y 1.5; y > -1.5; y - 0.1) for (x -1.5; x < 1.5; x 0.05) 代码里面用了二个for循环&#xff0c;第一个代表y轴&#xff0c;第二个代表x轴 二个增加的单位不同&#xff0c;能使得…

11月7日(内网横向移动(二))

利用系统服务 SCShell SCShell是一款利用系统服务的无文件横向移动工具。与传统的创建远程服务的方法不同&#xff0c;SCShell利用提供的用户凭据&#xff0c;通过ChangeServiceConfigA API修改远程主机上的服务配置&#xff0c;将服务的二进制路径名修改为指定的程序或攻击载…

【YOLOv11[基础]】目标检测OD | 导出ONNX模型 | ONN模型推理以及检测结果可视化 | python

本文将导出YOLO11.pt模型对应的ONNX模型,并且使用ONNX模型推理以及结果的可视化。话不多说,先看看效果图吧!!! 目录 一 导出ONNX模型 二 推理及检测结果可视化 1 代码 2 效果图

力扣—不同路径(路径问题的动态规划)

文章目录 题目解析算法原理代码实现题目练习 题目解析 算法原理 状态表示 对于这种「路径类」的问题&#xff0c;我们的状态表示⼀般有两种形式&#xff1a; i. 从[i, j] 位置出发。 ii. 从起始位置出发&#xff0c;到[i, j] 位置。 这⾥选择第⼆种定义状态表⽰的⽅式&#xf…