1、定义
高效的存储和查找字符串集合的数据结构
它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高
2、构建
我们可以使用数组来模拟实现Trie树。
我们设计一个二维数组 son[N] [26] 来模拟整个树的结构,而cnt[N] 来记录单词个数。
举个例子: son[1][1]=2 代表的是 1号节点 的一个值为b的节点 是 2号节点。而son[1][0]=0 则表示1号节点不存在 值为 a 的节点。
3、代码分析
1、定义
son[N][26]
下标是x的点
x这个节点的所有的儿子是去存储到son[x][26]里面
son[x][0]就是第一个节点 son[x][1]就是第二个节点
cont[x]表示以x为结尾的单词有多少个
int son[N][26], cnt[N], idx;
// 0号点既是根节点,又是空节点
// son[][]存储树中每个节点的子节点
// cnt[]存储以每个节点结尾的单词数量
2、插入操作
// 插入一个字符串
void insert(char *str)
{
int p = 0;
//从根节点开始,从前往后遍历
for (int i = 0; str[i]; i ++ )
{
//将a-z 映射成 0 - 25
int u = str[i] - 'a';
//如果当前节点不存在 => p节点不存在u这个儿子
//就创建出来
if (!son[p][u]) son[p][u] = ++ idx;
//将该值赋给p
p = son[p][u];
}
//以该点为结尾的数字多了一个
cnt[p] ++ ;
}
3、查询操作
// 查询字符串出现的次数
int query(char *str)
{
//从根节点开始
int p = 0;
for (int i = 0; str[i]; i ++ )
{
int u = str[i] - 'a';
//如果当前节点不存在子节点的话
if (!son[p][u]) return 0;
p = son[p][u];
}
//返回以p结尾的单词的数量
return cnt[p];
}
3.题目
维护一个字符串集合,支持两种操作:
1、 I x向集合中插入一个字符串 x;
2、 Q x询问一个字符串在集合中出现了多少次。
共有 N个操作,所有输入的字符串总长度不超过10^5 ,字符串仅包含小写英文字母。
输入格式
第一行包含整数 N,表示操作数。
接下来 N行,每行包含一个操作指令,指令为 I x 或 Q x 中的一种。
输出格式
对于每个询问指令 Q x,都要输出一个整数作为结果,表示 x在集合中出现的次数。
每个结果占一行。
数据范围
1≤N≤2∗10^4
输入样例:
5
I abc
Q abc
Q ab
I ab
Q ab
输出样例:
1
0
1
#include <iostream>
using namespace std;
const int N = 100010;
int son[N][26],idx,cnt[N];
char str[N];
//向集合中插入一个字符串 x
void insert(char str[])
{
int p = 0;
for (int i = 0; str[i]; i++)
{
int u = str[i] - 'a';
//将这个字符从a-z变成 0-25
if (!son[p][u]) son[p][u] = ++idx;
p = son[p][u];
}
cnt[p]++;
}
//询问一个字符串在集合中出现了多少次
int query(char str[])
{
int p = 0;
for (int i = 0; str[i]; i++)
{
int u = str[i] - 'a';
if (!son[p][u]) return 0;
p = son[p][u];
}
return cnt[p];
}
int main()
{
int n;
cin >> n;
while (n--)
{
char op[2];
cin >> op >> str;
if (op[0] == 'I') insert(str);
else cout << query(str)<< endl;
}
return 0;
}