哈希表
时间复杂度为O(1)
拉链法
把X代表的数字映射到N所在区间,有可能会发生冲突俩个或多个数字映射到1个数
拉链法:把冲突的数字挂起来,用单链表挂起来
一般取模的数要取成质数,而且这个质数离二的n次幂要比较远,这样取冲突的概率是最小的。
#define _CRT_SECURE_NO_WARNINGS
#include<iostream>
#include<cstring>
using namespace std;
const int N = 100003;//大于十万的第一个质数是100003
int h[N];//槽
int e[N], ne[N], idx;//单链表
void insert(int x)
{
int k = (x % N+N)%N;//x%N将数变小,再+N是为了保证数是正数,由于加N之后数会变大,所以最后再模N,k是哈希值
//把当前x挂到H[k]上
e[idx] = x;//先把x放入单链表
ne[idx] = h[k];//先让新节点指向h[K]
h[k] = idx++;//再让H[K]指向这个节点
}
bool find(int x)
{
int k = (x % N + N) % N;//先映射x
//接下来在单链表里面找x
for (int i = h[k]; i != -1; i = ne[i])
{
if (e[i] == x)
return true;
}
return false;
}
int main()
{
int n;
scanf("%d", &n);
memset(h, -1, sizeof h);//先把所有的槽清空
while (n--)
{
char op[2];
int x;
scanf("%s%d", op, &x);
if (*op == 'I')
{
insert(x);
}
else
{
if (find(x))//如果能找到x,输出Yes
puts("Yes");
else//如果找不到x,输出No
puts("No");
}
}
return 0;
}
开放寻址法
开放寻址法只开了一个一维数组,该数组一般为题目要求长度的俩到三倍,这样可以降低冲突
跟公交车找空位是同一个道理
一般删除x的时候,若找到了x,则不会真正删掉,而是标记一下x
先找一下大于20w最小的质数
#include<iostream>
#include<cstring>
using namespace std;
const int N = 200003,null=0x3f3f3f3f;//开放寻址法一般开2到3倍,null不在要查找的数据范围内
int h[N];
int find(int x)//若x存在返回x实际所在位置,若x不存在返回x应该存储的位置
{
int k = (x % N + N) % N;
while (h[k] != null && h[k] != x)//如果当前位置有数字,并且这个数字不是x
{
k++;
if (k == N)//如果已经走到了结尾,就从头开始看
k = 0;
}
return k;//如果x在数组中,返回的是下标,如果不在数组中,返回的是应该存储的位置
}
int main()
{
int n;
scanf("%d", &n);
memset(h, 0x3f, sizeof h);//先把所有的槽清空
while (n--)
{
char op[2];
int x;
scanf("%s%d", op, &x);
if (*op == 'I')
{
int k = find(x);
h[k] = x;
}
else
{
int k = find(x);
if (h[k]==null)//如果能找到x,输出Yes
puts("No");
else//如果找不到x,输出No
puts("Yes");
}
}
return 0;
}
字符串哈希
这样取P和Q可以避免好多冲突
类似于进制转换把字符串转换成数字,把字符串看作P进制的数,最好不要把数字映射成0
如A映射成0,转为10进制A=0,AA=0,AAA=0这样会出错
求出[L,R]这段的哈希值
对于一个字符串:"A B C A B C D E X A C W I N G ABCABCDEXACWINGABCABCDEXACWING"
有前缀哈希数组h hh,则有
h [ 0 ] = 0 h[0]=0h[0]=0
h [ 1 ] = h[1]=h[1]=“A AA” 的哈希值
h [ 2 ] = h[2]=h[2]=“A B ABAB” 的哈希值
h [ 3 ] = h[3]=h[3]=“A B C ABCABC” 的哈希值
h [ 4 ] = h[4]=h[4]=“A B C A ABCAABCA” 的哈希值
⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ······⋅⋅⋅⋅⋅⋅
这里的 h hh 数组存储的是这个字符串的哈希值
比如"A B C D ABCDABCD"这个字符串,看成是 p pp进制的数
A B C D A B C DABCD
( 1234 ) P ( 1 2 3 4)_P(1234)P
= ==( 1 ∗ p 3 + 2 ∗ p 2 + 3 ∗ p 1 + 4 ∗ p 0 ) % Q (1*p^3+2*p^2+3*p^1+4*p^0)\%Q(1∗p3+2∗p2+3∗p1+4∗p0)%Q
这样就把任何一个字符串映射成了[ 0 , Q − 1 ] [0,Q-1][0,Q−1]之间的一个数
P S : PS:PS:
一般不能把一个字母映射成0,比如上面把A映射成0,那么ABCD和BCD的哈希值都是一样的了
经验值:当P = 131 P=131P=131或者P = 13331 P=13331P=13331,Q = 2 64 , 一 般 的 99.99 % 的 情 况 下 不 会 出 现 冲 突 , 冲 突 的 概 率 大 约 是 几 十 亿 分 之 一 Q=2^{64},一般的99.99\%的情况下不会出现冲突,冲突的概率大约是几十亿分之一Q=264,一般的99.99%的情况下不会出现冲突,冲突的概率大约是几十亿分之一
这里我们直接用ULL,因为溢出相当于取模
可以先预处理p数组,之后查询的时候就非常快:
p [ i ] = p [ i − 1 ] ∗ P p[i]=p[i-1]*Pp[i]=p[i−1]∗P
预处理 h hh 哈希数组:
a r r [ i ] = a r r [ i − 1 ] ∗ p + s t r [ i ] arr[i]=arr[i-1]*p+str[i]arr[i]=arr[i−1]∗p+str[i],其 中 s t r [ i ] 只 要 不 为 0 就 行 其中str[i]只要不为 0 就行其中str[i]只要不为0就行
得到一个字符串中的[ l , r ] [l,r][l,r]段子字符串的哈希值是:
a r r [ r ] − a r r [ l − 1 ] ∗ p [ r − l + 1 ] arr[r]-arr[l-1]*p[r-l+1]arr[r]−arr[l−1]∗p[r−l+1]
const int N= 100010,P=131;
typedef unsigned long long ULL;
int n, m;
char str[N];
ULL h[N], p[N];//P用来存储P的多少次方
ULL get(int l, int r)
{
return h[r] - h[l - 1] * p[r - l + 1];
}
int main()
{
scanf("%d%d%s", &n, &m, str + 1);
p[0] = 1;//p的0次方是1
for (int i = 1; i <= n; i++)
{
p[i] = p[i - 1] * P;
h[i] = h[i - 1] * P + str[i];
}
while (m--)
{
int l1, r1, l2, r2;
scanf("%d%d%d%d", &l1, &r1, &l2, &r2);
if (get(l1, r1) == get(l2, r2))
puts("Yes");
else
puts("No");
}
return 0;
}
STL使用
vecotr长度为10,里面数字全部是3
map可以像数组一样来使用
bitset压位