笔记:
字符串哈希主要用字符串前缀哈希法解决问题。
我们首先用unsigned long long存储hash数组,hashx表示原字符串str1…x的哈希值。
利用这个方法,我们可以快速地求出一段字符串的哈希值。
但在之前我们要算hash数组。
- 把字符串看作P进制数。
- 如“ABCD”可以表示为(1234)p。
- 把P进制数转化为10进制数。
- (1234p)=(1×p3+2×p2+3×p1+4×p0)
- 模运算。
- 对这个10进制数取模。hashx mod Q。
经验:
当P=131或P=13331,Q=264时,有99.99%的概率不会发生冲突。
对于mod 264,可以采用unsigned long long,溢出时会自动取模。
如何求区间哈希值?
已知hashL−1和hashR。
则hashL…R=hash[R]−hash[L−1]×PR−L+1。
判定区间字串是否相等,判定它们的hash值即可。
代码:
#include <bits/stdc++.h>
using namespace std;
const int N = 1e5 + 10, P = 131;
unsigned long long h[N], p[N];
char str[N];
unsigned long long get(int l, int r) {
return h[r] - h[l - 1] * p[r - l + 1];
}
int main() {
int n, m;
scanf("%d%d", &n, &m);
cin >> str + 1;
p[0] = 1;
for (int i = 1; i <= n; i++) {
p[i] = p[i - 1] * P;
h[i] = h[i - 1] * P + str[i];
}
while (m--) {
int l1, r1, l2, r2;
scanf("%d%d%d%d", &l1, &r1, &l2, &r2);
if (get(l1, r1) == get(l2, r2)) puts("Yes");
else puts("No");
}
return 0;
}
出现 hash 冲突怎么办 🈚
所以采用拉链法或者开放寻址法解决冲突呀
写双模数哈希就够了
这里get里面的l - 1啥意思,一直不理解