题目描述
给定一个长度为n的字符串,再给定m个询问,每个询问包含四个整数l1,r1,l2,r2,请你判断[l1,r1]和[l2,r2]这两个区间所包含的字符串子串是否完全相同。
字符串中只包含大小写英文字母和数字。
输入格式
第一行包含整数n和m,表示字符串长度和询问次数。
第二行包含一个长度为n的字符串,字符串中只包含大小写英文字母和数字。
接下来m行,每行包含四个整数l1,r1,l2,r2,表示一次询问所涉及的两个区间。
注意,字符串的位置从1开始编号。
输出格式
对于每个询问输出一个结果,如果两个字符串子串完全相同则输出“Yes”,否则输出“No”。
每个结果占一行。
数据范围
1≤n,m≤105
输入样例:
8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes
思路
字符串哈希,采用的是利用字符前缀计算
比如str = " abcabc"
h[0] = 0
h[1] = a的哈希
h[2] = ab的哈希
....
计算区间L,R的hash值, 字符存储从1号位置开始
高位 低位
|__|____________|_|________|_________________________|
0 1 L-1 L R
h[R] 从高位到低位 p^R-1 ... p^0
h[L-1] 从高位到低位 p^L-1 ... p^0 h[L-1] x p ^ (R - L + 1) 左移R和L-1位置的差值
计算l, r区间hash值 h[r] - h[l - 1] * p[r - l + 1];
p 按照经验值取 131 13331
q 用于取模(1 x p ^ 0 + 2 x p ^ 1 + ....)%q,
一般取2^64, 因此数值范围定义为unsigned long long
例子
1234 12 求34 只需要 1234 - 12 << 2 = 1234 - 1200 = 34
核心代码1
计算hash值
```
p[0] = 1; //P^0
for(int i = 1; i <= n; i ++){
h[i] = h[i - 1] * P + str[i];
p[i] = p[i - 1] * P;
}
```
p = [P^0, P^1, P^2, P^3] **记录高位到l-1位置需要向前移动的位数(R - L + 1)**
h0 = 0 * P + str1
h1 = (p + str1) * p + str2
h2 = ((p + str1) * p + str2) * p + str3
核心代码2
计算区间hash值
```
usigned long long get(int l, int r){
return h[r] - h[l - 1] * p[r - l + 1];
}
```
c++代码
#include <iostream>
using namespace std;
typedef unsigned long long ULL;
const int N = 100010, P = 131;
int n, m;
char str[N];
ULL h[N], p[N];
ULL get(int l, int r){
return h[r] - h[l - 1] * p[r - l + 1];
}
int main(){
scanf("%d%d%s", &n, &m, str + 1);
p[0] = 1;
//p = [1, P, P * P, P * P * P]
//h0 = 0 * P + str1
//h1 = (p + str1) * p + str2
//h2 = ((p + str1) * p + str2) * p + str3
for(int i = 1; i <= n; i ++){
h[i] = h[i - 1] * P + str[i];
p[i] = p[i - 1] * P;
}
while(m --){
int l1, r1, l2, r2;
scanf("%d%d%d%d", &l1, &r1, &l2, &r2);
if(get(l1, r1) == get(l2, r2)) puts("Yes");
else puts("No");
}
return 0;
}