题目描述
给定一个长度为n的字符串,再给定m个询问,每个询问包含四个整数l1,r1,l2,r2,请你判断[l1,r1]和[l2,r2]这两个区间所包含的字符串子串是否完全相同。
字符串中只包含大小写英文字母和数字。
输入格式
第一行包含整数n和m,表示字符串长度和询问次数。
第二行包含一个长度为n的字符串,字符串中只包含大小写英文字母和数字。
接下来m行,每行包含四个整数l1,r1,l2,r2,表示一次询问所涉及的两个区间。
注意,字符串的位置从1开始编号。
输出格式
对于每个询问输出一个结果,如果两个字符串子串完全相同则输出“Yes”,否则输出“No”。
每个结果占一行。
数据范围
1≤n,m≤105
样例
输入样例:
8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes
算法1
题解
假设有|S|=5的字符串,设Si为第i个字符,其中1≤i≤5。
根据定义分别求出hash[i]
hash[1]=s1hash[1]=s1
hash[2]=s1∗p+s2hash[2]=s1∗p+s2
hash[3]=s1∗p2+s2∗p+s3hash[3]=s1∗p2+s2∗p+s3
hash[4]=s1∗p3+s2∗p2+s3∗p+s4hash[4]=s1∗p3+s2∗p2+s3∗p+s4
hash[5]=s1∗p4+s2∗p3+s3∗p2+s4∗p+s5hash[5]=s1∗p4+s2∗p3+s3∗p2+s4∗p+s5
现在我们想求s3s4的hash值,不难得出为s3∗p+s4,并且从上面观察,如果看hash[4]−hash[2]并将结果种带有s1,s2系数的项全部消掉,就是所求。但是由于p的阶数,不能直接消掉,所以问题就转化成,将hash[2]乘一个关于p的系数,在做差的时候将多余项消除,从而得到结果。
不难发现,对应项系数只差一个p2,而4 - 3 + 1 = 2(待求hash子串下标相减再加一),这样就不难推导出来此例题的求解式子。
hash[4]−hash[2]∗p4−2+1
至此,通过对上例的归纳,可以得出如下的公式。
公式
若已知一个|S|=n|S|=n的字符串的hash值,hash[i],1≤i≤n,其子串sl..sr,1≤l≤r≤n对应的hash值为:
hash=hash[r]−hash[l−1]∗pr−l+1
考虑到hash[i]每次对p取模,进一步得到下面的式子:
hash=(hash[r]−hash[l−1]∗pr−l+1)%MOD
看起来这个式子人畜无害,但是对于取模运算要谨慎再谨慎,注意到括号里面是减法,即有可能是负数,故做如下的修正:
hash=((hash[r]−hash[l−1]∗pr−l+1)%MOD+MOD)%MOD
至此得到求子串hash值公式。
值得一提的是,如果需要反复对子串求解hash值,预处理p的n次方效果更佳。
(STL)
// 该解决方法会爆int
#include <iostream>
#include <cstring>
using namespace std;
int n ,m;
string s;
int main(){
cin >> n >> m;
cin >> s;
while(m--){
int l1,r1,l2,r2;
cin>>l1>>r1>>l2>>r2;
string s1 = s.substr(l1-1,r1-l1+1);
string s2 = s.substr(l2-1,r2-l2+1);
if(s1==s2){
cout << "Yes" << endl;
}else{
cout << "No" << endl;
}
}
return 0;
}
C++ 代码
#include<iostream>
#include<algorithm>
using namespace std;
typedef unsigned long long ULL;
const int N=100010,M=131;
int n,m;
char str[N];
ULL p[N],h[N];
ULL get(int l,int r){
return h[r]-h[l-1]*p[r-l+1];
}
int main(){
cin>>n>>m;
cin>>str+1;
p[0]=1;
for(int i=1;i<=n;i++)
{
h[i]=h[i-1]*M+str[i];
p[i]=p[i-1]*M;
}
while(m--){
int l1,r1,l2,r2;
cin>>l1>>r1>>l2>>r2;
if(get(l1,r1)==get(l2,r2))puts("Yes");
else puts("No");
}
return 0;
}
为什么会爆int啊
因为数字太大了,你的P是131, 131的5次方就已经3e10了早就爆完int了
而且因为数字太大了, long long都暴了, 所以用unsigned long long每次超过long long都会自动取模
但是用 s.substr为啥会爆int啊
证明写的很好噢
卧槽 牛逼啊
这里get里面的l - 1啥意思,一直不理解
应该是求前缀和的意思
算法推导的过程真好
为什么不取模??????????为什么我不取模就对了,一取模就错了,按道理来说应该是大概率正确呀??????????????????????????????????????????????????????????????????
$\color{purple}{苟哥牛批!}$
老哥,那为什么体现到代码里,那个get函数里不需要加mod了呢
利用 unsigned long long 自然溢出,相当于自动对2^64−1取模。
应该是对$2^{64}$取模吧?
但是ull最大只到2^64-1呀
取余运算的话最大就用到2^64 - 1,用不到2^64
好滴谢谢
前面是不是多打印了一次~