题目描述
很久很久以前,森林里住着一群兔子。
有一天,兔子们想要研究自己的 DNA 序列。
我们首先选取一个好长好长的 DNA 序列(小兔子是外星生物,DNA 序列可能包含 26 个小写英文字母)。
然后我们每次选择两个区间,询问如果用两个区间里的 DNA 序列分别生产出来两只兔子,这两个兔子是否一模一样。
注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。
输入格式
第一行输入一个 DNA 字符串 S。
第二行一个数字 m,表示 m 次询问。
接下来 m 行,每行四个数字 $l1,r1,l2,r2$,分别表示此次询问的两个区间,注意字符串的位置从1开始编号。
输出格式
对于每次询问,输出一行表示结果。
如果两只兔子完全相同输出 $Yes$,否则输出 $No$(注意大小写)。
数据范围
$1≤length(S),m≤1000000$
样例
输入样例:
aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes
字符串Hash+前缀和
字符串哈希,最著名的就是BKDRHash,也就是将字符串变成数值,并且最后变成的数值是一个P进制的数,一般来说P最好为素数.
然后我们之所以需要前缀和,是因为我们这道题目是求一个区间的字符串,又因为是哈希表,所以我们得求出区间哈希和,又因为是是区间和,所以我们得用前缀和求O(n)预处理,来实现和哈希一般的O(1)常数级别查询.
这种Hash常用,且冲突概率极低,offer必备,同时竞赛OI党必备,是优秀的算法,容易精简易理解.
C++ 代码
#include <bits/stdc++.h>
using namespace std;
#define fir(i,a,b) for(int i=a;i<=b;i++)
#define ull unsigned long long //无符号自动取模
#define Hash 131 //Hash值131最好,当然还有1331
const int N=1e6+10;
ull p[N],sum[N];
int n,m,len,l1,r1,l2,r2;
char s[N];
int main()
{
scanf("%s",s+1);
len=strlen(s+1);
cin>>n;
p[0]=1;//p^0为1
fir(i,1,len)
{
sum[i]=sum[i-1]*Hash+(s[i]-'a'+1);//计算前缀hash值
p[i]=p[i-1]*Hash;//第i的进制p的位值.
}
fir(i,1,n)
{
cin>>l1>>r1>>l2>>r2;
if (sum[r1]-sum[l1-1]*p[r1-l1+1]==sum[r2]-sum[l2-1]*p[r2-l2+1])//如果hash值一样,记得我们是前缀和求区间Hash
cout<<"Yes"<<endl;
else
cout<<"No"<<endl;
}
}
不是1331是13331
都可以啊…
1331不是质数131和13331才是质数
哦,我以为我用的1331,对了.
忘记了…
QwQ
萌新被大佬实力打晕了.
单Hash而且是ull被卡警告
这样啊?
就前几天,CF上一个E,Hash能做,我按照蓝书上那种base131然后ull模FST了
CF上有好几个数据大佬,他们最喜欢卡Hash了。
这个我听几个大佬说过,他们卡Hash,和unround_map的水平狠毒。
我不知道我的unround_map写对了没有,您可以认为是C++11的哈希表