您的位置:首页 > 其它

【JZOJ 3870】 单词检索

2017-01-17 22:01 183 查看

Description

小可可是学校图书馆的管理员,现在他接手了一个十分棘手的任务。

由于学校需要一些材料,校长需要在文章中检索一些信息。校长一共给了小可可N篇文章,每篇文章为一个字符串。现在,校长需要他找到这样的单词,它至少在这N篇文章中的M篇文章里出现过,且单词长度为L。可是,工作量十分庞大,但校长又急需小可可完成这项任务。

现在他向你求助,需要你编写程序完成这项艰巨的任务。

对于100%的数据有1≤N,M≤2000,L≤1000。每篇文章长度不大于1000,均有小写字母组成。

Analysis

solution 1 字符串哈希

因为字符串长度为L不变,所以动态更新哈希值

记得要先模一个大一点的数,如果太小容易重复导致出错

记录哈希值的时候再模小一点的,这个可以小一点是因为只需存起来不需比较

为了更优美最好弄双哈希,我单哈希过掉了

solution 2 SA

——by chunkit lau

把所有串连起来,各个串中间用各不相同的特殊符号连起来

对于height,把>=L的分成一段,判断每一段内是否有多于m个出现在不同的串里

Code

#include<cstdio>
#include<cstring>
#include<algorithm>
#define fo(i,a,b) for(int i=a;i<=b;i++)
using namespace std;
typedef long long ll;
const int N=2005;
const ll mo=1e9+7,hx=5000000;
int n,m,l,h[hx][3];
ll _26,a
;
char s
;
int hash(int x)
{
int pos=x%hx;
while(h[pos][0] && h[pos][0]!=x) pos=(pos+1)%hx;
h[pos][0]=x;
return pos;
}
int main()
{
int _,ans=0;
scanf("%d %d %d\n",&_,&m,&l);
_26=1;
fo(i,1,l) _26=_26*26%mo;
while(_--)
{
scanf("%s\n",s+1);
n=strlen(s+1);
if(n<l) continue;
fo(i,1,n)
{
a[i]=(a[i-1]*26+s[i]-'a'+1)%mo;
if(i>=l)
{
if(i>l) a[i]=(a[i]-(s[i-l]-'a'+1)*_26%mo+mo)%mo;
int pos=hash(a[i]);
if(h[pos][2]==_) continue;
if(++h[pos][1]==m) ans++;
h[pos][2]=_;
}
}
}
printf("%d",ans);
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: