您的位置:首页 > 其它

【后缀数组】不同子串

2018-03-11 18:48 239 查看

【题目描述】

给定一个由小写英文字母构成的字符串T,求其不同子串个数。

【输入】

一个字符串,长度不超过100000。没有传送门……裸的后缀数组:所有子串就是各个后缀字符串的前缀,所以答案就是每一个后缀字符串的长度减去与前一个重复的字符个数的总和。代码如下:#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int N=1e5+10;
const int M=3e5+30;
typedef long long ll;
ll ans;int sa[M],px[M],n;
int t1[M],t2[M],buf
,rvsa
;
char S
;

void query()
{
ans+=n-rvsa[1]+1;
for(int i=2;i<=n;i++){
int p=n-rvsa[i-1]+1,a=rvsa[i-1];
int q=n-rvsa[i]+1,b=rvsa[i];
int u=0;
while(u<p && u<q && S[u+a]==S[u+b]) u++;
ans+=q-u;
}
}

void build()
{
int m=26;
for(int i=1;i<=n;i++) px[S[i]-'a'+1]=1;
for(int i=1;i<=m;i++) px[i]+=px[i-1];
for(int i=1;i<=n;i++) sa[i]=px[S[i]-'a'+1];
for(int k=0;(1<<k)<=n && m!=n;k++){
for(int i=0;i<=m;i++) px[i]=0;
for(int i=1;i<=n;i++) px[sa[i+(1<<k)]]++;
for(int i=1;i<=m;i++) px[i]+=px[i-1];
for(int i=n;i>=1;i--) t1[px[sa[i+(1<<k)]]--]=i;
for(int i=0;i<=m;i++) px[i]=0;
for(int i=1;i<=n;i++) px[sa[t1[i]]]++;
for(int i=1;i<=m;i++) px[i]+=px[i-1];
for(int i=n;i>=1;i--) t2[px[sa[t1[i]]]--]=t1[i];
m=0;
for(int i=1;i<=n;i++){
if(sa[t2[i]]!=sa[t2[i-1]] || sa[t2[i]+(1<<k)]!=sa[t2[i-1]+(1<<k)])
buf[t2[i]]=++m;else buf[t2[i]]=m;
}
for(int i=1;i<=n;i++) sa[i]=buf[i];
}
for(int i=1;i<=n;i++) rvsa[sa[i]]=i;
}

int main(){
scanf("%s",S+1);
n=strlen(S+1);
build();
query();
printf("%lld\n",ans);
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: