【后缀数组】不同子串
2018-03-11 18:48
239 查看
【题目描述】
给定一个由小写英文字母构成的字符串T,求其不同子串个数。【输入】
一个字符串,长度不超过100000。没有传送门……裸的后缀数组:所有子串就是各个后缀字符串的前缀,所以答案就是每一个后缀字符串的长度减去与前一个重复的字符个数的总和。代码如下:#include<cstdio>#include<cstring>
#include<algorithm>
using namespace std;
const int N=1e5+10;
const int M=3e5+30;
typedef long long ll;
ll ans;int sa[M],px[M],n;
int t1[M],t2[M],buf
,rvsa
;
char S
;
void query()
{
ans+=n-rvsa[1]+1;
for(int i=2;i<=n;i++){
int p=n-rvsa[i-1]+1,a=rvsa[i-1];
int q=n-rvsa[i]+1,b=rvsa[i];
int u=0;
while(u<p && u<q && S[u+a]==S[u+b]) u++;
ans+=q-u;
}
}
void build()
{
int m=26;
for(int i=1;i<=n;i++) px[S[i]-'a'+1]=1;
for(int i=1;i<=m;i++) px[i]+=px[i-1];
for(int i=1;i<=n;i++) sa[i]=px[S[i]-'a'+1];
for(int k=0;(1<<k)<=n && m!=n;k++){
for(int i=0;i<=m;i++) px[i]=0;
for(int i=1;i<=n;i++) px[sa[i+(1<<k)]]++;
for(int i=1;i<=m;i++) px[i]+=px[i-1];
for(int i=n;i>=1;i--) t1[px[sa[i+(1<<k)]]--]=i;
for(int i=0;i<=m;i++) px[i]=0;
for(int i=1;i<=n;i++) px[sa[t1[i]]]++;
for(int i=1;i<=m;i++) px[i]+=px[i-1];
for(int i=n;i>=1;i--) t2[px[sa[t1[i]]]--]=t1[i];
m=0;
for(int i=1;i<=n;i++){
if(sa[t2[i]]!=sa[t2[i-1]] || sa[t2[i]+(1<<k)]!=sa[t2[i-1]+(1<<k)])
buf[t2[i]]=++m;else buf[t2[i]]=m;
}
for(int i=1;i<=n;i++) sa[i]=buf[i];
}
for(int i=1;i<=n;i++) rvsa[sa[i]]=i;
}
int main(){
scanf("%s",S+1);
n=strlen(S+1);
build();
query();
printf("%lld\n",ans);
return 0;
}
相关文章推荐
- hdu 4622 求区间不同子串数 后缀数组|后缀自动机|字符串hash
- SPOJ 题目705 New Distinct Substrings(后缀数组,求不同的子串个数)
- HDU3518 后缀数组求不可重叠重复出现的不同子串个数
- HDU 4436 str2int(后缀数组,一种统计n个digit字符串所有不同子串之和的方法)
- SPOJ(后缀数组求不同子串个数)
- New Distinct Substrings (后缀数组,统计有多少个不同的子串)
- SPOJ 题目694 Distinct Substrings(后缀数组,求不同的子串个数)
- 【后缀数组】【不同子串个数】DISUBSTR spoj694/705
- hdu 5769后缀数组 求含有某个字母的某个字符串的不同子串的个数
- SPOJ 694、705 后缀数组:求不同子串
- 后缀数组应用5: 求两个不同字串串的最长公共子串
- HDU4622:Reincarnation(后缀数组,求区间内不同子串的个数)
- spoj705 后缀数组求不同子串的个数
- Cogs 1709. [SPOJ705]不同的子串 后缀数组
- SPOJ 题目705 New Distinct Substrings(后缀数组,求不同的子串个数)
- spoj 694. Distinct Substrings 后缀数组求不同子串的个数
- HDU3948:后缀数组+马拉车(本质不同回文子串统计)
- [spoj DISUBSTR]后缀数组统计不同子串个数
- POJ 1743 Musical Theme 后缀数组 不可重叠最长重复子串
- 【后缀数组】不可重叠最长重复子串