[后缀数组]spoj694 Distinct Substrings/spoj705 New Distinct Substrings
2017-01-14 11:43
423 查看
今天接着讲后缀数组哈
spoj694
spoj705
一句话题意:
给定一个字符串,求不相同的子串的个数。
算法分析:
每个子串一定是某个后缀的前缀,那么原问题就能转换成求所有后缀之间的不相同的前缀的个数。这样就可以用我们的后缀数组了
如果所有的后缀按照
suffix(sa[1]),suffix(sa[2]),suffix(sa[3]),……,suffix(sa
)
的顺序计算,不难发现,对于每一次新加进来的后缀suffix(sa[k]),它将产生n-sa[k]+1个新的前缀。但是其中有height[k]个是和前面的字符串的前缀是相同的。所以suffix(sa[k])将“贡献”出n-sa[k]+1-height[k]个不同的子串。累加后便是原问题的答案。这个做法的时间复杂度为O(n)。
既然方程式都给出来了,那问题是不是很简单了呢??
下面是spoj694的代码:
spoj694
spoj705
一句话题意:
给定一个字符串,求不相同的子串的个数。
算法分析:
每个子串一定是某个后缀的前缀,那么原问题就能转换成求所有后缀之间的不相同的前缀的个数。这样就可以用我们的后缀数组了
如果所有的后缀按照
suffix(sa[1]),suffix(sa[2]),suffix(sa[3]),……,suffix(sa
)
的顺序计算,不难发现,对于每一次新加进来的后缀suffix(sa[k]),它将产生n-sa[k]+1个新的前缀。但是其中有height[k]个是和前面的字符串的前缀是相同的。所以suffix(sa[k])将“贡献”出n-sa[k]+1-height[k]个不同的子串。累加后便是原问题的答案。这个做法的时间复杂度为O(n)。
既然方程式都给出来了,那问题是不是很简单了呢??
下面是spoj694的代码:
#include <cstdio> #include <cstring> #include <algorithm> #include <iostream> #include <cmath> using namespace std; int sa[21000],y[21000],height[21000],wr[21000],rsort[21000],rank[21000],a[21000]; char st[1010]; bool cmp(int k1,int k2,int ln) { return wr[k1]==wr[k2]&&wr[k1+ln]==wr[k2+ln]; } void get_sa(int n,int m) { int p,k,ln,i; for (i=1;i<=n;i++) rank[i]=a[i]; //a数组:原字符串。rank数组:名次数组(即你排第几) for (i=0;i<=m;i++) rsort[i]=0; for (i=1;i<=n;i++) rsort[rank[i]]++; for (i=1;i<=m;i++) rsort[i]+=rsort[i-1]; for (i=n;i>=1;i--) sa[rsort[rank[i]]--]=i; //sa数组:后缀数组(即排第几的是谁) //以上四句为基数排序 p=0;ln=1; //ln为当前子串的长度,p表示有多少不相同的子串 while (p<n) //如果p等于n,那么函数可以结束。因为在当前长度的字符串中,已经没有相同的字符串,接下来的排序不会改变rank值。 { for (k=0,i=n-ln+1;i<=n;i++) y[++k]=i; for (i=1;i<=n;i++) if (sa[i]-ln>0) y[++k]=sa[i]-ln; for (i=1;i<=n;i++) wr[i]=rank[y[i]]; //数组y保存的是对第二关键字排序的结果。 //数组wr保存的是对第二关键字排序后的rank值 //以下为对第一关键字排序 for (i=1;i<=m;i++) rsort[i]=0; for (i=1;i<=n;i++) rsort[wr[i]]++; for (i=1;i<=m;i++) rsort[i]+=rsort[i-1]; for (i=n;i>=1;i--) sa[rsort[wr[i]]--]=y[i]; memcpy(wr,rank,sizeof(wr)); p=1;rank[sa[1]]=1; for (i=2;i<=n;i++) { if (!cmp(sa[i],sa[i-1],ln)) p++; rank[sa[i]]=p; } //得到新的rank数组。这里要注意的是,可能有多个字符串的rank值是相同的,所以必须比较两个字符串是否完全相同 m=p;ln*=2; } sa[0]=0;a[0]=0; } void get_he(int n) { int i,j,k=0; for(i=1;i<=n;i++) { j=sa[rank[i]-1]; if (k) k--; while (a[i+k]==a[j+k]) k++; height[rank[i]]=k; } } int main() { int n,ans,u; scanf("%d",&u); while (u--) { scanf("%s",st+1); n=strlen(st+1); for (int i=1;i<=n;i++) a[i]=st[i]; get_sa(n,128); get_he(n); ans=0; for (int i=1;i<=n;i++) ans+=n-sa[i]+1-height[i];//公式 printf("%d\n",ans); } return 0; }
相关文章推荐
- SPOJ SUBST1 - New Distinct Substrings(后缀数组[不相同的子串的个数])
- SPOJ 694 DISUBSTR Distinct Substrings 后缀数组
- SPOJ 694 Distinct Substrings <后缀数组>
- SPOJ 705 SUBST1 New Distinct Substrings 后缀数组
- SPOJ 705 New Distinct Substrings 后缀数组
- SPOJ 694 / SPOJ DISUBSTR Distinct Substrings【后缀数组】不相同的子串的个数
- SPOJ SUBST1 New Distinct Substrings 后缀数组-子串个数
- SPOJ 题目705 New Distinct Substrings(后缀数组,求不同的子串个数)
- 【SPOJ-SUBST1】New Distinct Substrings【后缀数组】
- SPOJ - Distinct Substrings / SPOJ - New Distinct Substrings(后缀数组 - 不相同子串个数)
- SPOJ 题目705 New Distinct Substrings(后缀数组,求不同的子串个数)
- 【后缀数组 不同的字串个数】SPOJ - SUBST1 New Distinct Substrings
- [后缀数组、不重复子串]SPOJ694、spoj705--Distinct Substrings
- 【SPOJ705】New Distinct Substrings 后缀数组
- spoj 694 Distinct Substrings 705 New Distinct Substrings
- spojDistinct Substrings【后缀数组 不重复子串】
- SPOJ 694 Distinct Substrings/SPOJ 705 New Distinct Substrings(后缀数组)
- SPOJ DISUBSTR Distinct Substrings 后缀数组子串个数
- SPOJ 694、705 Distinct Substrings 、 New Distinct Substrings (后缀数组)
- 后缀数组---New Distinct Substrings