POJ 3415 Common Substrings (后缀数组,长度不小于k的公共子串的个数)
2013-04-25 15:05
211 查看
Common Substrings
DescriptionA substring of a string T is defined as:T(i, k)=TiTi+1...Ti+k-1, 1≤i≤i+k-1≤|T|.Given two strings A, B and one integer K, we define S, a set of triples (i, j, k):S = {(i, j, k) | k≥K, A(i, k)=B(j, k)}.You are to give the value of |S| for specific A, B and K.InputThe input file contains several blocks of data. For each block, the first line contains one integer K, followed by two lines containing strings A and B, respectively. The input file is ended by K=0.1 ≤ |A|, |B| ≤ 105
1 ≤ K ≤ min{|A|, |B|}
Characters of A and B are all Latin letters.OutputFor each case, output an integer |S|.Sample Input
Sample Output
每遇到一个B的后缀就统计与前面的A的后缀
能产生多少个长度不小于k的公共子串。最A也一样做一边
Time Limit: 5000MS | Memory Limit: 65536K | |
Total Submissions: 5495 | Accepted: 1822 |
1 ≤ K ≤ min{|A|, |B|}
Characters of A and B are all Latin letters.OutputFor each case, output an integer |S|.Sample Input
2 aababaa abaabaa 1 xx xx 0
Sample Output
22 5 先是把两个字符串连接起来,中间加一个没有出现过的字符。然后用后缀数组求得height数组。 之后的过程麻烦,我是看别人代码看了好久才看懂的。 大致意思是维护一个单调栈。
每遇到一个B的后缀就统计与前面的A的后缀
能产生多少个长度不小于k的公共子串。最A也一样做一边
/* * POJ 3415 Common Substrings * 给定两个字符串A和B,求长度不小于k的公共子串的个数 * 基本思路是计算A的所有后缀和B的所有后缀之间的最长公共前缀的长度, * 把最长公共前缀长度不小于k的部分全部加起来。 * 先把两个字符串连起来,中间用一个没有用过的字符隔开。 * 按height分组后,接下来便是快速的统计每组中后缀之间的最长公共前缀之和 * 用一个单调的栈来维护,每遇到一个B的后缀就统计与前面的A的后缀 * 能产生多少个长度不小于k的公共子串。最A也一样做一边 */ #include <iostream> #include <string.h> #include <stdio.h> #include <algorithm> using namespace std; const int MAXN=200010; int sa[MAXN]; int t1[MAXN],t2[MAXN],c[MAXN]; int rank[MAXN],height[MAXN]; void build_sa(int s[],int n,int m) { int i,j,p,*x=t1,*y=t2; for(i=0;i<m;i++)c[i]=0; for(i=0;i<n;i++)c[x[i]=s[i]]++; for(i=1;i<m;i++)c[i]+=c[i-1]; for(i=n-1;i>=0;i--)sa[--c[x[i]]]=i; for(j=1;j<=n;j<<=1) { p=0; for(i=n-j;i<n;i++)y[p++]=i; for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j; for(i=0;i<m;i++)c[i]=0; for(i=0;i<n;i++)c[x[y[i]]]++; for(i=1;i<m;i++)c[i]+=c[i-1]; for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i]; swap(x,y); p=1;x[sa[0]]=0; for(i=1;i<n;i++) x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+j]==y[sa[i]+j]?p-1:p++; if(p>=n)break; m=p; } } void getHeight(int s[],int n) { int i,j,k=0; for(i=0;i<=n;i++)rank[sa[i]]=i; for(i=0;i<n;i++) { if(k)k--; j=sa[rank[i]-1]; while(s[i+k]==s[j+k])k++; height[rank[i]]=k; } } char str1[MAXN],str2[MAXN]; int r[MAXN]; int sta[MAXN],stb[MAXN]; int main() { freopen("in.txt","r",stdin); freopen("out.txt","w",stdout); int k; int n; int len1,len2; while(scanf("%d",&k)==1 && k) { scanf("%s%s",&str1,&str2); len1=strlen(str1); len2=strlen(str2); n=len1+len2+1; for(int i=0;i<len1;i++)r[i]=str1[i]; r[len1]=1; for(int i=0;i<len2;i++)r[i+len1+1]=str2[i]; r[len1+len2+1]=0; build_sa(r,n+1,128); getHeight(r,n); long long ans=0; long long ss=0; int top=0; for(int i=2;i<=n;i++) { if(height[i]<k) { ss=0; top=0; continue; } int cnt=0; if(sa[i-1]<len1) { cnt++; ss+=height[i]-k+1; } while(top>0 && height[i]<=sta[top-1]) { top--; ss-=stb[top]*(sta[top]-height[i]); cnt+=stb[top]; } sta[top]=height[i];stb[top++]=cnt; if(sa[i]>len1)ans+=ss; } ss=0;top=0; for(int i=2;i<=n;i++) { if(height[i]<k) { ss=0; top=0; continue; } int cnt=0; if(sa[i-1]>len1) { cnt++; ss+=height[i]-k+1; } while(top>0 && height[i]<=sta[top-1]) { top--; ss-=stb[top]*(sta[top]-height[i]); cnt+=stb[top]; } sta[top]=height[i];stb[top++]=cnt; if(sa[i]<len1)ans+=ss; } printf("%I64d\n",ans); } return 0; }
相关文章推荐
- poj 3415 后缀数组 两个字符串中长度不小于 k 的公共子串的个数
- POJ - 3415 Common Substrings(后缀数组求长度不小于 k 的公共子串的个数+单调栈优化)
- (Relax 后缀数组1.3)POJ 3415 Common Substrings(求串A和串B中长度不小于k的公共子串数)
- POJ - 3415 Common Substrings(后缀数组求长度不小于 k 的公共子串的个数+单调栈优化)
- POJ-Common Substrings(后缀数组-长度不小于 k 的公共子串的个数)
- 后缀数组(长度不小于k的公共子串的个数)
- poj 3294 Life Forms(n个字符串中 求公共子串长度超过k得最大子串 后缀数组)
- 后缀数组(长度不小于k的公共子串的个数)
- (Relax 后缀数组1.4)POJ 2774 Long Long Message(求两个字符串公共子串的最大长度)
- POJ 2774-Long Long Message(后缀数组+高度数组-最大公共子串长度)
- hdu 3415 后缀数组 长度不小于 k 的公共子串的个数
- POJ 2217-Secretary(后缀数组+高度数组-最大公共子串长度)
- POJ 题目2774 Long Long Message(后缀数组,求最长公共子串长度)
- 【后缀数组】 POJ 2774 Long Long Message 两个字符串的最长公共子串长度
- POJ 3415 Common Substrings(长度不小于K的公共子串的个数+后缀数组+height数组分组思想+单调栈)
- POJ_P2774 Long Long Message/Codevs_P3160 最长公共子串(后缀数组)
- POJ 2774 Long Long Message 求两个串最长公共子串(后缀数组)
- POJ 2774 Long Long Message(后缀数组求最长公共子串,4级)
- poj 2774 Long Long Message,后缀数组,求最长公共子串 hdu1403
- POJ 2774 后缀数组:求最长公共子串