长度不小于 k 的公共子串的个数(poj3415)
2017-03-01 17:41
369 查看
http://poj.org/problem?id=3415
给定两个字符串 A 和 B,求长度不小于 k 的公共子串的个数(可以相同)
两个字符串得公共子串大于k的个数,那么一定是每个字符串后缀得所有前缀相同得数量,
如果最长公共前缀为len,那么len-k+1就是这个串之中以头开头的大于等于k长度贡献的答案,
于是可以将两个串连起来,中间加一个字符
然后把height大于等于k的分块,一块之内的都是可行解,如果两个人的位置一个再n前一个再n吼
就是两个字符串相同部分了,每个组内都这么算一遍的复杂度为n^2,
考虑每次遇到b串就找同组前面(与后面a的前缀再后面的a统计时算)a串中所有公共前缀和
找靠前的height时是所有height的最小值,这个值随着你往后走在变,所以维护两个单调递增栈
循环两遍,eg统计后面串的前串和的时候,
走到前面的串,放进栈里,每次经过一个点,就用她的height把栈前面的h值大于当前值的都改变为这个
出栈,然后当前是后面的串,就统计一下。
维护cnt 和当前height值 统计结果就好了
给定两个字符串 A 和 B,求长度不小于 k 的公共子串的个数(可以相同)
两个字符串得公共子串大于k的个数,那么一定是每个字符串后缀得所有前缀相同得数量,
如果最长公共前缀为len,那么len-k+1就是这个串之中以头开头的大于等于k长度贡献的答案,
于是可以将两个串连起来,中间加一个字符
然后把height大于等于k的分块,一块之内的都是可行解,如果两个人的位置一个再n前一个再n吼
就是两个字符串相同部分了,每个组内都这么算一遍的复杂度为n^2,
考虑每次遇到b串就找同组前面(与后面a的前缀再后面的a统计时算)a串中所有公共前缀和
找靠前的height时是所有height的最小值,这个值随着你往后走在变,所以维护两个单调递增栈
循环两遍,eg统计后面串的前串和的时候,
走到前面的串,放进栈里,每次经过一个点,就用她的height把栈前面的h值大于当前值的都改变为这个
出栈,然后当前是后面的串,就统计一下。
维护cnt 和当前height值 统计结果就好了
/* 两个字符串得公共子串大于k的个数,那么一定是每个字符串后缀得所有前缀相同得数量, 如果最长公共前缀为len,那么len-k+1就是这个串之中以头开头的大于等于k长度贡献的答案, 于是可以将两个串连起来,中间加一个字符 然后把height大于等于k的分块,一块之内的都是可行解,如果两个人的位置一个再n前一个再n吼 就是两个字符串相同部分了,每个组内都这么算一遍的复杂度为n^2, 考虑每次遇到b串就找同组前面(与后面a的前缀再后面的a统计时算)a串中所有公共前缀和 找靠前的height时是所有height的最小值,这个值随着你往后走在变,所以维护两个单调递增栈 循环两遍,eg统计后面串的前串和的时候, 走到前面的串,放进栈里,每次经过一个点,就用她的height把栈前面的h值大于当前值的都改变为这个 出栈,然后当前是后面的串,就统计一下。 维护cnt 和当前height值 统计结果就好了 */ #include <cstdio> #include <cstring> #include <iostream> #include <algorithm> using namespace std; const int maxn = 1e6+10; int n,lena; char a[maxn]; typedef pair<char,int> pii; int A[maxn],B[maxn]; int realrank[maxn],k; pii st[maxn]; int s[maxn][2]; long long h[maxn]; int K; int C[maxn],D[maxn]; void init(){ scanf("%s",a+1); lena = strlen(a+1); a[lena+1] = '#'; scanf("%s",a+lena+2); n = strlen(a+1); //cout << n<<a+1<<endl; for(int i = 1; i <= n ; i++){ st[i] = make_pair(a[i],i); } sort(st+1,st+1+n); k = realrank[st[1].second] = 1; for(int i = 2; i <= n ; i++){ if(st[i].first != st[i-1].first) k +=1; realrank[st[i].second] = k; } } void suffix_array(){ for(int i = 1; i <= n ; i *= 2){ for(int j = 0 ; j <= n ; j++) A[j] = B[j] = 0; for(int j = 1; j <= n ; j++){ A[s[j][0] = realrank[j]]++; if(j+i <= n) s[j][1] = realrank[j+i]; else s[j][1] = 0; B[s[j][1]]++; } for(int j = 1; j <= n ;j++) A[j] += A[j-1],B[j] += B[j-1]; for(int j = n ; j >= 1; j--){ C[B[s[j][1]]] = j; B[s[j][1]]--; } for(int j = n ; j >=1; j--){ D[A[s[C[j]][0]]] = C[j]; A[s[C[j]][0]]--; } k = realrank[D[1]] = 1; for(int j = 2 ; j <= n ; j++){ if(s[D[j]][0] != s[D[j-1]][0] ||s[D[j]][1] != s[D[j-1]][1]) k++; realrank[D[j]] = k; } } } void gethigh(){ int pre = 0,j; for(int i = 1; i <= n ; i++){ if(pre) pre--; j = D[realrank[i]-1]; while(i+pre <= n && j + pre <= n && a[i+pre] == a[j+pre]) pre++; h[realrank[i]] = pre; } } struct node{ long long cnt,height; }stka[maxn],stkb[maxn]; long long ans ,tot; int topa ,topb,taila,tailb; void sov(){ //cout <<"len = "<<lena<<" "<<n<<endl; ans = topa = topb = taila = tailb = tot = 0; for(int i = 2; i <= n ; i++){ // printf("h[%d] = %d\n",i,h[i]); if(h[i] < K){ topa = topb = taila = tailb = 0; tot = 0; } else{ int num = 0; if(D[i-1] <= lena){ num++; tot += h[i] - K +1; // cout <<"i = "<<i<<" to "<<tot<<endl; } while(taila > topa && stka[taila-1].height >= h[i]){ // cout <<"i = "<<i<<endl; taila--; tot -= stka[taila].cnt*(stka[taila].height-h[i]); num += stka[taila].cnt; // cout << " tot = "<<tot <<endl; } stka[taila].height = h[i]; stka[taila].cnt = num; taila++; if(D[i] > lena){ ans += tot; } } } topa = topb = taila = tailb = tot = 0; for(int i = 2; i <= n ; i++){ if(h[i] < K){ topa = topb = taila = tailb = 0; tot = 0; } else{ int num = 0; if(D[i-1] > lena+1){ //printf("D[%d] = %d\n",i,D[i]); num++; tot += h[i] - K +1; } while(taila > topa && stka[taila-1].height >= h[i]){ taila--; tot -= stka[taila].cnt*(stka[taila].height-h[i]); num += stka[taila].cnt; } //cout <<"i = "<<i<<" stka[taila].height = "<<h[i]<<" stka[taila].cnt = "<<num<<endl; stka[taila].height = h[i]; stka[taila].cnt = num; taila++; if(D[i] <= lena){ ans += tot; } } } printf("%lld\n",ans); } int main(){ while(~scanf("%d",&K)&&K){ init(); suffix_array(); gethigh(); sov(); } }
相关文章推荐
- 【poj3415-长度不小于k的公共子串个数】后缀数组+单调栈
- poj3415之长度不小于k的公共子串个数
- 【POJ 3415】Common Substrings 长度不小于k的公共子串的个数
- POJ 3415 Common Substrings(长度不小于K的公共子串的个数+后缀数组+height数组分组思想+单调栈)
- POJ 3415 Common Substrings (求长度不小于k的公共子串的个数)
- POJ-Common Substrings(后缀数组-长度不小于 k 的公共子串的个数)
- hdu 3415 后缀数组 长度不小于 k 的公共子串的个数
- poj 3415 :长度不小于 k 的公共子串的个数(后缀数组+单调栈)
- 后缀数组(长度不小于k的公共子串的个数)
- (Relax 后缀数组1.3)POJ 3415 Common Substrings(求串A和串B中长度不小于k的公共子串数)
- POJ - 3415 Common Substrings(后缀数组求长度不小于 k 的公共子串的个数+单调栈优化)
- POJ 3415 Common Substrings (后缀数组,长度不小于k的公共子串的个数)
- POJ - 3415 Common Substrings(后缀数组求长度不小于 k 的公共子串的个数+单调栈优化)
- poj 3415 后缀数组 两个字符串中长度不小于 k 的公共子串的个数
- POJ 3415 求两个字符串间长度不小于k的公共子串的个数
- 后缀数组(长度不小于k的公共子串的个数)
- POJ 3415 Common Substrings(长度不小于k 的公共子串的个数--后缀数组+单调栈优化)
- 输入整数(n是小于9位数的整数),当作字符串处理, 看是否有相同的子串,如1212,相同子串是12, 141516则没有子串(子串长度必须大于等于2)。 若
- Poj 2774两个字符串的最长公共子串长度
- 【每天学点算法题10.15】获取两个字符串之间最长公共子串的长度