您的位置:首页 > 其它

长度不小于 k 的公共子串的个数(poj3415)

2017-03-01 17:41 369 查看
http://poj.org/problem?id=3415

给定两个字符串 A 和 B,求长度不小于 k 的公共子串的个数(可以相同)

两个字符串得公共子串大于k的个数,那么一定是每个字符串后缀得所有前缀相同得数量,

如果最长公共前缀为len,那么len-k+1就是这个串之中以头开头的大于等于k长度贡献的答案,

于是可以将两个串连起来,中间加一个字符

然后把height大于等于k的分块,一块之内的都是可行解,如果两个人的位置一个再n前一个再n吼

就是两个字符串相同部分了,每个组内都这么算一遍的复杂度为n^2,

考虑每次遇到b串就找同组前面(与后面a的前缀再后面的a统计时算)a串中所有公共前缀和

找靠前的height时是所有height的最小值,这个值随着你往后走在变,所以维护两个单调递增栈

循环两遍,eg统计后面串的前串和的时候,

走到前面的串,放进栈里,每次经过一个点,就用她的height把栈前面的h值大于当前值的都改变为这个

出栈,然后当前是后面的串,就统计一下。

维护cnt 和当前height值 统计结果就好了

/*
两个字符串得公共子串大于k的个数,那么一定是每个字符串后缀得所有前缀相同得数量,
如果最长公共前缀为len,那么len-k+1就是这个串之中以头开头的大于等于k长度贡献的答案,
于是可以将两个串连起来,中间加一个字符
然后把height大于等于k的分块,一块之内的都是可行解,如果两个人的位置一个再n前一个再n吼
就是两个字符串相同部分了,每个组内都这么算一遍的复杂度为n^2,
考虑每次遇到b串就找同组前面(与后面a的前缀再后面的a统计时算)a串中所有公共前缀和
找靠前的height时是所有height的最小值,这个值随着你往后走在变,所以维护两个单调递增栈
循环两遍,eg统计后面串的前串和的时候,
走到前面的串,放进栈里,每次经过一个点,就用她的height把栈前面的h值大于当前值的都改变为这个
出栈,然后当前是后面的串,就统计一下。
维护cnt 和当前height值  统计结果就好了
*/

#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>
using namespace std;
const int maxn = 1e6+10;
int n,lena;
char a[maxn];
typedef pair<char,int> pii;
int A[maxn],B[maxn];
int realrank[maxn],k;
pii st[maxn];
int s[maxn][2];
long long h[maxn];
int K;
int C[maxn],D[maxn];

void init(){
scanf("%s",a+1);
lena = strlen(a+1);
a[lena+1] = '#';
scanf("%s",a+lena+2);
n = strlen(a+1);
//cout << n<<a+1<<endl;
for(int i = 1; i <= n ; i++){
st[i] = make_pair(a[i],i);
}

sort(st+1,st+1+n);
k = realrank[st[1].second] = 1;
for(int i = 2; i <= n ; i++){
if(st[i].first != st[i-1].first)
k +=1;
realrank[st[i].second] = k;
}
}
void suffix_array(){
for(int i = 1; i <= n ; i *= 2){
for(int j = 0 ; j <= n ; j++)
A[j] = B[j] = 0;
for(int j = 1;  j <= n ; j++){
A[s[j][0] = realrank[j]]++;
if(j+i <= n)
s[j][1] = realrank[j+i];
else    s[j][1] = 0;
B[s[j][1]]++;
}
for(int j = 1; j <= n ;j++)
A[j] += A[j-1],B[j] += B[j-1];
for(int j = n ; j >= 1; j--){
C[B[s[j][1]]] = j;
B[s[j][1]]--;
}
for(int j = n ; j >=1; j--){
D[A[s[C[j]][0]]] = C[j];
A[s[C[j]][0]]--;
}
k = realrank[D[1]] = 1;
for(int j = 2 ; j <= n ; j++){
if(s[D[j]][0] != s[D[j-1]][0] ||s[D[j]][1] != s[D[j-1]][1])
k++;
realrank[D[j]] = k;
}
}
}

void gethigh(){
int pre = 0,j;
for(int i = 1; i <= n ; i++){
if(pre) pre--;
j = D[realrank[i]-1];
while(i+pre <= n && j + pre <= n && a[i+pre] == a[j+pre])
pre++;
h[realrank[i]] = pre;
}
}
struct node{
long long cnt,height;
}stka[maxn],stkb[maxn];

long long ans ,tot;
int topa ,topb,taila,tailb;

void sov(){
//cout <<"len = "<<lena<<"  "<<n<<endl;
ans = topa = topb = taila = tailb = tot = 0;
for(int i = 2; i <= n ; i++){
// printf("h[%d] = %d\n",i,h[i]);
if(h[i] < K){
topa = topb = taila = tailb = 0;
tot = 0;
}
else{
int num = 0;
if(D[i-1] <= lena){
num++;
tot += h[i] - K +1;
// cout <<"i = "<<i<<"  to "<<tot<<endl;
}
while(taila > topa && stka[taila-1].height >= h[i]){
//  cout <<"i = "<<i<<endl;
taila--;
tot -= stka[taila].cnt*(stka[taila].height-h[i]);
num += stka[taila].cnt;
//  cout << " tot =  "<<tot <<endl;
}

stka[taila].height = h[i];
stka[taila].cnt = num;
taila++;
if(D[i] > lena){
ans += tot;
}
}
}

topa = topb = taila = tailb = tot = 0;
for(int i = 2; i <= n ; i++){
if(h[i] < K){
topa = topb = taila = tailb = 0;
tot = 0;
}
else{
int num = 0;
if(D[i-1] > lena+1){
//printf("D[%d] = %d\n",i,D[i]);
num++;
tot += h[i] - K +1;
}
while(taila > topa && stka[taila-1].height >= h[i]){

taila--;
tot -= stka[taila].cnt*(stka[taila].height-h[i]);

num += stka[taila].cnt;
}
//cout <<"i = "<<i<<"   stka[taila].height = "<<h[i]<<"  stka[taila].cnt = "<<num<<endl;
stka[taila].height = h[i];
stka[taila].cnt = num;
taila++;
if(D[i] <= lena){
ans += tot;
}
}
}
printf("%lld\n",ans);
}

int main(){
while(~scanf("%d",&K)&&K){
init();
suffix_array();
gethigh();
sov();
}
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  后缀数组
相关文章推荐