您的位置:首页 > Web前端

poj3294 Life Forms(后缀数组)

2015-11-29 11:06 489 查看
【题目链接】

  http://poj.org/problem?id=3294 

【题意】

  多个字符串求出现超过R次的最长公共子串。

【思路】

二分+划分height,判定一个组中是否包含不小于R个不同字符串的后缀。

需要注意的有:

     1) c[]尽量开大,字符范围为“偏移”之后的范围。

     2) 用kase作为标记节省了每次开始新段需要清零的时间。

     3) 因为height是sa[i]与sa[i-1]的关系,所以无论是在can的开始还是在新段开始都需要初始为一个串的情况。

【代码】

#include<cstdio>
#include<cstring>
#include<vector>
#include<iostream>
#define FOR(a,b,c) for(int a=(b);a<=(c);a++)
using namespace std;

const int maxn = 200000+10;

int s[maxn];
int sa[maxn],c[maxn],t[maxn],t2[maxn];

void build_sa(int m,int n) {
int i,*x=t,*y=t2;
for(i=0;i<m;i++) c[i]=0;
for(i=0;i<n;i++) c[x[i]=s[i]]++;
for(i=1;i<m;i++) c[i]+=c[i-1];
for(i=n-1;i>=0;i--) sa[--c[x[i]]]=i;

for(int k=1;k<=n;k<<=1) {
int p=0;
for(i=n-k;i<n;i++) y[p++]=i;
for(i=0;i<n;i++) if(sa[i]>=k) y[p++]=sa[i]-k;

for(i=0;i<m;i++) c[i]=0;
for(i=0;i<n;i++) c[x[y[i]]]++;
for(i=0;i<m;i++) c[i]+=c[i-1];
for(i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];

swap(x,y);
p=1; x[sa[0]]=0;
for(i=1;i<n;i++)
x[sa[i]]=y[sa[i]]==y[sa[i-1]] && y[sa[i]+k]==y[sa[i-1]+k]?p-1:p++;
if(p>=n) break;
m=p;
}
}
int rank[maxn],height[maxn];
void getHeight(int n) {
int i,j,k=0;
for(i=0;i<=n;i++) rank[sa[i]]=i;
for(i=0;i<n;i++) {
if(k) k--;
j=sa[rank[i]-1];
while(s[j+k]==s[i+k]) k++;
height[rank[i]]=k;
}
}

int T;
char a[maxn];

int f[200],kase;
vector<int> st;
int can(int limit,int n,int len) {
int cnt=1,ok=0;
st.clear();
f[sa[1]/len]=kase;
for(int i=2;i<=n;i++) {
if(height[i]<limit) {
cnt=1;
f[sa[i]/len]=++kase;               //检查每一个组中
}
else {
if(f[sa[i]/len]!=kase) {
f[sa[i]/len]=kase;
if(cnt>=0) cnt++;
if(cnt>T/2) {
ok=1;
st.push_back(sa[i]);
cnt=-1;
}
}
}
}
return ok;
}
void init() {
kase=1;
memset(sa,0,sizeof(sa));
memset(f,0,sizeof(f));
}
int main() {
//freopen("in.in","r",stdin);
//freopen("out.out","w",stdout);
while(scanf("%d",&T)==1 && T) {
init();
int len,n=0;
for(int i=0;i<T;i++) {
scanf("%s",&a);
len=strlen(a);
for(int j=0;j<len;j++) s[n++]=a[j]+100;
s[n++]=i+1;
}
n--;
s
=0;

build_sa(250,n+1);
getHeight(n);

int L=0,R=len+1;
while(L<R) {
int M=L+(R-L+1)/2;
if(can(M,n,len+1)) L=M;
else R=M-1;
}
can(L,n,len+1);                        //再调用一次求出st
if(L==0) printf("?\n");
else {
for(int i=0;i<st.size();i++)  {
for(int j=st[i];(j-st[i]+1)<=L;j++)
printf("%c",s[j]-100);
putchar('\n');
}
}
putchar('\n');
}
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: