您的位置:首页 > Web前端

poj3294 Life Forms - 后缀数组

2016-07-21 16:13 363 查看
题目链接:http://poj.org/problem?id=3294

题目大意:求出现在超过一半字符串中的最长子串

解题思路:后缀数组+二分

二分枚举最长子串的长度,根据height[]分组,验证是否存在 在一组中出现了超过一半次数的字符串。

(这是height[]的应用之一,罗穗骞大大的论文里就有讲~)

#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
#define maxn 101000

int sa[maxn],rk[maxn],Rsort[maxn];
int h[maxn],y[maxn],wr[maxn],len;
char s[maxn];int num[maxn];
bool bo[110];int sk[maxn],as[maxn];
int mymax(int x,int y){return (x>y)?x:y;}
bool cmp(int x,int y,int k){return (wr[x]==wr[y])&&(wr[x+k]==wr[y+k]);}
void get_h()
{
int i,k=0;
for (i=1;i<=len;i++)
{
int j=sa[rk[i]-1];
if (k>0) k--;
while (s[i+k]==s[j+k]) k++;
h[rk[i]]=k;
}
}
void get_sa()
{
int i,k,ln,p,m=127;
for (i=1;i<=len;i++) rk[i]=s[i];
for (i=0;i<=m;i++) Rsort[i]=0;
for (i=1;i<=len;i++) Rsort[rk[i]]++;
for (i=1;i<=m;i++) Rsort[i]+=Rsort[i-1];
for (i=len;i>=1;i--) sa[Rsort[rk[i]]--]=i;
p=0;ln=1;
while (p<len)
{
for (k=0,i=len-ln+1;i<=len;i++) y[++k]=i;
for (i=1;i<=len;i++) if (sa[i]-ln>0) y[++k]=sa[i]-ln;
for (i=1;i<=len;i++) wr[i]=rk[y[i]];
for (i=0;i<=m;i++) Rsort[i]=0;
for (i=1;i<=len;i++) Rsort[wr[i]]++;
for (i=1;i<=m;i++) Rsort[i]+=Rsort[i-1];
for (i=len;i>=1;i--) sa[Rsort[wr[i]]--]=y[i];
memcpy(wr,rk,sizeof(wr));
p=1;rk[sa[1]]=1;
for (i=2;i<=len;i++)
{
if (!cmp(sa[i],sa[i-1],ln)) p++;
rk[sa[i]]=p;
}m=p;ln*=2;
}s[0]=sa[0]=0;
}

int main()
{
//freopen("a.in","r",stdin);
//freopen("a.out","w",stdout);
int n,mxl,i,j,l,L,R,mid,ll;
int ans,id,w;char ss[1100];
bool tk=0;
while (1)
{
scanf("%d\n",&n);
if (tk && n!=0) printf("\n");
if (n==0) break;tk=1;
len=0;mxl=ll=0;ans=-1;
memset(s,'\0',sizeof(s));
for (i=1;i<=n;i++)
{
scanf("%s",ss+1);
l=strlen(ss+1);
mxl=mymax(mxl,l);
for (j=1;j<=l;j++)
{
s[++len]=ss[j];
num[len]=i;//num[i]存的是s[i]属于哪一个串
}if (i!=n) s[++len]=i;
}
if (n==1) {printf("%s\n\n",ss+1);continue;}
get_sa();get_h();
L=1;R=mxl;w=-1;
memset(bo,false,sizeof(bo));
while (L<=R)//二分
{
bool bk=0;mid=(L+R)>>1;
int sum=0;id=0;
for (i=1;i<=len;i++)
{
if (!bo[num[sa[i]]])
{
bo[num[sa[i]]]=1;
sum++;//统计出现了几个不同串的
}
if (h[i+1]<mid)
{
if (sum*2>n) {bk=1;sk[++id]=w;}//记录
memset(bo,0,sizeof(bo));sum=0;w=sa[i+1];
}
}
if (!bk) R=mid-1;
else
{
L=mid+1;ans=mid;ll=id;
memcpy(as,sk,sizeof(sk));
}
}
if (ans==-1) printf("?\n");
else {
for (i=1;i<=ll;i++)
{
for (j=as[i];j<as[i]+ans;j++)
printf("%c",s[j]);
printf("\n");
}
}
}
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: