您的位置:首页 > 其它

poj3080,poj3450 多个字符串求最长公共子串问题 KMP,SA,SAM:

2014-03-09 22:28 471 查看
      这两题都是给若干个字符串,求他们的最长公共子串,这类题可以KMP,后缀数组,后缀自动机都可以做,前两个复杂度是O(NlogN),最后一个理论上是O(N),后缀自动的做法参考spoj上这个题:http://blog.csdn.net/night_raven/article/details/12438039。

     3080只有10个串,长度为60,用后缀数组的话,就把所有串串起来,求出height[]数组后,二分长度判断是否有解,判断的时候线性扫描一下,状压记录一下那些串取到了,所有串都取到并且这一段的height[]都大于当前长度就是true,否则就是false。。

      用kmp的话,同样是二分长度,然后枚举第一个串的子串去所有的串中匹配一边,代码上还是Kmp要好写点..

     3450有1000个串,串很多的时候后缀数组写起来就比较蛋疼了..这题些成kmp方便一些。

3080:

#include <iostream>
#include <cstdio>
#include <algorithm>
#include <string>
#include <cstring>
using namespace std;
typedef long long ll;
const int maxn=10100;
int s[maxn],rs[maxn];
int sa[maxn],t[maxn],t2[maxn],c[maxn];
int n,m,k,tt;
char s1[maxn],s2[maxn];
int rank[maxn],height[maxn];
int l1,l2;
int len,len1;
inline int idx(char s)
{
// return s-'A'+11;
if (s=='A') return 11;
if (s=='T') return 14;
if (s=='G') return 13;
return 12;
}
void getheight(int n)
{
int i,j,k=0;
for (i=0; i<=n; i++) rank[sa[i]]=i;
for (i=0; i<n; i++)
{
if (k) k--;
int j=sa[rank[i]-1];
while(s[i+k]==s[j+k]) k++;
height[rank[i]]=k;
}
}

void build_ss(int m,int n)
{
n++;
int i,*x=t,*y=t2;
for (int i=0; i<m; i++) c[i]=0;
for (int i=0; i<n; i++) c[x[i]=s[i]]++;
for (int i=1; i<m; i++) c[i]+=c[i-1];
for (int i=n-1; i>=0; i--)
sa[--c[x[i]]]=i;
for (int k=1; k<=n; k<<=1)
{
int p=0;
for (i=n-k; i<n; i++) y[p++]=i;
for (i=0; i<n; i++) if (sa[i]>=k) y[p++]=sa[i]-k;

for (i=0; i<m; i++) c[i]=0;
for (i=0; i<n; i++) c[x[y[i]]]++;
for (i=1; i<m; i++) c[i]+=c[i-1];
for (i=n-1; i>=0; i--) sa[--c[x[y[i]]]] = y[i];
swap(x,y);
p=1;
x[sa[0]]=0;
for (i=1; i<n; i++)
x[sa[i]]=(y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+k]==y[sa[i]+k])? p-1 : p++;
if (p>=n) break;
m=p;
}
}
int d[maxn][22];
void RMQ_init()
{
for (int i=1; i<=n; i++) d[i][0]=height[i];
for (int j=1; (1<<j)<=n; j++)
for (int i=1; (i+(1<<j)-1)<=n; i++)
d[i][j]=min(d[i][j-1],d[i+(1<<(j-1))][j-1]);
}
int RMQ(int L,int R)
{
int k=0;
while((1<<(k+1))<=R-L+1) k++;
return min(d[L][k],d[R-(1<<k)+1][k]);
}
int belong[maxn];
bool check(int ans,int &pos)
{
int sta=0;
for (int i=1; i<=len; i++)
{
if (height[i]>=ans)
{
sta|=(1<<belong[sa[i-1]]);
sta|=(1<<belong[sa[i]]);
pos=sa[i-1];
}
else
{
sta=0;
}
if (sta==(1<<(n))-1) return true;
}
return false;
}
char cg(int x)
{
if (x==11) return 'A';
if (x==12) return 'C';
if (x==13) return 'G';
if (x==14) return 'T';
}
int main()
{
// freopen("in.txt","r",stdin);
scanf("%d",&tt);
while(tt--)
{
scanf("%d",&n);
len=0;
int ct=1;
for (int i=0; i<n; i++)
{
scanf("%s",s1);
for (int j=0; j<strlen(s1); j++)
belong[len]=i,s[len++]=idx(s1[j]);
belong[len]=-1;
s[len++]=ct++;
}
s[len]=0;
build_ss(15,len);
getheight(len);
int l=0,r=len;
int pos;
while(l<r)
{
int mid=(l+r)>>1;
if (check(mid,pos)) l=mid+1;
else r=mid;
}
if (l-1<3)
{
puts("no significant commonalities");
}
else
{
check(l-1,pos);
for (int j=0; j<l-1; j++)
printf("%c",cg(s[pos++]));
printf("\n");
}
}

}

3450

#include <iostream>
#include <algorithm>
#include <cmath>
#include <cstdio>
#include <algorithm>
#include <stack>
#include <queue>
#include <map>
#include <string>
#include <cstring>
#include <string>
using namespace std;
typedef long long ll;
char s[4400][220];
int f[220];
char ans[220],tmp[220];
int n,m,k;
bool as;
void getFail(char* P,int* f)
{
int m=strlen(P);
f[0]=0;
f[1]=0;
for (int i=1; i<m; i++)
{
int j=f[i];
while(j && P[i]!=P[j]) j=f[j];
f[i+1]=P[i]==P[j]?j+1:0;
}
}
bool find(char* T,char* P,int* f)
{
int n=strlen(T);
int m=strlen(P);
// getFail(P,f);
int j=0;
for (int i=0; i<n; i++)
{
while(j && P[j]!=T[i]) j=f[j];
if (P[j]==T[i]) j++;
if (j==m) return true;
}
return false;
}

bool check(int x)
{
int l=strlen(s[0]);
int ct=0,cp=0;
bool res=false;
for (int i=0; i+x<=l; i++)
{
cp=i;
ct=0;
while(ct<x)
{
tmp[ct++]=s[0][cp++];
}
tmp[ct]='\0';
if (as)
{
if (strlen(ans)==strlen(tmp) && strcmp(ans,tmp)<0)
continue;
}

bool ok=true;
getFail(tmp,f);
for (int i=1; i<n; i++)
if (!find(s[i],tmp,f))
{
ok=false;
break;
}
if (ok)
{
strcpy(ans,tmp);
res=true;
as=true;
}
}
return res;
}

int main()
{
int tt;
// freopen("in.txt","r",stdin);
while(~scanf("%d",&n) && n)
{
for (int i=0; i<n; i++)
scanf("%s",s[i]);
as=false;
int l=0,r=200;
int pos=0;
while(l<r)
{
int mid=(l+r)>>1;
if (check(mid)) l=mid+1;
else r=mid;
}
if (l<=1) puts("IDENTITY LOST");
else
{
puts(ans);
}
}

return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐