您的位置:首页 > 其它

POJ 3294 后缀数组+二分

2017-03-06 19:23 190 查看
你可能想知道为什么大多数外星生命形式类似于人类,不同的表面特征,如身高,颜色,皱纹,耳朵,眉毛等。几个人没有人类的相似性;这些通常具有几何或无定形形状,如立方体,油滑层或尘云。
答案是在星际迷航 - 下一代的第146集,题为追逐。事实证明,在绝大多数象限的生命形式最终与一个大片段的共同的DNA。
给定被表示为字母串的几个生命形式的DNA序列,您将找到由其中一半以上共享的最长子字符串。

输入

标准输入包含几个测试用例。每个测试用例开始于1≤n≤100,即生命形式的数量。 n行;每个包含代表生命形式的DNA序列的小写字母的字符串。每个DNA序列包含至少一个且不超过1000个字母。在最后一个测试用例之后包含0的行。

输出

对于每个测试用例,输出由一半以上生命形式共享的最长字符串。如果有很多,按字母顺序输出所有。如果没有至少有一个字母的解,输出“?”。在测试用例之间留下空行。

点击打开链接

题意:先是问你大于n/2个串的最长公共子串的长度,然后在这个长度的基础上,有多少子串是符合的,按字典序输出

思路:先将最长公共子串的长度求出来,然后再跑一遍,将长度符合的找出来输出就行了,PS:昨天晚上调了几个小时的bug,妹的根本就不需要自己排序,用后缀数组先符合的肯定是字典序最小的嘛,蠢死的节奏,还有就是对于每一组的前缀我们只要第一个,这个也只需要标记一下即可,后者想不到的话,我们可以在输出的时候去一下重,应该也可以还没有尝试,还有就是这道题目的相连的串之间添加的字符不能一样,不然可能会是因为添加的字符变成的最长公共子串,会影响结果

[html] view
plain copy

 





#include <vector>  

#include <stdio.h>  

#include <stdlib.h>  

#include <string.h>  

#include <iostream>  

#include <algorithm>  

using namespace std;  

typedef long long ll;  

const int inf=0x3f3f3f3f;  

const int MAXN=110000;  

int wa[MAXN],wb[MAXN],wv[MAXN],ww[MAXN];  

int sa[MAXN],lcp[MAXN],Rank[MAXN],rank1[MAXN];  

int str1[MAXN];  

inline bool cmp(int *r,int a,int b,int len){  

    return r[a]==r[b]&&r[a+len]==r[b+len];  

}  

void construct_sa(int *str,int n,int m){  

     int i,j,p,*x=wa,*y=wb,*t;  

     for(i=0;i<m;i++) ww[i]=0;  

     for(i=0;i<n;i++) ww[x[i]=str[i]]++;  

     for(i=1;i<m;i++) ww[i]+=ww[i-1];  

     for(i=n-1;i>=0;i--) sa[--ww[x[i]]]=i;  

     for(j=p=1;p<n;j<<=1,m=p){  

         for(p=0,i=n-j;i<n;i++)  

            y[p++]=i;  

         for(i=0;i<n;i++){  

             if(sa[i]>=j)  

                 y[p++]=sa[i]-j;  

         }  

         for(i=0;i<m;i++) ww[i]=0;  

         for(i=0;i<n;i++) ww[wv[i]=x[y[i]]]++;  

         for(i=1;i<m;i++) ww[i]+=ww[i-1];  

         for(i=n-1;i>=0;i--) sa[--ww[wv[i]]]=y[i];  

         for(t=x,x=y,y=t,x[sa[0]]=0,p=i=1;i<n;i++)  

             x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;  

     }  

}  

void construct_lcp(int n,int *str){  

    for(int i=0;i<=n;i++) rank1[sa[i]]=i;  

    int h=0;  

    lcp[0]=0;  

    for(int i=0;i<n;i++){  

        int j=sa[rank1[i]-1];  

        if(h>0) h--;  

        for(;j+h<n&&i+h<n;h++) if(str[i+h]!=str[j+h]) break;  

        lcp[rank1[i]-1]=h;  

    }  

}  

int id[MAXN];  

vector<int>G;  

bool vis[1010];  

char str2[1010];  

int judge(int mid,int k,int n){  

    memset(vis,0,sizeof(vis));  

    int sum=0;  

    for(int i=0;i<k;i++){  

        if(lcp[i]<mid){  

            if(sum==0) continue;  

            memset(vis,0,sizeof(vis));sum=0;  

            continue;  

        }  

        if(vis[id[sa[i]]]==0){  

            vis[id[sa[i]]]=1;  

            sum++;  

        }  

        if(vis[id[sa[i+1]]]==0){  

            vis[id[sa[i+1]]]=1;  

            sum++;  

        }  

        if(sum>n/2) return 1;  

    }  

    return 0;  

}  

void slove(int mid,int k,int n){  

    memset(vis,0,sizeof(vis));  

    int sum=0,cnt=0,flag=0;  

    for(int i=0;i<k;i++){  

        if(lcp[i]<mid){  

            memset(vis,0,sizeof(vis));sum=0;flag=0;  

            continue;  

        }  

        if(vis[id[sa[i]]]==0){  

            vis[id[sa[i]]]=1;  

            sum++;  

        }  

        if(vis[id[sa[i+1]]]==0){  

            vis[id[sa[i+1]]]=1;  

            sum++;  

        }  

        if(sum>n/2&&flag==0){  

            G.push_back(sa[i]);  

            cnt++;flag=1;  

        }  

    }  

    for(int i=0;i<mid;i++) printf("%c",str1[G[0]+i]);  

    printf("\n");  

    for(int i=1;i<cnt;i++){  

        if(G[i]==G[i-1]) continue;  

        for(int j=0;j<mid;j++) printf("%c",str1[G[i]+j]);  

        printf("\n");  

    }  

}  

int main(){  

    int n;  

    while(scanf("%d",&n)!=-1){  

        if(n==0) break;  

        int k=0;G.clear();  

        memset(str1,0,sizeof(str1));  

        memset(id,-1,sizeof(id));  

        for(int i=0;i<n;i++){  

            scanf("%s",str2);  

            int len=strlen(str2);  

            for(int j=0;j<len;j++){  

                str1[k]=str2[j];  

                id[k++]=i;  

            }  

            if(i!=n-1) str1[k++]=150+i;  

        }  

        construct_sa(str1,k+1,1010);  

        construct_lcp(k,str1);  

        int le=0,ri=1010;  

        while(ri-le>1){  

            int mid=(le+ri)>>1;  

            if(judge(mid,k,n)) le=mid;  

            else ri=mid;  

        }  

        if(le==0) printf("?\n");  

        else slove(le,k,n);  

        printf("\n");  

    }  

    return 0;  

}  
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  后缀数组