POJ 3294 Life Forms
2012-02-04 19:22
218 查看
POJ_3294
首先,我们可以把这几个序列合并成一个序列,并且在之间加入一些分隔符,但这些分隔符最好用不一样的且不同于序列中的字符的整数表示,这样在后面寻找后缀间的公共前缀时就避免了把分隔符也匹配进去的情况。
接着,我们只要二分字符串的长度k,并依height[]的值将height[]看成若干组,每组中height[]的值均不小于k。如果这一组中涵盖的不同的序列的数量大于N/2,那么就说明满足题意的字符串的长度至少为k。
找到k的值后再遍历一遍height数组,将符合要求的前缀的首字符的位置记录下来即可,根据首字符的位置和k的值就可以输出满足题意的字符串了。同时,由于是遍历height数组,先找到的解的一定是字典序较小的解。
首先,我们可以把这几个序列合并成一个序列,并且在之间加入一些分隔符,但这些分隔符最好用不一样的且不同于序列中的字符的整数表示,这样在后面寻找后缀间的公共前缀时就避免了把分隔符也匹配进去的情况。
接着,我们只要二分字符串的长度k,并依height[]的值将height[]看成若干组,每组中height[]的值均不小于k。如果这一组中涵盖的不同的序列的数量大于N/2,那么就说明满足题意的字符串的长度至少为k。
找到k的值后再遍历一遍height数组,将符合要求的前缀的首字符的位置记录下来即可,根据首字符的位置和k的值就可以输出满足题意的字符串了。同时,由于是遍历height数组,先找到的解的一定是字典序较小的解。
#include<stdio.h> #include<string.h> #define MAXD 101000 #define INF 0x3f3f3f3f char b[MAXD]; int N, M, P, f[MAXD], r[MAXD], sa[MAXD], rank[MAXD], height[MAXD], wa[MAXD], wb[MAXD], ws[MAXD], wv[MAXD]; int h[110], ans[MAXD]; void init() { int i, j, k, x = 128; k = 0; for(i = 0; i < N; i ++) { scanf("%s", b); for(j = 0; b[j]; j ++, k ++) { r[k] = b[j]; f[k] = i; } r[k] = x ++, f[k] = -1; ++ k; } M = k - 1; r[M] = 0; } int cmp(int *p, int x, int y, int l) { return p[x] == p[y] && p[x + l] == p[y + l]; } void da(int n, int m) { int i, j, p, *x = wa, *y = wb, *t; for(i = 0; i < m; i ++) ws[i] = 0; for(i = 0; i < n; i ++) ++ ws[x[i] = r[i]]; for(i = 1; i < m; i ++) ws[i] += ws[i - 1]; for(i = n - 1; i >= 0; i --) sa[-- ws[x[i]]] = i; for(j = p = 1; p < n; j *= 2, m = p) { for(p = 0, i = n - j; i < n; i ++) y[p ++] = i; for(i = 0; i < n; i ++) if(sa[i] >= j) y[p ++] = sa[i] - j; for(i = 0; i < n; i ++) wv[i] = x[y[i]]; for(i = 0; i < m; i ++) ws[i] = 0; for(i = 0; i < n; i ++) ++ ws[wv[i]]; for(i = 1; i < m; i ++) ws[i] += ws[i - 1]; for(i = n - 1; i >= 0; i --) sa[-- ws[wv[i]]] = y[i]; for(t = x, x = y, y = t, x[sa[0]] = 0, i = p = 1; i < n; i ++) x[sa[i]] = cmp(y, sa[i - 1], sa[i], j) ? p - 1 : p ++; } } void calheight(int n) { int i, j, k = 0; for(i = 1; i <= n; i ++) rank[sa[i]] = i; for(i = 0; i < n; height[rank[i ++]] = k) for(k ? -- k : 0, j = sa[rank[i] - 1]; r[i + k] == r[j + k]; k ++); } int check(int mid) { int i, j, k, p; for(i = 1; i <= M; i ++) { if(height[i] < mid) k = 0; else { if(k == 0) { memset(h, 0, sizeof(h)); h[f[sa[i - 1]]] = 1; p = sa[i - 1]; k = 1; } if(!h[f[sa[i]]]) { h[f[sa[i]]] = 1; ++ k; } if(k > N / 2) return 1; } } return 0; } void printresult(int mid) { int i, j, k = 0, p, n = 0; for(i = 1; i <= M; i ++) { if(height[i] < mid) { if(k > N / 2) ans[n ++] = p; k = 0; } else { if(k == 0) { memset(h, 0, sizeof(h)); h[f[sa[i - 1]]] = 1; p = sa[i - 1]; k = 1; } if(!h[f[sa[i]]]) { h[f[sa[i]]] = 1; ++ k; } } } if(k > N / 2) ans[n ++] = p; for(i = 0; i < n; i ++) { for(j = 0, k = ans[i]; j < mid; j ++) printf("%c", r[j + k]); printf("\n"); } } void solve() { int i, j, k, mid, min, max; da(M + 1, 300); calheight(M); min = 0, max = 1001; for(;;) { mid = (max + min) / 2; if(mid == min) break; if(check(mid)) min = mid; else max = mid; } if(mid == 0) printf("?\n"); else printresult(mid); } int main() { int t = 0; for(;;) { scanf("%d", &N); if(!N) break; init(); if(t ++) printf("\n"); solve(); } return 0; }
相关文章推荐
- poj_3294 Life Forms(后缀数组+二分)
- POJ 3294 Life Forms(后缀数组)
- poj 3294 Life Forms 求n(n>1)个字符串的最长的一个子串 后缀数组
- Poj 3294 Life Forms
- POJ - 3294 Life Forms
- poj 3294 Life Forms(n个字符串中 求公共子串长度超过k得最大子串 后缀数组)
- POJ 3294 Life Forms(后缀数组+二分)
- POJ - 3294 Life Forms
- POJ 3294 Life Forms (后缀数组)
- poj 3294 Life Forms (后缀数组)
- 【POJ】3294 Life Forms
- 【POJ】3294 Life Forms 【后缀数组——求在超过一半串中出现的最长串】
- POJ 3294 Life Forms
- POJ 3294 Life Forms (后缀数组)
- 【POJ】3294 Life Forms
- poj 3294 Life Forms(不小于k 个字符串中的最长子串)
- [后缀数组+二分] poj 3294 Life Forms
- POJ 3294 Life Forms(后缀数组+二分答案)
- Poj 3294 Life Forms(后缀数组+二分答案)
- POJ 题目3294Life Forms(后缀数组求超过k个的串的最长公共子串)