poj 2774 最长公共子串(后缀数组)
2016-09-01 17:16
357 查看
题目:http://poj.org/problem?id=2774
题意:
给定两个字符串 A 和 B,求最长公共子串。
分析:
字符串的任何一个子串都是这个字符串的某个后缀的前缀。求 A 和 B 的最长公共子串等价于求 A 的后缀和 B 的后缀的最长公共前缀的最大值。如果枚举 A和 B 的所有的缀,那么这样做显然效率低下。由于要计算 A 的后缀和 B 的后缀的最长公共前缀,所以先第二个字符串写在第一个字符串后面,中间用一个没有出现过的字符隔开,再求这个新的字符串的后缀数组。
那么是不是所有的 height 值中的最大值就是答案呢?不一定!有可能这两个后缀是在同一个字符串中的,所以实际上只有当 suffix(sa[i-1])和suffix(sa[i])不是同一个字符串中的两个后缀时,height[i]才是满足条件的。而这其中的最大值就是答案。记字符串 A 和字符串 B 的长度分别为|A|和|B|。求新的字符串的后缀数组和 height 数组的时间是 O(|A|+|B|),然后求排名相邻但原来不在同一个字符串中的两个后缀的 height 值的最大值,时间也是O(|A|+|B|),所以整个做法的时间复杂度为 O(|A|+|B|)。时间复杂度已经取到下限,由此看出,这是一个非常优秀的算法。
题意:
给定两个字符串 A 和 B,求最长公共子串。
分析:
字符串的任何一个子串都是这个字符串的某个后缀的前缀。求 A 和 B 的最长公共子串等价于求 A 的后缀和 B 的后缀的最长公共前缀的最大值。如果枚举 A和 B 的所有的缀,那么这样做显然效率低下。由于要计算 A 的后缀和 B 的后缀的最长公共前缀,所以先第二个字符串写在第一个字符串后面,中间用一个没有出现过的字符隔开,再求这个新的字符串的后缀数组。
那么是不是所有的 height 值中的最大值就是答案呢?不一定!有可能这两个后缀是在同一个字符串中的,所以实际上只有当 suffix(sa[i-1])和suffix(sa[i])不是同一个字符串中的两个后缀时,height[i]才是满足条件的。而这其中的最大值就是答案。记字符串 A 和字符串 B 的长度分别为|A|和|B|。求新的字符串的后缀数组和 height 数组的时间是 O(|A|+|B|),然后求排名相邻但原来不在同一个字符串中的两个后缀的 height 值的最大值,时间也是O(|A|+|B|),所以整个做法的时间复杂度为 O(|A|+|B|)。时间复杂度已经取到下限,由此看出,这是一个非常优秀的算法。
#include<cstdio> #include<cstring> #include<algorithm> #include<iostream> using namespace std; const int INF = 1e9 + 9; const int N = 6e5 + 9;//开大3倍 /********************DC3算法*后缀数组模板*******************************/ #define F(x) ((x)/3+((x)%3==1?0:tb)) #define G(x) ((x)<tb?(x)*3+1:((x)-tb)*3+2) int wa , wb , wv , wss ; int c0 (int *r, int a, int b) { return r[a] == r[b] && r[a + 1] == r[b + 1] && r[a + 2] == r[b + 2]; } int c12 (int k, int *r, int a, int b) { if (k == 2) return r[a] < r[b] || r[a ] == r[b] && c12 (1, r, a + 1, b + 1); return r[a] < r[b] || r[a] == r[b] && wv[a + 1] < wv[b + 1]; } void sort (int *r, int *a, int *b, int n, int m) { int i; for (i = 0; i < n; i++) wv[i] = r[a[i]]; for (i = 0; i < m; i++) wss[i] = 0; for (i = 0; i < n; i++) wss[wv[i]]++; for (i = 1; i < m; i++) wss[i] += wss[i - 1]; for (i = n - 1; i >= 0; i--) b[--wss[wv[i]]] = a[i]; } void dc3 (int *r, int *sa, int n, int m) { int i, j, *rn = r + n; int *san = sa + n, ta = 0, tb = (n + 1) / 3, tbc = 0, p; r = r[n + 1] = 0; for (i = 0; i < n; i++) if (i % 3 != 0) wa[tbc++] = i; sort (r + 2, wa, wb, tbc, m); sort (r + 1, wb, wa, tbc, m); sort (r, wa, wb, tbc, m); for (p = 1, rn[F (wb[0])] = 0, i = 1; i < tbc; i++) rn[F (wb[i])] = c0 (r, wb[i - 1], wb[i]) ? p - 1 : p++; if (p < tbc) dc3 (rn, san, tbc, p); else for (i = 0; i < tbc; i++) san[rn[i]] = i; for (i = 0; i < tbc; i++) if (san[i] < tb) wb[ta++] = san[i] * 3; if (n % 3 == 1) wb[ta++] = n - 1; sort (r, wb, wa, ta, m); for (i = 0; i < tbc; i++) wv[wb[i] = G (san[i])] = i; for (i = 0, j = 0, p = 0; i < ta && j < tbc; p++) sa[p] = c12 (wb[j] % 3, r, wa[i], wb[j]) ? wa[i++] : wb[j++]; for (; i < ta; p++) sa[p] = wa[i++]; for (; j < tbc; p++) sa[p] = wb[j++]; } void da (int str[], int sa[], int rk[], int height[], int n, int m) { dc3 (str, sa, n + 1, m); int i, j, k = 0; for (i = 0; i <= n; i++) rk[sa[i]] = i; for (i = 0; i < n; i++) { if (k) k--; j = sa[rk[i] - 1]; while (str[i + k] == str[j + k]) k++; height[rk[i]] = k; } } /********************************************************************************/ int sa , rk , height , lcp , s ; char str1 ,str2 ; int len1,len2,n; bool ok(int a,int b) { if(a>b)swap(a,b); return a<len1&&b>len1; //判断是否a在第一个串中,b在第二个串中 } int main() { // freopen ("f.txt", "r", stdin); while (~scanf ("%s%s", str1,str2) ) { len1 = strlen (str1); len2=strlen(str2); n=len1+len2+1; for (int i = 0; i < len1; i++) s[i] = str1[i]; s[len1] = 'A'; for(int i=len1+1;i<=n;i++)s[i]=str2[i-len1-1]; da (s, sa, rk, height, n, 128); int maxn=0; for(int i=2;i<=n;i++){ if(height[i]>maxn&&ok(sa[i-1],sa[i]))maxn=height[i]; } printf("%d\n",maxn); } return 0; } /* Sample Input yeshowmuchiloveyoumydearmotherreallyicannotbelieveit yeaphowmuchiloveyoumydearmother Sample Output 27 */
相关文章推荐
- poj 2774 后缀数组 最长公共子串
- POJ - 2774 Long Long Message (最长公共子串 后缀数组)
- poj 2774 Long Long Message,后缀数组,求最长公共子串 hdu1403
- 【后缀数组求最长公共子串】POJ 2774
- POJ 2774 long long message(后缀数组求最长公共子串)
- poj 2774 最长公共子串 后缀数组
- 后缀数组之最长公共子串 poj 2774
- POJ 2774 后缀数组:求最长公共子串
- poj 2774 最长公共子串 后缀数组
- POJ 2774 (最长公共子串)后缀数组+二分
- poj 2774 Long Long Message,后缀数组,求最长公共子串 hdu1403
- POJ 2774 Long Long Message 后缀数组求最长公共子串
- POJ2774---Long Long Message(后缀数组,求最长公共子串)
- poj 2774 后缀数组 两个字符串的最长公共子串
- POJ-2774-Long Long Message(后缀数组-最长公共子串)
- poj2774 后缀数组2个字符串的最长公共子串
- POJ 题目2774 Long Long Message(后缀数组,求最长公共子串长度)
- poj 2774 最长公共子串 后缀数组
- 【后缀数组】 POJ 2774 Long Long Message 两个字符串的最长公共子串长度
- POJ 2774 Long Long Message 求两个串最长公共子串(后缀数组)