hdoj 3518 Boring counting 【后缀数组】
2012-08-08 18:00
447 查看
大致题意: 给出一个字符串,求出所有不重叠出现次数大于等于两次的子串的数目。
View Code
View Code
/* 后缀数组倍增算法 * 并且计算了height[], height[i] = LCP(i-1, i), LCP(i, j)=lcp(suffix(sa[i]), suffix(sa[j])) * 时间复杂度:N*logN * */ //hdoj 3518. #include <cstdio> #include <cstring> #include <algorithm> using namespace std; const int MAXM = 10000 + 10; const int LOG_MAXM = 20; const int INF = INT_MAX; int buc[MAXM]; int X[MAXM], Y[MAXM]; int rank[MAXM], height[MAXM], sa[MAXM]; void cal_height(int *r, int n) { int i, j, k = 0; // height[i] = LCP(i-1, i) //rank[sa[0]] = 0; for (i = 1; i <= n; ++i) rank[sa[i]] = i; // sa[0] 是添加的0字符,0字符排第0位,所以可以忽略 for (i = 0; i < n; height[rank[i++]] = k) // h[i] = height[rank[i]], h[i] >= h[i-1] - 1 for (k?k--:0, j = sa[rank[i] - 1]; r[i+k] == r[j+k]; ++k) ; } bool cmp(int *r, int a, int b, int l) { return r[a] == r[b] && r[a+l] == r[b+l]; } void suffix(int *r, int n, int m=128) //字符串r末尾是0,所以长度应该是n+1,即原来基础上多加0 { int i, l, p, *x = X, *y = Y, *t; for (i = 0; i < m; ++i) buc[i] = 0; for (i = 0; i < n; ++i) buc[ x[i] = r[i] ]++; for (i = 1; i < m; ++i) buc[i] += buc[i - 1]; for (i = n - 1; i >= 0; --i) sa[ --buc[x[i]] ] = i; for (l = 1, p = 1; p < n; m = p, l <<= 1) { for (p = 0, i = n - l; i < n; ++i) y[p++] = i; // 末尾l个子串没有l长的第二关键字 for (i = 0; i < n; ++i) { // 根据第二关键字,存第一关键字的位置 if (sa[i] >= l) // 保证有第一关键字 y[p++] = sa[i] - l; // 记录第一关键字的位置 } for (i = 0; i < m; ++i) buc[i] = 0; //根据第一关键字排序 for (i = 0; i < n; ++i) buc[ x[y[i]] ]++; for (i = 1; i < m; ++i) buc[i] += buc[i - 1]; for (i = n - 1; i >= 0; --i) sa[ --buc[ x[y[i]] ] ] = y[i]; for (t = x, x = y, y = t, x[ sa[0] ] = 0, i = 1, p = 1; i < n; ++i) {//为下次排序准备2*l长的子串的rank值 x[ sa[i] ] = cmp(y, sa[i-1], sa[i], l) ? p-1 : p++; // 新的rank值 } } cal_height(r, n - 1); } int best[MAXM][LOG_MAXM]; void init_rmq(int n) { for (int i = 1; i <= n; ++i) best[i][0] = height[i]; for (int l = 1; (1 << l) <= n; ++l) { int limit = n - (1 << l) + 1; for (int i = 1; i <= limit; ++i) { best[i][l] = min(best[i][l-1], best[i + (1 << (l-1))][l-1]); } } } int lcp(int a, int b) // 询问a, b后缀的最长前缀 { a = rank[a], b = rank[b]; if (a > b) swap(a, b); ++a; // 因为height[i]记录的是LCP(i-1, i),所以要++a; int l = 0; for (; (1 << l) <= b - a + 1; ++l) ; --l; return min(best[a][l], best[b-(1<<l)+1][l]); } char str[MAXM]; //输入的串。 int num[MAXM]; int check(int tmp, int n) //长度为tmp的重复子串有几个。 { int x = -1; int y = INF; int ans = 0; for(int i = 2; i <= n; i++) { if(height[i] >= tmp) { x = max(sa[i-1], max(sa[i], x) ); y = min(sa[i-1], min(sa[i], y) ); } else { //x-y>=tmp,是因为题中说不重复子串,因为sa[i]表示排名为i的 //位置,x就是这些串中的位置最大的一个,y则反之, //所以,x-y>=tmp就表示位置之差大于tmp,所以肯定是不重复的 //子串。 if(x != -1 && y != INF && x - y >= tmp) { ans++; } x = -1; y = INF; } } if(x != -1 && y != INF && x-y >= tmp) { ans++; } return ans; } int main() { // input while(scanf("%s", str) != EOF) { if(strcmp(str, "#") == 0) break; int n = 0; int len = strlen(str); for(int i = 0; i < len; i++) { num[i] = str[i] - 'a' + 1; } num[len] = 0; n = len; suffix(num, n + 1, 128); //tmp是总共出现的字符的个数,并且+1; init_rmq(n); int ans = 0; for(int i = 1; i <= n/2; i++) { ans += check(i, len); } printf("%d\n", ans); } return 0; }
相关文章推荐
- 【后缀数组】 HDOJ 3518 Boring counting
- HDOJ 题目3518 Boring counting(后缀数组,求不重叠重复次数最少为2的子串种类数)
- HDOJ 题目3518 Boring counting(后缀数组,求不重叠反复次数最少为2的子串种类数)
- HDU 3518 Boring counting(后缀数组 所有不重叠字串出现两次以上的次数)
- 后缀数组 --- HDU 3518 Boring counting
- HDU 3518 Boring counting[后缀数组]
- Hdu 3518 Boring counting 后缀数组
- hdu 3518 Boring counting 后缀数组基础题
- HDU 3518 Boring counting(后缀数组,字符处理)
- HDU 3518 Boring counting(后缀数组入门题)
- 【后缀数组】 HDOJ 2459 && POJ 3693 Maximum repetition substring
- 【HDOJ】3518 Boring Counting
- HDOJ 3518 Boring counting
- HDOJ 3948 The Number of Palindromes 后缀数组
- 【HDOJ6223】Infinite Fraction Path(后缀数组,倍增)
- 【后缀数组】 HDOJ 5030 Rabbit's String
- 【后缀数组】 HDOJ 4552 怪盗基德的挑战书
- hdu 3158 Boring counting 后缀数组
- HDU 3518 Boring Counting 后缀数组/后缀自动机
- hdoj5769Substring【后缀数组】