您的位置:首页 > 其它

[TyvjP1515] 子串统计 [luoguP2408] 不同子串个数(后缀数组)

2017-06-12 08:58 351 查看

Tyvj传送门

luogu传送门

 

经典题

统计一个字符串中不同子串的个数

一个字符串中的所有子串就是所有后缀的前缀

先求出后缀数组,求出后缀数组中相邻两后缀的 lcp

那么按照后缀数组中的顺序遍历求解

每一个后缀 suffix(sa[i]) 对于答案的贡献为 len - sa[i] - height[i]

len - sa[i] 为当前后缀的长度,也就是当前后缀所有前缀的个数(字符串从 0 开始)

height[i] 就是相邻两后缀 lcp,因为有可能会有相同前缀,而相同前缀在前面已经计算过了

为什么只需要 height 数组,而不用把任意两后缀的 lcp 求出来呢?

因为所有后缀已经按照字典序排序了,也就是说,sa[i] 和 sa[i - 1] 的 lcp 即为 sa[i] 和 sa[0 ~ i - 1] 的所有 lcp 的最大值。

 

——代码(Tyvj)

#include <cstdio>
#include <cstring>
#include <iostream>
#define N 200001
#define LL long long

LL ans;
int len, m = 256;
int buc
, x
, y
, sa
, rank
, height
;
char s
;

inline void build_sa()
{
int i, k, p;
for(i = 0; i < m; i++) buc[i] = 0;
for(i = 0; i < len; i++) buc[x[i] = s[i]]++;
for(i = 1; i < m; i++) buc[i] += buc[i - 1];
for(i = len - 1; i >= 0; i--) sa[--buc[x[i]]] = i;
for(k = 1; k <= len; k <<= 1)
{
p = 0;
for(i = len - 1; i >= len - k; i--) y[p++] = i;
for(i = 0; i < len; i++) if(sa[i] >= k) y[p++] = sa[i] - k;
for(i = 0; i < m; i++) buc[i] = 0;
for(i = 0; i < len; i++) buc[x[y[i]]]++;
for(i = 1; i < m; i++) buc[i] += buc[i - 1];
for(i = len - 1; i >= 0; i--) sa[--buc[x[y[i]]]] = y[i];
std::swap(x, y);
p = 1, x[sa[0]] = 0;
for(i = 1; i < len; i++)
x[sa[i]] = y[sa[i - 1]] == y[sa[i]] && y[sa[i - 1] + k] == y[sa[i] + k] ? p - 1 : p++;
if(p >= len) break;
m = p;
}
}

inline void build_height()
{
int i, j, k = 0;
for(i = 0; i < len; i++) rank[sa[i]] = i;
for(i = 0; i < len; i++)
{
if(!rank[i]) continue;
if(k) k--;
j = sa[rank[i] - 1];
while(s[i + k] == s[j + k] && i + k < len && j + k < len) k++;
height[rank[i]] = k;
}
}

int main()
{
int i;
scanf("%d", &len);
getchar();
for(i = 0; i < len; i++)
{
s[i] = getchar();
if((i + 1) % 80 == 0) getchar();
}
build_sa();
build_height();
for(i = 0; i < len; i++) ans += (LL)(len - sa[i] - height[i]);
printf("%lld\n", ans);
return 0;
}
View Code

 

洛谷那题好像数据有点问题。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: