您的位置:首页 > 其它

bzoj1031后缀数组——绝对的详解绝对的易懂

2017-07-20 20:49 387 查看
//把挑战上的后缀数组看懂了再看这个
//思路和挑战上一样都是倍增都是先排好各种串再用一个串和另一个串合并主要就是第一个串相同的在同一个桶,每个桶内不同的顺序代表了不同的第二个串的大小,第二个串越小越先进桶;
//这样就最后倒着求顺序就好了;
//此题的思路好说就是先把圈换成串然后就是裸的后缀数组了。
#include<iostream>
#include<cstdio>
#include<algorithm>
#include<string.h>
using namespace std;
int n, m,len;
char str[300150];//存储原串
//int str[2000050];
int bucket[300120];//分桶存储一个级别的数有多少
int sa[300100], rank1[300150], rank2pos[300150];//sa[x]=y表示级别为x的后缀的起点位置是y rank1[x]=y起点位置是x的级别是y rank2pos[x]=y某个串第二个串的级别是x的开始位置是y
void houzhuishuzu()
{
m = len < 300 ?300: len;//这我们主要是确定最多有多少级别
for (int i = 0; i <m; i++)bucket[i] = 0;//桶先清零
for (int i = 0; i < len; i++)bucket[rank1[i] = str[i]]++;//第一个串的级别相同的进同一个桶现在还没第二个串所以顺序不重要
for (int i = 1; i < m; i++)bucket[i] += bucket[i - 1];
for (int i = len - 1; i >= 0; i--)sa[--bucket[rank1[i]]] = i;//由于sa[]是从0开始的所以要先减再用;还有这是倒着求得主要是为了和后面统一。
for (int k = 1; k <(len/2); k *= 2)//二分长度
{
int p = 0;
for (int i = 0; i <m; i++)bucket[i] = 0;
for (int i = len - 1; i >=len - k; i--)rank2pos[p++] = i;//很明显以i开头的这些串的第二个串都是空的所以他们都是最小,上面说了小的先进桶。这里i是串开头的位置
for (int i = 0; i < len; i++)if (sa[i]>k-1)rank2pos[p++] = sa[i] - k;//小的先进桶 这里i代表的是级别哦!
for (int i = 0; i < p; i++)bucket[rank1[rank2pos[i]]]++;//由于前面的铺垫这一步导致第一个串相同的串进同一个桶,同一个桶内越先进桶的第二个串越小。这里i越小那么他的第二个串越小
for (int i = 1; i <m; i++)bucket[i] += bucket[i - 1];//这是为了下一步分级别,很好懂吧这一步.。i 代表级别
for (int i = p- 1; i >= 0; i--)sa[--bucket[rank1[rank2pos[i]]]] = rank2pos[i];//i越小第二个串越小,所以我们倒着求,因为同一个桶中越靠后的串级别越大。
swap(rank1, rank2pos);//注意这里的swap
rank1[sa[0]] = 0; int kk = 1;
for (int i = 1; i < len; i++)
{
if ((rank2pos[sa[i]] == rank2pos[sa[i - 1]]) && (rank2pos[sa[i] + k] == rank2pos[sa[i - 1] + k]))//如果第一个串相同,那么第二个串再相同就一样否则就是要增加一个级别。和挑战上一样
rank1[sa[i]] = kk - 1;
else
rank1[sa[i]] = kk++;
}
}
}
int main()
{
scanf("%s", str);
len = strlen(str);
//for (int i = 0, j = 3; i < 3; i++, j++)
//{
//	str[i] = i;
// str[j] = str[i];
//		 }
//len = 3;
for (int i = 0, j = len; i < len; i++, j++)
{
// str[i] -= 'a';
str[j] = str[i];
}
len = 2 * len;
houzhuishuzu();
len /= 2;
for (int i = 0; i < len * 2; i++)
if (sa[i] < len)
printf("%c", str[sa[i] + len - 1]);
printf("\n");
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: