您的位置:首页 > 其它

SPOJ NSUBSTR Substrings 后缀自动机

2015-04-11 13:29 507 查看
题目大意:

就是现在给出一个长度不超过25W的字符串S, 定义F(x)表示字符串S中长度为x的子串出现的最多次数, 例如“ababa"中F(1) = 3 (“a”出现了3次), F(2) = 2 ("ab“或者"ba"都出现了2次)

F(3) = 2 ("aba"出现了2次) F(4) = F(5) = 1, 对于给出的字符串S, 长度为n, 输出F(1~n)的值

大致思路:

首先对于字符串S建立后缀自动机, 然后由于每个状态 p 所代表的子串是一个区间长度[Min(p), Max(p)], 出现次数是状态p的Right集合大小, 那么在处理处后缀自动机之后, 问题变成了, 对于n次更新, 每次区间[Min(p), Max(p)]中比Right(p)小的数变成Right(p), 最后区间[1, n]中的值就是F[1~n], 但是这样的更新比较麻烦, 考虑Parent树的性质, 父亲节点的为par, 子节点是p的话, 那么par的right集合一定大于p的right集合, 并且Max(par)
= Min(p)  + 1, 所以对于上面的[Min(p), Max(p)]的更新可以就当做是[1, Max(p)]的更新, 这样用dp[i]表示结果F[i]的话, 对于n次更新, 每次更新dp[Max(p)]的值, 最后dp[i ~ n]中的最大值就是F[i], 复杂度O(length(S))

代码如下:

Result  :  Accepted     Memory  :  68608 ms     Time  :  260 ms

/*
* Author: Gatevin
* Created Time: 2015/4/11 12:51:01
* File Name: Rin_Tohsaka.cpp
*/
#include<iostream>
#include<sstream>
#include<fstream>
#include<vector>
#include<list>
#include<deque>
#include<queue>
#include<stack>
#include<map>
#include<set>
#include<bitset>
#include<algorithm>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cctype>
#include<cmath>
#include<ctime>
#include<iomanip>
using namespace std;
const double eps(1e-8);
typedef long long lint;
#define foreach(e, x) for(__typeof(x.begin()) e = x.begin(); e != x.end(); ++e)
#define SHOW_MEMORY(x) cout<<sizeof(x)/(1024*1024.)<<"MB"<<endl

#define maxn 250010*2
#define maxm 250010

struct Suffix_Automation
{
struct State
{
State *par;
State *go[26];
int val, mi, cnt, right;
void init(int _val = 0)
{
par = 0, val = _val, cnt = mi = right = 0;
memset(go, 0, sizeof(go));
}
int calc()
{
if(par == 0) return 0;
return val - par->val;
}
};
State *root, *last, *cur;
State nodePool[maxn];
State* newState(int val = 0)
{
cur->init(val);
return cur++;
}
void initSAM()
{
cur = nodePool;
root = newState();
last = root;
}
void extend(int w)
{
State *p = last;
State *np = newState(p->val + 1);
np->right = 1;
while(p && p->go[w] == 0)
{
p->go[w] = np;
p = p->par;
}
if(p == 0)
{
np->par = root;
}
else
{
State *q = p->go[w];
if(q->val == p->val + 1)
{
np->par = q;
}
else
{
State *nq = newState(p->val + 1);
memcpy(nq->go, q->go, sizeof(q->go));
nq->par = q->par;
q->par = nq;
np->par = nq;
while(p && p->go[w] == q)
{
p->go[w] = nq;
p = p->par;
}
}
}
last = np;
}
int d[maxm];
State* b[maxn];
void topo()
{
int maxVal = 0;
memset(d, 0, sizeof(d));
int cnt = cur - nodePool;
for(int i = 1; i < cnt; i++)
maxVal = max(maxVal, nodePool[i].val), d[nodePool[i].val]++;
for(int i = 1; i <= maxVal; i++) d[i] += d[i - 1];
for(int i = 1; i < cnt; i++) b[d[nodePool[i].val]--] = &nodePool[i];
b[0] = root;
return;
}
void SAMInfo()
{
State *p;
int cnt = cur - nodePool;
for(int i = cnt - 1; i > 0; i--)
{
p = b[i];
p->par->right += p->right;
p->mi = p->par->val + 1;
}
return;
}
};

Suffix_Automation sam;

char s[maxm];
int dp[maxn];

int main()
{
//scanf("%s", s);
gets(s);
int len = strlen(s);
sam.initSAM();
for(int i = 0; i < len; i++)
sam.extend(s[i] - 'a');
sam.topo();
sam.SAMInfo();
int cnt = sam.cur - sam.nodePool;
memset(dp, 0, sizeof(dp));
for(int i = cnt - 1; i > 0; i--)//区间更新[1, b[i]->val]的话记录dp[b[i]->val]的最大值
dp[sam.b[i]->val] = max(dp[sam.b[i]->val], sam.b[i]->right);
for(int i = len - 1; i > 0; i--)//数组后缀dp[i ~ len]中的最大值就是dp[i]
dp[i] = max(dp[i], dp[i + 1]);
for(int i = 1; i <= len; i++)
printf("%d\n", dp[i]);
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息