您的位置:首页 > 其它

Manacher算法(最长回文串)

2016-08-07 18:56 267 查看
 首先:大家都知道什么叫回文串吧,这个算法要解决的就是一个字符串中最长的回文子串有多长。这个算法可以在O(n)的时间复杂度内既线性时间复杂度的情况下,求出以每个字
4000
符为中心的最长回文有多长,

    这个算法有一个很巧妙的地方,它把奇数的回文串和偶数的回文串统一起来考虑了。这一点一直是在做回文串问题中时比较烦的地方。这个算法还有一个很好的地方就是充分利用了字符匹配的特殊性,避免了大量不必要的重复匹配。

    算法大致过程是这样。先在每两个相邻字符中间插入一个分隔符,当然这个分隔符要在原串中没有出现过。一般可以用‘#’分隔。这样就非常巧妙的将奇数长度回文串与偶数长度回文串统一起来考虑了(见下面的一个例子,回文串长度全为奇数了),然后用一个辅助数组P记录以每个字符为中心的最长回文串的信息。P[id]记录的是以字符str[id]为中心的最长回文串,当以str[id]为第一个字符,这个最长回文串向右延伸了P[id]个字符。

    原串:    w aa bwsw f d

    新串:   # w# a # a # b# w # s # w # f # d #

辅助数组P:  1 2 1 2 3 2 1 2 1 2 1 4 1 2 1 2 1 2 1

    这里有一个很好的性质,P[id]-1就是该回文子串在原串中的长度(包括‘#’)。如果这里不是特别清楚,可以自己拿出纸来画一画,自己体会体会。当然这里可能每个人写法不尽相同,不过我想大致思路应该是一样的吧。

    好,我们继续。现在的关键问题就在于怎么在O(n)时间复杂度内求出P数组了。只要把这个P数组求出来,最长回文子串就可以直接扫一遍得出来了。

    由于这个算法是线性从前往后扫的。那么当我们准备求P[i]的时候,i以前的P[j]我们是已经得到了的。我们用mx记在i之前的回文串中,延伸至最右端的位置。同时用id这个变量记下取得这个最优mx时的id值。(注:为了防止字符比较的时候越界,我在这个加了‘#’的字符串之前还加了另一个特殊字符‘$’,故我的新串下标是从1开始的)

if( mx > i)

    p[i]=MIN( p[2*id-i], mx-i);

 

就是当前面比较的最远长度mx>i的时候,P[i]有一个最小值。这个算法的核心思想就在这里,为什么P数组满足这样一个性质呢?

   (下面的部分为图片形式)



#include <stdio.h>
#include <algorithm>
#include <string.h>
#include<string>
#include <math.h>
#include <set>
#include<map>

#define MOD 1000000007
#define LL long long int

using namespace std;

char S[1000005];
char s[2000006];
int p[2000006];

int solve()
{
memset(p, 0, sizeof(p));
int len = strlen(S);
s[0] = '$';
s[1] = '#';
for (int i = 1; i <= len; ++i)
{
s[i << 1] = S[i - 1];
s[(i << 1) + 1] = '#';
}
len = len * 2 + 2;
int ans = 0, pi = 0;
p[0] = 1;
for (int i = 1; i < len; ++i)
{
if (i < pi + p[pi])
{
p[i] = min(p[pi * 2 - i], pi + p[pi] - i);
}
else
{
p[i] = 1;
}
while (s[i + p[i]] == s[i - p[i]])
{
++p[i];
}
if (i + p[i] > pi + p[pi])
{
pi = i;
ans = max(ans, p[pi]);
}
}
return ans - 1;

}

int main()
{
int T;
scanf("%d", &T);
while (T--)
{
scanf("%s", &S);
printf("%d\n", solve());
}
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: