Manacher算法 最长回文子串
2015-05-24 12:43
211 查看
回文串定义:“回文串”是一个正读和反读都一样的字符串,比如“level”或者“noon”等等就是回文串。回文子串,顾名思义,即字符串中满足回文性质的子串。
经常有一些题目围绕回文子串进行讨论,比如POJ3974最长回文,求最长回文子串的长度。朴素算法是依次以每一个字符为中心向两侧进行扩展,显然这个复杂度是O(N^2)的,关于字符串的题目常用的算法有KMP、后缀数组、AC 自动机,这道题目利用扩展KMP可以解答,其时间复杂度也很快O(N*logN)。但是,今天笔者介绍一个专门针对回文子串的算法,其时间复杂度为O(n),这就是manacher 算法。
大家都知道,求回文串时需要判断其奇偶性,也就是求aba 和abba 的算法略有差距。然而,这个算法做了一个简单的处理,很巧妙地把奇数长度回文串与偶数长度回文串统一考虑,也就是在每个相邻的字符之间插入一个分隔符,串的首尾也要加,当然这个分隔符不能再原串中出现,一般可以用‘#’或者‘$’等字符。例如:
原串:abaab
新串:#a#b#a#a#b#
这样一来,原来的奇数长度回文串还是奇数长度,偶数长度的也变成以‘#’为中心奇数回文串了。
接下来就是算法的中心思想,用一个辅助数组P 记录以每个字符为中心的最长回文半径,也就是P[i]记录以Str[i]字符为中心的最长回文串半径。P[i]最小为1,此时回文串为Str[i]本身。
我们可以对上述例子写出其P 数组,如下
新串: # a # b # a # a # b #
P[] : 1 2 1 4 1 2 5 2 1 2 1
我们可以证明P[i]-1 就是以Str[i]为中心的回文串在原串当中的长度。
证明:
1、显然L=2*P[i]-1 即为新串中以Str[i]为中心最长回文串长度。
2、以Str[i]为中心的回文串一定是以#开头和结尾的,例如“#b#b#”或“#b#a#b#”所以L 减去最前或者最后的‘#’字符就是原串中长度 的二倍,即原串长度为(L-1)/2,化简的P[i]-1。得证。 依次从前往后求得P 数组就可以了,这里用到了DP(动态规划)的思想, 也就是求P[i] 的时候,前面的P[]值已经得到了,我们利用回文串的特殊性质可以进行一个大大的优化。
为了防止求P[i]向两边扩展时可能数组越界,我们需要在数组最前面和最后面加一个特殊字符,令P[0]=‘$’最后位置默认为‘\0’不需要特殊处理。此外,我们用mx变量记录在求i 之前的回文串中,延伸至最右端的位置,同时用id 记录取这个mx 的id 值。通过下面这句话,算法避免了很多没必要的重复匹配。
那么这句话是怎么得来的呢,其实就是利用了回文串的对称性,如下图,
j=2*id-1 即为i 关于id 的对称点,根据对称性,P[j]的回文串也是可以对称到i 这边的,但是如果P[j]的回文串对称过来以后超过mx 的话,超出部分就不能对称过来了,如下图,
所以这里P[i]为的下限为两者中的较小者,p[i]=min(p[2*id-i], mx-i)(如果p[j]的范围超出mx的话, 则p[i]就是mx-i)。算法的有效比较次数为mx 次,所以说这个算法的时间复杂度为O(n)。
经常有一些题目围绕回文子串进行讨论,比如POJ3974最长回文,求最长回文子串的长度。朴素算法是依次以每一个字符为中心向两侧进行扩展,显然这个复杂度是O(N^2)的,关于字符串的题目常用的算法有KMP、后缀数组、AC 自动机,这道题目利用扩展KMP可以解答,其时间复杂度也很快O(N*logN)。但是,今天笔者介绍一个专门针对回文子串的算法,其时间复杂度为O(n),这就是manacher 算法。
大家都知道,求回文串时需要判断其奇偶性,也就是求aba 和abba 的算法略有差距。然而,这个算法做了一个简单的处理,很巧妙地把奇数长度回文串与偶数长度回文串统一考虑,也就是在每个相邻的字符之间插入一个分隔符,串的首尾也要加,当然这个分隔符不能再原串中出现,一般可以用‘#’或者‘$’等字符。例如:
原串:abaab
新串:#a#b#a#a#b#
这样一来,原来的奇数长度回文串还是奇数长度,偶数长度的也变成以‘#’为中心奇数回文串了。
接下来就是算法的中心思想,用一个辅助数组P 记录以每个字符为中心的最长回文半径,也就是P[i]记录以Str[i]字符为中心的最长回文串半径。P[i]最小为1,此时回文串为Str[i]本身。
我们可以对上述例子写出其P 数组,如下
新串: # a # b # a # a # b #
P[] : 1 2 1 4 1 2 5 2 1 2 1
我们可以证明P[i]-1 就是以Str[i]为中心的回文串在原串当中的长度。
证明:
1、显然L=2*P[i]-1 即为新串中以Str[i]为中心最长回文串长度。
2、以Str[i]为中心的回文串一定是以#开头和结尾的,例如“#b#b#”或“#b#a#b#”所以L 减去最前或者最后的‘#’字符就是原串中长度 的二倍,即原串长度为(L-1)/2,化简的P[i]-1。得证。 依次从前往后求得P 数组就可以了,这里用到了DP(动态规划)的思想, 也就是求P[i] 的时候,前面的P[]值已经得到了,我们利用回文串的特殊性质可以进行一个大大的优化。
为了防止求P[i]向两边扩展时可能数组越界,我们需要在数组最前面和最后面加一个特殊字符,令P[0]=‘$’最后位置默认为‘\0’不需要特殊处理。此外,我们用mx变量记录在求i 之前的回文串中,延伸至最右端的位置,同时用id 记录取这个mx 的id 值。通过下面这句话,算法避免了很多没必要的重复匹配。
那么这句话是怎么得来的呢,其实就是利用了回文串的对称性,如下图,
j=2*id-1 即为i 关于id 的对称点,根据对称性,P[j]的回文串也是可以对称到i 这边的,但是如果P[j]的回文串对称过来以后超过mx 的话,超出部分就不能对称过来了,如下图,
所以这里P[i]为的下限为两者中的较小者,p[i]=min(p[2*id-i], mx-i)(如果p[j]的范围超出mx的话, 则p[i]就是mx-i)。算法的有效比较次数为mx 次,所以说这个算法的时间复杂度为O(n)。
#include <iostream> #include <cstdio> #include <algorithm> #include <cmath> #include <cstring> #include <string.h> #include <queue> #define N 110005 using namespace std; //hdu3068 最长回文子串(manacher算法) char str , newstr[N<<1]; //新的字符串newstr, 输入的字符串str int p[N<<1]; //模板 void init() //通过输入的str建立新串newstr { int t, k, j=strlen(str); newstr[0]='@'; //在串的开始加入另一个特殊字符, 可以避免对数组越界问题做特殊处理 newstr[1]='#'; for(t=0, k=2; t<j; ++t) { newstr[k++]=str[t]; newstr[k++]='#'; } newstr[k]='\0'; return ; } int f() ////新串的p[i]-1正好是原字符串中回文串的总长度 { int mx=0, id, i, ans=0, j=strlen(newstr); for(i=1; i<j; ++i) { if(mx>i) { p[i]=min(p[2*id-i], mx-i); } else p[i]=1; while(newstr[i+p[i]]==newstr[i-p[i]]) p[i]++; if(p[i]+i>mx) { mx=p[i]+i; id=i; } if(ans<p[i]) ans=p[i]; } return ans-1; //p[i]-1正好是原字符串中回文串的总长度 } int main() { while(scanf("%s", str)!=EOF) { init(); printf("%d\n", f()); } return 0; }
相关文章推荐
- 求字符串的最长回文子串(manacher算法O(n)时间)
- manacher算法 (O(n)求最长回文子串)
- hdu 3068 最长回文子串 Manacher算法
- 最长回文子串——Manacher算法
- 求最长回文子串算法分析-Manacher算法
- 【51NOD-0】1089 最长回文子串 V2(Manacher算法)
- 51nod1089---最长回文子串 V2(51nod基础:Manacher算法)
- [hiho 01]最长回文子串、Manacher算法
- Manacher算法实现求最长回文子串的长度
- 最长回文子串_Manacher算法_hihoCoder1032
- 1040. Longest Symmetric String (25)【最长回文子串-马拉车(manacher算法)——PAT (Advanced Level) Practise
- poj 3974 Manacher算法(判断最长回文子串)
- 字符串之最长回文子串 manacher算法
- hihoCoder 最长回文子串(manacher算法:马拉车)
- 最长回文子串-Manacher算法
- 【字符串处理】最长回文子串笔记(Manacher算法)
- Manacher算法解决最长回文子串问题---O(n)时间复杂度
- Manacher算法——求最长回文子串
- 最长回文子串-manacher算法
- Manacher算法求解最长回文子串