您的位置:首页 > 其它

最长回文子串 - Manacher算法

2015-07-06 00:51 323 查看
算法思想:

设有字符串s[] = "121"

第一步:通过在每个字符左右都添加一个特殊字符,把奇数长度和偶数长度的字符串都转化成奇数(例如. "121" 加上特殊字符后变成"#1#2#1" ),同时也可在开头再加一个特殊字符,以便于忽略越界问题(如上例"121"变成"$#1#2#1#" 此时开头的特殊字符$和字符串末尾的\0与此串中其他字符都不同,即可忽略越界问题),此时字符串变成

s[] = "$#1#2#1#"

第二步:以v[i]数组表示字符串s中以i 为中心的最长回文子串向左或向右扩张的长度(包括s[i])

此时s[] 与v[] 的对应关系为

s[] = $ # 1 # 2 # 1 #

v[] = 1 2 1 4 1 2 1

可以看出v[]中的最大值-1即为所求最长回文字符串的总长度 4-1 = 3

实现方法:

增加两个辅助变量cn和mx,其中cn表示最大回文子串中心的位置,mx则为cn+v[cn],也就是最大回文子串的边界。得到一个很重要的结论:如果mx > i,那么v[i] >= min(v[2 * cn - i], mx - i)

证明:

情况1:当mx - i > v[2*cn-1] 时,以s[2*cn-1]为中心的回文子串包含在以s[cn]为中心的回文子串中,又因i和2*cn-1对称,则以s[i]为中心的回文子串必然包含在以s[cn]为中心的回文子串中,则有v[i] = v[cn*2-1] (如图所示)



情况2:当mx - i <= v[2*cn-1] 时,以v[2*cn-i]为中心的回文子串不一定完全包含于以v[cn]为中心的回文子串中,但根据下图易知:蓝框所包围的部分是相同的,也就是说以v[i]为中心的回文子串,其向右至少会扩张到mx的位置,也就是说 v[i] >= mx - i。至于mx之后的部分是否对称,再具体匹配。



则以上两种情况可由以下代码实现

v[i] = mx > i ? min(v[cn * 2 - i], mx - i) : 1;
while (s[i + v[i]] == s[i - v[i]]) //情况二中检测mx部分之后是否匹配
	++v[i];


总体实现代码:



#include <stdio.h>
#define min(a, b) (a > b ? b : a)
int LPS(char *p){
	char s[10000] = "$#";
	int v[10000] = {0};
	int c = 1;
	while (*p){
		s[++c] = *p++;
		s[++c] = '#';
	}
	s[++c] = '\0';
	int mx = 0, cn = 0, re = 0;
	for (int i = 1; '\0' != s[i]; ++i){
		v[i] = mx > i ? min(v[cn * 2 - i], mx - i) : 1;
		while (s[i + v[i]] == s[i - v[i]])
			++v[i];
		if (i + v[i] > mx){
			cn = i;
			mx = i + v[i];
		}
		if (v[i] > re)
			re = v[i];
	}
	return re - 1;
}
int main()
{
	char s[10000];
	while (~scanf("%s", s)){
		printf("%d\n", LPS(s));
	}
	return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: