【字符串】【扩展kmp算法总结~~】
2017-08-10 18:09
706 查看
这两天呢,一直在被小伙伴们快ak的恐惧支配,G题杭电的数据很水,但是自己还是选择不水过,用扩展kmp去写,网上的资料很多,自己选了一个最简洁的模板,不用再写一个求next数组的函数,直接调用前特殊处理下exkmp函数就既可以求next数组,又可以求ex数组啦,hh谁说鱼与熊掌不可兼得,这不就是吗~但是呢,一开始一点也不好理解哎,自己选的模板,跪着也得理解完~~~(泪目~~
————言归正传,总结——————
1.扩展kmp算法呢是对kmp算法的扩展,扩展kmp算法也有一个和kmp函数名字一样的next数组,还有一个ex数组。
2.扩展kmp算法的可以用o(m+n)的复杂度求出字符串s1任意后缀和字符串s2的最长公共前缀。
3:扩展kmp算法里ex数组:ex[i] == j表示s1以i为起始的后缀与s2的最长公共前缀。
扩展kmp算法里next数组:next[i] == j表示s2以i为起始的后缀与s2的最长公共前缀
两者作用都一样当然可以调用同一个函数咯~
kmp算法里next数组:next[i] == j表示s2在0~i之前已匹配的前缀后缀长度为j+1(前提是next[0]初始化为-1,如果初始化为0,已匹配的长度就为j)
————加深理解,模拟算法实现过程————
用样例s1=aaaabaa,s2=aaaaa直接进行模拟算法实现过程,前提是要结合模板
第一步:由于exkmp函数的作用是在已知s2的next数组的情况下,求出字符串s1的任意后缀与字符串s2的最长公共前缀,存入ex,所以我们需要先调用函数求出next数组
主函数里调用过程如下,预先初始化next[0]=0;
exkmp(s2+1,s2,next+1,next);
这样调用的原因参见总结3,生成next数组的过程相当于将s2与s2自身进行匹配,s2+1 == 形参s1
s2 == 形参s2
next+1 == 形参ex
next == 形参next.
接收过程如下:
void exkmp(char s1[],char s2[],int ex[],int next[])
a.在此函数中我们传递给形参s1的是s2+1,结合下图所示样例s1=aaaa,s2=aaaaa来看,即s1[0..] == (s2+1)[1..]
b.传递给形参ex的是next+1,也就是next数组后移一位,即ex[i] == next[i+1](有点难懂,解释下,
我们将形参s1和形参s2进行匹配时,实际就是实参数组s2[1...]的后缀与实参数组本身s2[0..]的前缀进行匹配,所以我们匹配出的最大公共长度min(next[j],p)赋值给形参数组ex[i]时,实际就是赋值给next[i+1],(这里不知道为什么取最小值不要紧,稍后进行解释),结合下图两张图片来看,明显e数组的值存入next数组的后一位。
e[1] = 3 e[2] = 2 e[3] = 1
next[2] = 3 next[3] = 2 next[4] = 1
第二步:在已知s2的next数组的情况下,再次调用函数,求出s1的任意后缀和s2的最长公共前缀,存入ex。
在函数调用过程中,我们比较s1[i..]与s2的最长公共前缀部分时,只取较小的值,原因是,只有s2的自身前缀长度与p(s2和s1的公共前缀长度)都是公共长度的时候,这个值才能保证就是s1[i..]与s2的最长公共前缀部分。
当它们相等时,无法直接比较判断出最长公共前缀部分,因为p之后也有可能有公共长度,所以我们只需要继续从p开始逐一比较。
————言归正传,总结——————
1.扩展kmp算法呢是对kmp算法的扩展,扩展kmp算法也有一个和kmp函数名字一样的next数组,还有一个ex数组。
2.扩展kmp算法的可以用o(m+n)的复杂度求出字符串s1任意后缀和字符串s2的最长公共前缀。
3:扩展kmp算法里ex数组:ex[i] == j表示s1以i为起始的后缀与s2的最长公共前缀。
扩展kmp算法里next数组:next[i] == j表示s2以i为起始的后缀与s2的最长公共前缀
两者作用都一样当然可以调用同一个函数咯~
kmp算法里next数组:next[i] == j表示s2在0~i之前已匹配的前缀后缀长度为j+1(前提是next[0]初始化为-1,如果初始化为0,已匹配的长度就为j)
————加深理解,模拟算法实现过程————
用样例s1=aaaabaa,s2=aaaaa直接进行模拟算法实现过程,前提是要结合模板
第一步:由于exkmp函数的作用是在已知s2的next数组的情况下,求出字符串s1的任意后缀与字符串s2的最长公共前缀,存入ex,所以我们需要先调用函数求出next数组
主函数里调用过程如下,预先初始化next[0]=0;
exkmp(s2+1,s2,next+1,next);
这样调用的原因参见总结3,生成next数组的过程相当于将s2与s2自身进行匹配,s2+1 == 形参s1
s2 == 形参s2
next+1 == 形参ex
next == 形参next.
接收过程如下:
void exkmp(char s1[],char s2[],int ex[],int next[])
a.在此函数中我们传递给形参s1的是s2+1,结合下图所示样例s1=aaaa,s2=aaaaa来看,即s1[0..] == (s2+1)[1..]
b.传递给形参ex的是next+1,也就是next数组后移一位,即ex[i] == next[i+1](有点难懂,解释下,
我们将形参s1和形参s2进行匹配时,实际就是实参数组s2[1...]的后缀与实参数组本身s2[0..]的前缀进行匹配,所以我们匹配出的最大公共长度min(next[j],p)赋值给形参数组ex[i]时,实际就是赋值给next[i+1],(这里不知道为什么取最小值不要紧,稍后进行解释),结合下图两张图片来看,明显e数组的值存入next数组的后一位。
e[1] = 3 e[2] = 2 e[3] = 1
next[2] = 3 next[3] = 2 next[4] = 1
第二步:在已知s2的next数组的情况下,再次调用函数,求出s1的任意后缀和s2的最长公共前缀,存入ex。
在函数调用过程中,我们比较s1[i..]与s2的最长公共前缀部分时,只取较小的值,原因是,只有s2的自身前缀长度与p(s2和s1的公共前缀长度)都是公共长度的时候,这个值才能保证就是s1[i..]与s2的最长公共前缀部分。
当它们相等时,无法直接比较判断出最长公共前缀部分,因为p之后也有可能有公共长度,所以我们只需要继续从p开始逐一比较。
/*主函数里初始化和调用*/ /*next[0] = 0; exkmp(s2+1,s2,next+1,next); exkmp(s1,s2,ex,next);*/ void exkmp(char s1[],char s2[],int ex[],int next[]) { int i,j,p; i = j = 0; p = -1; while(s1[i]!='\0') { if( p == -1) { j = 0; do p++; while(s1[i+p] != '\0'&&s1[i+p] == s2[j+p]); ex[i] = p; } else if(next[j] < p) ex[i] = next[j]; else if(next[j] > p) ex[i] = p; else { j = 0; while(s1[i+p] != '\0'&&s1[i+p] == s2[j+p]) p++; ex[i] = p; } i++; j++; p--; } ex[i] = 0; return; }
相关文章推荐
- KMP算法(研究总结,字符串)
- KMP算法(研究总结,字符串)
- js字符串常用函数及扩展总结
- 细节的积累 ---字符串的常用方法总结
- Oracle存储过程总结(二、字符串处理相关函数)
- 随机数范围扩展方法总结 .
- Date类学习总结(Calendar Date 字符串 相互转换 格式化)
- C语言数组&字符串&结构体&共用体&枚举知识点总结
- iOS8中添加的extensions总结(一)——今日扩展
- JavaScript操作JSON的方法总结,JSON字符串转换为JSON对象
- ASP.NET链接字符串总结
- String类总结(以及扩展)
- C++和C对字符串操作总结
- php字符串处理函数总结
- 在sql语句中使用 xml for path 格式化字符串的方法总结
- js 字符串操作函数总结
- Date类学习总结(Calendar Date 字符串 相互转换 格式化)
- ES 6 : 字符串的扩展
- 字符串相关总结
- 字符串的调整与替换_附时空复杂度总结(转)