您的位置:首页 > 编程语言 > C语言/C++

KMP详解

2017-08-04 16:28 134 查看
首先,next数组是怎么得来的???

i 为指向字符串T的下标的变量, j 是指向以 i-1 位置为结束的字符的字符串的 相同的前后缀最长的 前缀的结束字符的下标。S代表主串,T代表模式串。

next数组实质上是,在 i 的位置之前的字符串的前缀(不包含本身)和后缀(不包含本身)的相同的字符的个数。

一、给next[0]赋值为-1,因为第一个字符之前没有任何的字符串,用-1来标志已经将 i 位置之前整个字符串比较完毕。

二、给next[1]赋值为0,因为在比较字符串的前缀和后缀的时候,不能比较字符串本身,所以,在只有一个字符的情况下,没有比的必要,直接为0。

三、进入循环:

1、若 T[i]==T[j] 的时候,将 ++j 填入 next[i] 的位置,之后 i++。

2、若 T[i]!=T[j] 并且 T[j]==-1 的时候,将next[i]=0的同时i++。

3、剩余的情况就是, T[i]!=T[j] 并且 T[j]!=-1 的时候,去寻找next[j]为下标的字符,比较是否与next[i]相等。



其次,KMP是怎么比较的呢???

一、若 S[i]==T[j] ,则 i++,j++。将主串与模式串的指向同时后移。

二、若 S[i]!=T[j] 并且 next[j]==-1 的时候,i++。与主串下一个的字符比较。这种情况代表将主串上的该字符与模式串的一个字符都不匹配。

三、若 S[i]!=T[j] 并且 next[j]!=-1 的时候,j=next[j]。将模式串向后移动 i-j 个位置,然后与主串进行比较。

#include<stdio.h>
#include<stdlib.h>
#include<string>

void getnext(char *T,int *next)
{
next[0] = -1;
next[1] = 0;
int i = 2;
int j = 0;
while (i<strlen(T))
{
if (T[i-1] == T[j])//如果相等
next[i++] = ++j;//为其赋值
else if(next[j]==-1)//在前面这部分串没有与之匹配的,则赋值为0
next[i++] = 0;
else//若当前没有找到,则去当前next[j]的下标继续找
j = next[j];
}
}

int kmp(char *S,char *T)
{
int *next = new int[strlen(T)];
getnext(T,next);//获得next数组
int i = 0;
int j = 0;
while (i<strlen(S)&&j<strlen(T))//分别小于他们的长度
{
if (S[i] == T[j])
{
i++;
j++;
}
else if (next[j]==-1)
{
i++;
}
else
{
j = next[j];
}
}

return j == strlen(T)?i-j:-1;
}

int main(void)
{
char S[] = { "abababcababababababababac" };
char T[] = { "abcabab" };
printf("%d\n",kmp(S,T));
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  kmp c语言