您的位置:首页 > 其它

KMP算法

2015-12-26 14:20 309 查看

KMP算法:

指一种字符串匹配的算法。

引子:

其实就是根据字符串本身的性质判断若当前位置不匹配,则最少右移几位可以开始匹配。

比如字符串为babba,若最后一位不匹配则显然右移一位,两位均不可,但右移三位可以。因为前两个字符,和后两个字符相等。这样就大大减少了移动速度,匹配次数。

算法具体实现过程:

实现其实是一种图论的方法实现。之前的例子最后一位不成功,就要再从第三位开始比较,我们将这样的一种关系,叫做失配边。

所以显然我们的任务有两个:

1.建立失配边

失配边的建立,靠递归,因为失配边其实就是自己去匹配自己。

不妨设a为被匹配字串,长度为n

b为匹配字串,长度为m

f数组即failure function是记录失配边的。即当前位置失败了,要从f[i]开始匹配当前位置。

注意不论字符串还是字符型数组都是从0开始的。

[code]  f[0]=0;f[1]=0;
  for(int i=1;i<m;i++){
    int j=f[i];
    while(j&&b[j]!=b[i])j=f[j];
    f[i+1]= b[i]==b[j] ? j+1:0;
  }


[b]f[i]表示0~f[i]-1与i-f[i]-1~i-1相等[/b]

2.匹配

有了f[],匹配就很好完成了。

[code]  int j=0;
  for(int i=0;i<n;i++){
    while(j&&b[j]!=a[i])j=f[j];
    if(b[j]==a[i])j++;
    if(j==m)printf("%d\n",i-m+1);
  }


//如果不等就回溯

//如果相等就+1

简单例题

POJ3461 Oulipo

POJ2406 Power Strings

POJ1961 Period

简单性质:

判断循环节:

len%(len-f[len])==0
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: