您的位置:首页 > 其它

KMP字符匹配算法学习笔记

2015-12-23 20:40 302 查看
KMP算法的本质在于对需要匹配字符串内部进行了分析标记使得在进行匹配时可以通过标记减少无意义的匹配次数。

它的原理是找出需匹配串中的每个字符之前的最长重复字符段(这个字符段当然是从第一个字符开始就和字符串匹配的),即所谓的后缀与前缀的理解,找到最长的后缀并确定对应前缀的最后一位之意。每当在进行匹配时若当前字符不匹配那么可以根据next数组对被匹配字符串的标记,将指针移动到这个字符串前的那个最长重复字符段的下一个字符(前缀字符段的下一个字符)进行比较(如果前缀字符段比较长的话就节省了很多时间了)。

next数组的生成是这个算法比较难搞清楚的地方,因为我发现网上很多教程把它和另一个意义的数组(即每个字符之前重复字符段的字符个数所组成的数组)混淆了。因为next数组本身不是用来理解这个算法原理而使用的数组,而是这个算法的程序代码中使用的一个数组(它并不是为了方便理解算法本身而是对于写代码来说更方便)。明白这点以后就很容易了,一种方法是先理解“每个字符之前重复字符段的字符个数组成的数组”,用前缀后缀来理解就是每个字符对应的的最大前缀字符个数组成的数组,然后用这个数组推出next数组(很简单,每个元素右移一位,最前面元素设为-1,然后如果是从0开始就每位加1)),另一种则是直接用代码来理解next数组(即当前字符不匹配时对应要匹配的下一个字符的位置标号组成的数组),当然这也要在明白重复字符段意义(前缀后缀字符段)之上的。

以上,KMP算法总结完成。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: