KMP字符匹配算法学习笔记
2015-12-23 20:40
302 查看
KMP算法的本质在于对需要匹配字符串内部进行了分析标记使得在进行匹配时可以通过标记减少无意义的匹配次数。
它的原理是找出需匹配串中的每个字符之前的最长重复字符段(这个字符段当然是从第一个字符开始就和字符串匹配的),即所谓的后缀与前缀的理解,找到最长的后缀并确定对应前缀的最后一位之意。每当在进行匹配时若当前字符不匹配那么可以根据next数组对被匹配字符串的标记,将指针移动到这个字符串前的那个最长重复字符段的下一个字符(前缀字符段的下一个字符)进行比较(如果前缀字符段比较长的话就节省了很多时间了)。
next数组的生成是这个算法比较难搞清楚的地方,因为我发现网上很多教程把它和另一个意义的数组(即每个字符之前重复字符段的字符个数所组成的数组)混淆了。因为next数组本身不是用来理解这个算法原理而使用的数组,而是这个算法的程序代码中使用的一个数组(它并不是为了方便理解算法本身而是对于写代码来说更方便)。明白这点以后就很容易了,一种方法是先理解“每个字符之前重复字符段的字符个数组成的数组”,用前缀后缀来理解就是每个字符对应的的最大前缀字符个数组成的数组,然后用这个数组推出next数组(很简单,每个元素右移一位,最前面元素设为-1,然后如果是从0开始就每位加1)),另一种则是直接用代码来理解next数组(即当前字符不匹配时对应要匹配的下一个字符的位置标号组成的数组),当然这也要在明白重复字符段意义(前缀后缀字符段)之上的。
以上,KMP算法总结完成。
它的原理是找出需匹配串中的每个字符之前的最长重复字符段(这个字符段当然是从第一个字符开始就和字符串匹配的),即所谓的后缀与前缀的理解,找到最长的后缀并确定对应前缀的最后一位之意。每当在进行匹配时若当前字符不匹配那么可以根据next数组对被匹配字符串的标记,将指针移动到这个字符串前的那个最长重复字符段的下一个字符(前缀字符段的下一个字符)进行比较(如果前缀字符段比较长的话就节省了很多时间了)。
next数组的生成是这个算法比较难搞清楚的地方,因为我发现网上很多教程把它和另一个意义的数组(即每个字符之前重复字符段的字符个数所组成的数组)混淆了。因为next数组本身不是用来理解这个算法原理而使用的数组,而是这个算法的程序代码中使用的一个数组(它并不是为了方便理解算法本身而是对于写代码来说更方便)。明白这点以后就很容易了,一种方法是先理解“每个字符之前重复字符段的字符个数组成的数组”,用前缀后缀来理解就是每个字符对应的的最大前缀字符个数组成的数组,然后用这个数组推出next数组(很简单,每个元素右移一位,最前面元素设为-1,然后如果是从0开始就每位加1)),另一种则是直接用代码来理解next数组(即当前字符不匹配时对应要匹配的下一个字符的位置标号组成的数组),当然这也要在明白重复字符段意义(前缀后缀字符段)之上的。
以上,KMP算法总结完成。
相关文章推荐
- 素数环问题之解题报告
- VirtualBox使用笔记
- 利用 druid 解析器解析SQL
- android125 zhihuibeijing 缓存
- ubuntu 安装 acrobat reader
- 创业公司如何实施敏捷开发
- PCB板蛇形走线有什么作用
- tf–idf算法解释及其python代码实现(上)
- javascript/jquery判断是否为undefined或是null!
- 微信调试器
- jQuery获取和设置disabled属性、背景图片路径
- iSensor APP 之 摄像头调试 OV9655
- Perl6 -1.3 子例程2
- 音频Audio
- 数据库查询,指定查询结果某列为固定值
- ha_innobase::open
- PAT乙级 统计同成绩学生(20)
- UVA 548 树 ( 从中序和后续回复二叉树)
- imageNamed、imageWithContentsOfFile、imageWithData
- $(function(){})里面不能声明定义函数