您的位置:首页 > 其它

算法系列笔记9(字符串匹配)

2015-03-13 20:00 281 查看
字符串匹配指有一个文本串S和一个模式串P,现在要查找P在S中的位置。

主要有以下算法:



其中朴素算法和KMP算法我们在这边bloghttp://blog.csdn.net/lu597203933/article/details/41124815中已经讲解过。RP算法时间复杂度较高,我也没看,想看可以看算法导论。这里主要讲解有限自动机的字符串匹配算法。

有限自动机的定义:



有限自动机字符串匹配主要是构建一个状态转移函数。&(q,a)表示状态q<其中状态q表示已经匹配成功q个字符了>接收字符a后的状态,就等于Pqa(接收成功的q个字符连接上a)后缀的最长P前缀的长度。

 

例子:

 


伪代码:




 


代码如下:

#include <iostream>
#include <string>
using namespace std;
#define MAXSIZE 10
int transitionArray[MAXSIZE][MAXSIZE];

void computingTransition(const string &p, const string &alpha){

for(int q = 0; q < p.size(); q++){   // 初始状态q = 0
for(int i = 0; i < alpha.size(); i++){   // 所拥有的字母表
int k = q+1;
string s = p.substr(0, q)+ alpha[i];
bool flag = false;
for(; k > 0 && !flag; k--){
int j = 0;
for( ;j < k; j++){
if(p[j] != s[s.size()-k+j])break;
}
if(j == k) flag= true;
}
if(flag) transitionArray[q][i] = ++k;
else transitionArray[q][i] = 0;
cout << transitionArray[q][i] << " ";
}
cout << endl;
}

}

void finiteAutomationStringMatch(const string &s, int m){
int q = 0;
int i = 0;
for(int i = 0; i < s.size(); i++){
q =  transitionArray[q][s[i]-97];
if(q == m){
cout << "YES" << endl;
cout << i-m+1 << endl;
break;
}
}
if(i == s.size())
cout << "NO" << endl;

}

int main(){
string s("abababacaba"), p("ababaca");
string alpha = "abc";
computingTransition(p, alpha);
finiteAutomationStringMatch(s, p.size());
return 0;
}
结果:

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息