您的位置:首页 > 其它

HDU 2825 AC自动机模板

2013-01-15 09:53 309 查看
首先简要介绍一下AC自动机:Aho-Corasick automation,该算法在1975年产生于贝尔实验室,是著名的多模匹配算法之一。一个常见的例子就是给出n个单词,再给出一段包含m个字符的文章,让你找出有多少个单词在文章里出现过。要搞懂AC自动机,先得有模式树(字典树)Trie和KMP模式匹配算法的基础知识。AC自动机算法分为3步:构造一棵Trie树,构造失败指针和模式匹配过程。

如果你对KMP算法和了解的话,应该知道KMP算法中的next函数(shift函数或者fail函数)是干什么用的。KMP中我们用两个指针i和j分别表示,A[i-j+ 1..i]与B[1..j]完全相等。也就是说,i是不断增加的,随着i的增加j相应地变化,且j满足以A[i]结尾的长度为j的字符串正好匹配B串的前 j个字符,当A[i+1]≠B[j+1],KMP的策略是调整j的位置(减小j值)使得A[i-j+1..i]与B[1..j]保持匹配且新的B[j+1]恰好与A[i+1]匹配,而next函数恰恰记录了这个j应该调整到的位置。同样AC自动机的失败指针具有同样的功能,也就是说当我们的模式串在Tire上进行匹配时,如果与当前节点的关键字不能继续匹配的时候,就应该去当前节点的失败指针所指向的节点继续进行匹配。

/*
HDU2825 Wireless Password
*/
#include <cstdio>
#include <cstdlib>
#include <string>
#include <climits>
#include <iostream>
#include <vector>
#include <set>
#include <cmath>
#include <cctype>
#include <algorithm>
#include <sstream>
#include <map>
#include <cstring>
#include <queue>
using namespace std;

//MAX_NODE = StringNumber * StringLength
const int MAX_NODE = 101;
//节点个数,一般字符形式的题26个
const int CHILD_NUM = 26;
//特定题目需要
const int mod = 20090717;

class ACAutomaton {
private:
//每个节点的儿子,即当前节点的状态转移
int chd[MAX_NODE][CHILD_NUM];
//记录题目给的关键数据
int val[MAX_NODE];
//传说中的fail指针
int fail[MAX_NODE];
//队列,用于广度优先计算fail指针
int Q[MAX_NODE];
//字母对应的ID
int ID[128];
//已使用节点个数
int sz;
//特定题目需要
int dp[2][MAX_NODE][1<<10];
public:
//初始化,计算字母对应的儿子ID,如:'a'->0 ... 'z'->25
void Initialize() {
fail[0] = 0;
for (int i = 0 ; i < CHILD_NUM ; i ++) {
ID[i+'a'] = i;
}
}
//重新建树需先Reset
void Reset() {
memset(chd[0] , 0 , sizeof(chd[0]));
sz = 1;
}
//将权值为key的字符串a插入到trie中
void Insert(char *a,int key) {
int p = 0;
for ( ; *a ; a ++) {
int c = ID[*a];
if (!chd[p][c]) {
memset(chd[sz] , 0 , sizeof(chd[sz]));
val[sz] = 0;
chd[p][c] = sz ++;
}
p = chd[p][c];
}
val[p] = key;
}
//建立AC自动机,确定每个节点的权值以及状态转移
void Construct() {
int *s = Q , *e = Q;
for (int i = 0 ; i < CHILD_NUM ; i ++) {
if (chd[0][i]) {
fail[ chd[0][i] ] = 0;
*e ++ = chd[0][i];
}
}
while (s != e) { /*广度优先。 关键*/
int u = *s++;
for (int i = 0 ; i < CHILD_NUM ; i ++) {
int &v = chd[u][i];
if (v) {
*e ++ = v;
fail[v] = chd[ fail[u] ][i];
//以下一行代码要根据题目所给val的含义来写
val[v] |= val[ fail[v] ];
} else {
v = chd[ fail[u] ][i];
}
}
}
}
//解题,特定题目需要
int Work(int n,int m,int k) {
memset(dp[0] , 0 , sizeof(dp[0]));
dp[0][0][0] = 1;
int S = 0;
while (n --) {
int T = 1 - S;
memset(dp[T] , 0 , sizeof(dp[T]));
for (int i = 0 ; i < sz ; i ++) {
for (int j = 0 ; j < m ; j ++) {
if (dp[S][i][j]) {
for (int k = 0 ; k < CHILD_NUM ; k ++) {
int p = chd[i][k];
int st = (j | val[p]);
dp[T][p][st] += dp[S][i][j];
if (dp[T][p][st] >= mod) {
dp[T][p][st] -= mod;
}
}
}
}
}
S = T;
}
int ret = 0;
for (int j = 0 ; j < m; j ++) {
int cnt = 0;
int a = j;
for ( ; a ; cnt += (a&1) , a >>= 1);
if (cnt < k) continue;
for (int i = 0 ; i < sz ; i ++) {
ret += dp[S][i][j];
if (ret >= mod) {
ret -= mod;
}
}
}
return ret;
}
}AC;

int main() {
AC.Initialize();
int n , m , k;
while (~scanf("%d%d%d",&n,&m,&k)) {
if (n == 0 && m == 0 && k == 0) break;
AC.Reset();
for (int i = 0 ; i < m ; i ++) {
char temp[11];
scanf("%s",temp);
AC.Insert(temp , 1 << i);
}
AC.Construct();
printf("%d\n",AC.Work(n , 1 << m , k));
}
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: