AC自动机模板 LA4670
2014-08-23 19:24
351 查看
////ac自动机 适合模板多,长度短,文本字符串又很长
算法实质上是在一棵字典树上进行kmp状态转移,比起把每个模板串分别在文本串上匹配,只需要把字典树整体在文本上匹配即可。
出现次数最多的子串
n个小写字母组成的字符串和一个文本串T,要求找出哪些字符串在文本中出现的次数最多。 输出出现次数最多的字符串以及它的次数。
算法实质上是在一棵字典树上进行kmp状态转移,比起把每个模板串分别在文本串上匹配,只需要把字典树整体在文本上匹配即可。
出现次数最多的子串
n个小写字母组成的字符串和一个文本串T,要求找出哪些字符串在文本中出现的次数最多。 输出出现次数最多的字符串以及它的次数。
// LA4670 Dominating Patterns // Rujia Liu #include<cstring> #include<queue> #include<cstdio> #include<map> #include<string> using namespace std; const int SIGMA_SIZE = 26; const int MAXNODE = 11000; const int MAXS = 150 + 10; map<string,int> ms; struct AhoCorasickAutomata { int ch[MAXNODE][SIGMA_SIZE]; int f[MAXNODE]; // fail函数 int val[MAXNODE]; // 每个字符串的结尾结点都有一个非0的val int last[MAXNODE]; // 输出链表的下一个结点 int cnt[MAXS]; int sz; void init() { sz = 1; memset(ch[0], 0, sizeof(ch[0])); memset(cnt, 0, sizeof(cnt)); ms.clear(); } // 字符c的编号 int idx(char c) { return c-'a'; } // 插入字符串。v必须非0 void insert(char *s, int v) { int u = 0, n = strlen(s); for(int i = 0; i < n; i++) { int c = idx(s[i]); if(!ch[u][c]) { memset(ch[sz], 0, sizeof(ch[sz])); val[sz] = 0; ch[u][c] = sz++; } u = ch[u][c]; } val[u] = v; ms[string(s)] = v; } // 递归打印以结点j结尾的所有字符串 void print(int j) { if(j) { cnt[val[j]]++; print(last[j]); } } // 在T中找模板 int find(char* T) { int n = strlen(T); int j = 0; // 当前结点编号,初始为根结点 for(int i = 0; i < n; i++) { // 文本串当前指针 int c = idx(T[i]); while(j && !ch[j][c]) j = f[j]; // 顺着细边走,直到可以匹配 j = ch[j][c]; if(val[j]) print(j); else if(last[j]) print(last[j]); // 找到了! } } // 计算fail函数 void getFail() { queue<int> q; f[0] = 0; // 初始化队列 for(int c = 0; c < SIGMA_SIZE; c++) { int u = ch[0][c]; if(u) { f[u] = 0; q.push(u); last[u] = 0; } } // 按BFS顺序计算fail while(!q.empty()) { int r = q.front(); q.pop(); for(int c = 0; c < SIGMA_SIZE; c++) { int u = ch[r][c]; if(!u) continue; q.push(u); int v = f[r]; while(v && !ch[v][c]) v = f[v]; f[u] = ch[v][c]; last[u] = val[f[u]] ? f[u] : last[f[u]]; } } } }; AhoCorasickAutomata ac; char text[1000001], P[151][80]; int n, T; int main() { while(scanf("%d", &n) == 1 && n) { ac.init(); for(int i = 1; i <= n; i++) { scanf("%s", P[i]); ac.insert(P[i], i); } ac.getFail(); scanf("%s", text); ac.find(text); int best = -1; for(int i = 1; i <= n; i++) if(ac.cnt[i] > best) best = ac.cnt[i]; printf("%d\n", best); for(int i = 1; i <= n; i++) if(ac.cnt[ms[string(P[i])]] == best) printf("%s\n", P[i]); } return 0; }
相关文章推荐
- AC自动机模板 LA4670 Dominating Patterns 出现次数最多的字串 BNUOJ11552 UVA1449
- HDU2222(AC自动机模板题)
- 【模板】AC自动机
- HDU 2222 Keywords Search(AC自动机模板题)
- 模板_AC自动机
- HDU 3065 (AC自动机模板题)
- LA4670 Dominating Patterns(AC自动机)
- AC 自动机(模板)
- HDU 2222 Keywords Search (AC自动机模板题)
- HDU 5384 Danganronpa (AC自动机模板题)
- hdu:2222:Keywords Search(AC自动机模板题)
- HDU 2222 Keywords Search (AC自动机入门 模板)
- hdu 5384 Danganronpa(AC自动机模板题)
- (AC自动机)模板
- hdu 2222 Keywords Search(AC自动机模板题)
- UVALive 4670 Dominating Patterns(AC自动机模板题)
- 邝斌的ACM模板(AC 自动机)
- AC自动机模板,可重新build
- AC自动机模板
- 关键词匹配(Ac自动机模板题)