您的位置:首页 > 其它

hdu 2896 AC自动机 保存编号

2015-08-14 21:19 281 查看
题意:

天朝语题。

[align=left]Input[/align]
第一行,一个整数N(1<=N<=500),表示病毒特征码的个数。

接下来N行,每行表示一个病毒特征码,特征码字符串长度在20—200之间。

每个病毒都有一个编号,依此为1—N。

不同编号的病毒特征码不会相同。

在这之后一行,有一个整数M(1<=M<=1000),表示网站数。

接下来M行,每行表示一个网站源码,源码字符串长度在7000—10000之间。

每个网站都有一个编号,依此为1—M。

以上字符串中字符都是ASCII码可见字符(不包括回车)。

[align=left]Output[/align]
依次按如下格式输出按网站编号从小到大输出,带病毒的网站编号和包含病毒编号,每行一个含毒网站信息。

web 网站编号: 病毒编号 病毒编号 …

冒号后有一个空格,病毒编号按从小到大排列,两个病毒编号之间用一个空格隔开,如果一个网站包含病毒,病毒数不会超过3个。

最后一行输出统计信息,如下格式

total: 带病毒网站数

冒号后有一个空格。

解析:

首先,用end[i]表示以id结尾的病毒。

然后我本来用vector来保存病毒的,TLE了。

string也会TLE。

然后直接用str[i]来当作下标,否则RE。

坐标要开到128。

next end fail 数组不能开太小,否则MLE。 - - MLE。

然后最后结果还要排个序的,不然wa。

代码:

#pragma comment(linker, "/STACK:1677721600")
#include <map>
#include <set>
#include <cmath>
#include <queue>
#include <stack>
#include <vector>
#include <cstdio>
#include <cstdlib>
#include <cstring>
#include <climits>
#include <cassert>
#include <iostream>
#include <algorithm>
#define pb push_back
#define mp make_pair
#define LL long long
#define lson lo,mi,rt<<1
#define rson mi+1,hi,rt<<1|1
#define Min(a,b) ((a)<(b)?(a):(b))
#define Max(a,b) ((a)>(b)?(a):(b))
#define mem0(a) memset(a,0,sizeof(a))
#define mem1(a) memset(a,-1,sizeof(a))
#define mem(a,b) memset(a,b,sizeof(a))
#define FIN freopen("in.txt", "r", stdin)
#define FOUT freopen("out.txt", "w", stdout)

using namespace std;
const int mod = 1e9 + 7;
const double eps = 1e-8;
const double ee = exp(1.0);
const int inf = 0x3f3f3f3f;
const int maxn = 500 + 10;
const int maxm = 1000 + 10;
const double pi = acos(-1.0);
const LL iinf = 0x3f3f3f3f3f3f3f3f;

const int dictSize = 128;

//vector<int> web[maxm];
int web[maxm][maxn];
int cnt[maxm];
int webNum;

struct Trie
{
int next[maxn * dictSize][dictSize];   //next[i][j]保存节点i的那个编号为j的节点(小写字母按字典序编号为0-(a),1-(b),2-(c),...)
int fail[maxn * dictSize];             //后缀链接 fail[j]表示节点j沿着失配指针往回走时 遇到的下一个单词节点编号
int end[maxn * dictSize];              ///保存当前病毒编号
int rt;                                //根
int nodeNum;                           //节点个数

void init()
{
nodeNum = 0;
rt = newNode();
}

int newNode()
{
for (int i = 0; i < dictSize; i++)
next[nodeNum][i] = -1;
end[nodeNum++] = 0;
return nodeNum - 1;
}

//将字符串str加入Trie前缀树中
void insert(char str[], int id)
{
int len = strlen(str);
int now = rt;
for (int i = 0; i < len; i++)
{
if (next[now][str[i]] == -1)
{
next[now][str[i]] = newNode();
}
now = next[now][str[i]];
}
end[now] = id;
}

//建立后缀链接
void build()
{
queue<int> q;
fail[rt] = rt;
for (int i = 0; i < dictSize; i++)
{
if (next[rt][i] == -1)
{
next[rt][i] = rt;
}
else
{
fail[next[rt][i]] = rt;
q.push(next[rt][i]);
}
}
while (!q.empty())
{
int now = q.front();
q.pop();
for (int i = 0; i < dictSize; i++)
{
if (next[now][i] == -1)
{
next[now][i] = next[fail[now]][i];
}
else
{
fail[next[now][i]] = next[fail[now]][i];
q.push(next[now][i]);
}
}
}
}

//询问子串们在串str中出现的次数
void query(char str[], int id)
{
int len = strlen(str);
int now = rt;
for (int i = 0; i < len; i++)
{
now = next[now][str[i]];
int temp = now;
while (temp != rt)
{
if (end[temp] != 0)
web[id][cnt[id]++] = end[temp];
temp = fail[temp];
}
}
}

void debug()
{
for (int i = 0; i < nodeNum; i++)
{
printf("id = %3d,fail = %3d,end = %3d,chi = [",i,fail[i],end[i]);
for(int j = 0;j < 26;j++)
printf("%2d",next[i][j]);
printf("]\n");
}
}
} ac;

char str[10000 + 10];

int main()
{
#ifdef LOCAL
FIN;
#endif // LOCAL
int n, m;
while (~scanf("%d", &n))
{
ac.init();
for (int i = 1; i <= n; i++)
{
scanf("%s", str);
ac.insert(str, i);
}
ac.build();

scanf("%d", &m);
mem0(web);
mem0(cnt);
int total = 0;
for (int i = 1; i <= m; i++)
{
scanf("%s", str);
ac.query(str, i);
int sz = cnt[i];
if (sz)
{
total++;
printf("web %d:", i);
sort(web[i], web[i] + sz);
for (int j = 0; j < sz; j++)
{
printf(" %d", web[i][j]);
}
puts("");
}
}
printf("total: %d\n", total);
}
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: