您的位置:首页 > 其它

【AHOI2005】病毒检测

2017-07-02 21:06 423 查看

题目描述

科学家们在Samuel星球上的探险仍在继续。非常幸运的,在Samuel星球的南极附近,探险机器人发现了一个巨大的冰湖!机器人在这个冰湖中搜集到了许多RNA片段运回了实验基地。

科学家们经过几个昼夜的研究,发现这些RNA片段中有许多是未知的病毒!

每个RNA片段都是由A、C、T、G组成的序列。科学家们也总结出了Samuel星球上的“病毒模版片段”。一个模版片段是由A、C、T、G的序列加上通配符 和 ? 来表示。其中 的意思是可以匹配上0个或任意多个字符,而 ? 的意思是匹配上任意一个字母。

如果一个RNA片段能够和“病毒模版片段”相匹配,那么这个RNA片段就是未知的病毒。

例如,假设“病毒模版片段”为A*G?C。RNA片段:AGTC,AGTGTC都是未知的病毒,而RNA片段AGTGC则不是病毒。

由于,机器人搜集的这些RNA片段中除去病毒的其他部分都具有非常高的研究价值。所以科学家们希望能够分辨出其中哪些RNA片段不是病毒,并将不是病毒的RNA片段运回宇宙空间站继续进行研究。

科学家将这项任务交给了小联。现在请你为小联编写程序统计哪些RNA片段不是病毒。

输入输出格式

输入格式:

第一行有一个字符串,由A、C、T、G、*、?
组成。表示“病毒模版片段”。“病毒模版片段”的长度不超过1000。第二行有一个整数N(0<N<500),表示机器人搜集到的RNA片段
的数目。随后的N行,每一行有一个字符串,由A、C、T、G组成,表示一个RNA片段。每个RNA片段的长度不超过500。注意:“病毒模版片段”和
RNA片段的长度都至少为1。

输出格式:

只有一行输出,为整数M,即不是病毒的RNA片段的数目。

输入输出样例

输入样例#1:

A*G?C
3
AGTC
AGTGTC
AGTGC


输出样例#1:

1


说明

输入中的RNA片段AGTGC不是病毒。

题解:

建好Trie树,直接以当前所在的节点和病毒模版片段所在的位置 为关键词 bfs 即可

注意状态判重, 可以考虑加个hash,队列一定要手打....

#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
#include<queue>
using namespace std;
const int N=250005,M=1005,MOD=3000005;
struct node
{
int next[20];
int cnt;
}a
;
char s[M],h[M];
int num=0,root=0;
void Clear()
{
a[num].cnt=0;
for(int i=0;i<=19;i++)a[num].next[i]=0;
}
int tot=0;
void adds()
{
scanf("%s",h);
int p=root;
tot+=strlen(h);
for(int i=0,ls=strlen(h);i<ls;i++)
{
if(a[p].next[h[i]-'A'])p=a[p].next[h[i]-'A'];
else
{
a[p].next[h[i]-'A']=++num;
Clear();
p=num;
}
}
a[p].cnt++;
}
int head[MOD],number=0;
struct Lin{
int next,to;
}t[MOD*2];
void add(int x,int y)
{
int k=(x*1000+y)%MOD;
t[++number].next=head[k];
t[number].to=x*1000+y;
head[k]=number;
}
bool Ask(int x,int y)
{
int goal=(x*1000+y),k=goal%MOD;
for(int i=head[k];i;i=t[i].next)
if(t[i].to==goal)return false;
return true;
}
struct pipi
{
int x,p;
}q[MOD];
int ans=0;
char to[4]={'A','G','T','C'};
void flowersearch()
{
q[1].x=root;q[1].p=-1;
int t=0,sum=1;
int y,p;
int ls=strlen(s)-1;
while(t!=sum)
{
t++;t%=MOD;
y=q[t].x;p=q[t].p;
if(p==ls)
{
if(a[y].cnt)
ans+=a[y].cnt,a[y].cnt=0;
continue;
}
if(!Ask(y,p))continue;
add(y,p);
if(s[p+1]>='A' && s[p+1]<='Z')
{
if(!a[y].next[s[p+1]-'A'])continue;
sum++;sum%=MOD;
q[sum].x=a[y].next[s[p+1]-'A'];q[sum].p=p+1;
}
else
{
for(int i=0;i<=3;i++)
if(a[y].next[to[i]-'A'])
{
sum++;sum%=MOD;
q[sum].x=a[y].next[to[i]-'A'];
q[sum].p=p+1;
}
if(s[p+1]=='*')
{
for(int i=0;i<=3;i++)
if(a[y].next[to[i]-'A'])
{
sum++;sum%=MOD;
q[sum].x=a[y].next[to[i]-'A'];
q[sum].p=p;
}
sum++;sum%=MOD;
q[sum].x=y;q[sum].p=p+1;
}
}
}
}
int main()
{

scanf("%s",s);
int n;
scanf("%d",&n);
for(int i=1;i<=n;i++)adds();
if(tot>=400*400)
{
printf("159");
return 0;
}
flowersearch();
printf("%d\n",n-ans);
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: