您的位置:首页 > 其它

kuangbin 专题十七 POJ2778(经典好题) AC自动机+矩阵快速幂

2018-01-26 10:52 281 查看
题意:

给出患病的DNA序列,问序列长度为n的,且不包含患病的DNA序列有多少种。

题解:

这道题我是看别人做出来的,怎么说呢,开拓了视野,也让我知道AC自动还能这样操作,也让我更深入了解了矩阵的强大。

比如A(i,j)表示的是i->j,如果A*A表示的就是i到j要走两步。具体怎么回事可以看看这位博主:

http://blog.csdn.net/wt_cnyali/article/details/69803030

然后听说这道题是Matrix67大神的十大经典矩阵的例题8,有兴趣的朋友可以去看看:

www.matrix67.com/blog/archives/276

还有就是可以看看这位博主的画图和解释:http://blog.csdn.net/morgan_xww/article/details/7834801

做这道题的话要将AC自动机的状态图抽象成点与点之间连接的有向图。所以这道题与普通的AC自动机找fail指针是有点区别的,比如如果你的fail指针指向的地方是病毒序列那么就说明你当前已经匹配的字符串肯定已经带有病毒序列了,所以肯定也要标记为病毒序列,就好像C为病毒序列,你A不是病毒序列,但是你A匹配了C的话就变成AC,而C是病毒序列,就相当AC变成了病毒序列,需要标记。然后还有另外一步关键的点就是假如你temp没有儿子节点的话就要补充完整,一个图不能缺少点的信息,所以就要连接temp->fail指向的next[i]了,如果连失配指针都没有的话就直接连接root得了,最关键的两个点说了,再看回去看看我最后发的那个博主的图你们应该能看明白了。然后就是建立矩阵,再矩阵快速幂的事情了,做矩阵快速幂最好开LL,因为听说这道题炸int。查看i与j是否为病毒序列,如果两个都不是的话,就连接上两个节点,那么整张图就建立成功了。

#include<stdio.h>
#include<string.h>
#include<queue>
#include<algorithm>
using namespace std;
#define LL long long int
const int mod=100000;
struct Trie
{
bool flag;
int id;
Trie *fail;
Trie *next[4];
Trie(){
id=0;
flag=false;
fail=0;
for(int i=0;i<4;i++)
next[i]=0;
}
}*root;
struct node
{
LL m[105][105];
node(){
memset(m,0,sizeof(m));
}
};
Trie *dfn[105];//存放Trie树的节点地址。
int tot;//tot一开始等于1是因为root的id为0.
int check(char c)
{
if(c=='A') return 0;
else if(c=='G') return 1;
else if(c=='T') return 2;
else return 3;
}
void insert(char *s)
{
Trie *r=root;
for(int i=0;s[i];i++)
{
int x=check(s[i]);
if(r->next[x]==0)
{
r->next[x]=new(Trie);
r=r->next[x];
r->id=tot;
dfn[tot++]=r;
}
else
r=r->next[x];
}
r->flag=true;
}
void getfail()//这里要改点东西
{
queue<Trie *>q;
q.push(root);
Trie *p;
Trie *temp;
while(!q.empty())
{
temp=q.front();
q.pop();
for(int i=0;i<4;i++)
{
if(temp->next[i])
{
if(temp==root)
{
temp->next[i]->fail=root;
}
else
{
p=temp->fail;
while(p)
{
if(p->next[i])
{
temp->next[i]->fail=p->next[i];
break;
}
p=p->fail;
}
if(p==0)
temp->next[i]->fail=root;
}
if(temp->next[i]->fail->flag)//儿子是危险串时,自己也应该为危险串,就相当于C是危险字符串,AC中A不是危险的,但是匹配了C成为了危险的。
temp->next[i]->flag=true;
q.push(temp->next[i]);
}
else//这一步也是关键,相当于把空的节点补充完整,使每个子串都有儿子
{
if(temp->fail) temp->next[i]=temp->fail->next[i];
else temp->next[i]=root;
}
}
}
}
node getMatrix()
{
node A;
for(int i=0;i<tot;i++)
{
for(int j=0;j<4;j++)
if(!dfn[i]->flag&&!dfn[i]->next[j]->flag){
A.m[dfn[i]->id][dfn[i]->next[j]->id]++;
A.m[dfn[i]->id][dfn[i]->next[j]->id]%=mod;
}
}
return A;
}
node cla(node A,node B)
{
node C;
for(int i=0;i<tot;i++)
for(int j=0;j<tot;j++)
for(int k=0;k<tot;k++)
if(A.m[i][k]&&B.m[k][j])
{
C.m[i][j]+=A.m[i][k]*B.m[k][j];
C.m[i][j]%=mod;
//              printf("%d %d %d\n",C.m[i][j],A.m[i][k],B.m[k][j]);
}
return C;
}
LL POW(node A,int k)
{
node C;
for(int i=0;i<tot;i++) C.m[i][i]=1;
while(k)
{
if(k&1) C=cla(C,A);
A=cla(A,A);
k>>=1;
}
LL ans=0;
for(int i=0;i<tot;i++)
ans=(ans+C.m[0][i])%mod;
return ans;
}
int main()
{
int n,m;
while(~scanf("%d%d",&n,&m))
{
root=new(Trie);
tot=0;
dfn[tot++]=root;
char s[17];
for(int i=0;i<n;i++)
{
scanf("%s",s);
insert(s);
}
getfail();
node A=getMatrix();
//      for(int i=0;i<tot;i++)
//      {
//          for(int j=0;j<tot;j++)
//          printf("%d ",A.m[i][j]);
//          printf("\n");
//      }
LL ans=POW(A,m);
printf("%d\n",ans);
}
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: