您的位置：首页 > 其它

图论--拓扑排序及其应用

2014-11-06 10:29 281 查看

在工程实践中,一个工程项目往往由若干个子项⽬目组成。这些子项目间往往有两种关系:
1 先后关系,即必须在某个项⽬完成后才能开始实施另一个子项目;
2 子项⽬目间无关系,即两个子项目可以同时进行,互不影响。
工厂里产品的生产线上,一个产品由若干个零部件组成。零部件生产时,也存在这两种关系:先后关系,即一个部件必须在完成后才能生产另一个部件;部件间无先后关系,即这两个部件可以同时生产。
大学里某个专业的课程学习,有些课程是基础课,它们可独立于其他课程,即无前导课程;有些课程必须在某些基础看成是一个个顶点,课程的学习分别构成一个有向图,现在要从这些有向图上分别找出的实施,产品的生产,课程的学习分别构成一个有向图,现在要从这些有向图上分别找出一个施工流程图、产品生产流程图、课程学习流程图,以便顺利进行施工、产品生产和课程学习,解决这个问题可以采用拓扑
排序的方法。设G=(V,E)是一个具有n个顶点的有向图,V中顶点的序列V1,V2,Vn称为⼀拓扑序列,当且仅当该顶点序列满⾜足下列条件:若在有向图G中,从顶点Vi到是j有一条路径,则在序列中顶点必须排在顶点V之前。找一个有向图的一个拓扑序列的过程称为拓扑排序。
假定计算机软件专业的课程之间存在下述关系:

课程代号课程名称前导课程
C1 ⾼高等数学无
C2 程序设计语⾔言无
C3 数据结构 C2 
C4 编译原理 C2,C3 
C5 操作系统 C3,C6 
C6 计算机组成原理 C7
 C7 普通物理 C1
课程之间的先后关系可⽤用有向图表⽰示,如图所示。

对这个有向图进⾏行拓扑排序可得到⼀一个拓扑序列:C1,C2,C7,C6,C3,C4,C5。也可得到另⼀一个拓扑序列C1, C7,C2,C3,C6,C4,C5。学⽣生按照任何⼀一个拓扑序列都可以顺利地进⾏行课程学习。下⾯面给出有向图拓扑排序算法的基本步骤:
1 从图中选择⼀一个⼊入度为0的顶点,输出该顶点;
2 从图中删除该顶点及其相关联的弧;
3 重复执⾏行1、2直到所有顶点均被输出,拓扑排序完成或者图中再也没有⼊入度为0的顶点(此种情况说明原有向图含有环)。可以证明,任何一个无环有向图,其全部顶点都可以排成一个拓扑序列。而且其拓扑序列不一定是唯一的。下⾯以下图为例说明拓扑排序过程。

(a)邻接表 (b)有向图

首先C1、C4的入度都为0,选C1,删除C1及其边e1、e2,调整C2的⼊入度为0,C3的⼊入度为1,此时C2、C4的⼊入度为0 ,选C4,删除C4及边e3、e4,调整C3、C5的⼊入度为0,从C2、C5、C3中选C2,删除C2及边e,调整C6的⼊入度为2,从C3 、C5中选择C3,删除C3及边e6,调整C6的⼊入度为1,删除C5及边e7,调整C6的⼊入度为0,输出C6,⾄至此拓扑排完成,拓扑序列为C1,C4,C2,C3,C5,C6。
这里拓扑排序给出两种方法：
1：以邻接表作存储结构,给出拓扑排序的实现。算法设置一个队列（方便使用优先队列，输出相同条件下结点编号小的在前（后）的序列）,将所有⼊入度为0的顶点入该队。找入度为0的顶点,只要从依次出队即可。删除边的操作转化为将为该顶点为弧尾,所有相应弧头的入度减1。
2：类似于dfs 用一个栈来存排序后的顺序，从一个顶点开始访问，依次访问它的邻接顶点，回溯的时候将当前结点压入栈（度为0的顶点一定是最后压入栈的）
下面以poj 2376为例

输入n 表示n个结点；

从第一个结点开始依次输入该结点的邻接结点，输入0表示改结点的邻接结点结束，开始输入下一个结点的邻接结点。

#include <iostream>
#include <stdio.h>
#include <queue>
#include <stack>
#include <string.h>
using namespace std;
struct node
{
int v;
int next;
}e[505];
int head[505];  //邻接表头
int indegree[505],n,m; //顶点入度统计数组
bool vis[505];
stack<int>s;
void topologicalSort1()
{
queue<int>q;
for (int i=1; i<=n; i++)
{
if(indegree[i]==0)
{
q.push(i);
}
}
bool flag=false;
while (!q.empty())
{
int t;
t=q.front();
q.pop();
if(flag)
{
printf(" %d",t);
}
else

{
printf("%d",t);
flag=true;
}

for (int i=head[t]; i!=-1; i=e[i].next)
{
indegree[e[i].v]--;
if(indegree[e[i].v]==0)
{
q.push(e[i].v);
}
}
}
printf("\n");

}
void dfs(int u)
{
vis[u]=true;
for (int i=head[u]; i!=-1; i=e[i].next)  //尝试访问结点u的邻接结点
{
if(!vis[e[i].v])
{
dfs(e[i].v);
}
}
s.push(u);  //在递归出口加入此结点
}
void topologicalSort2()
{
memset(vis, false, sizeof(vis));
while (!s.empty())
{
s.pop();
}
for (int i=1; i<=n; i++)  //尝试访问每一个结点
{
if(!vis[i])
{
dfs(i);
}
}
int ans=1;
while (!s.empty())  //输出序列
{
if(ans<n)
{
printf("%d ",s.top());
}
else
{
printf("%d\n",s.top());
}
s.pop();
}
}
int main()
{
while (scanf("%d",&n)!=EOF)
{

memset(indegree, 0, sizeof(indegree));
memset(head, -1, sizeof(head));
int v;
int cnt=0;

for (int i=1; i<=n; i++)
{
while (scanf("%d",&v) && v)
{
//创建邻接表
e[cnt].v=v;
e[cnt].next=head[i];
head[i]=cnt++;
indegree[v]++;
}
}
topologicalSort2();
}
return 0;
}

如果只是判断环是否存在那就更简单了，用dfs或者并查集都可以

//拓扑排序判环
#include <iostream>
#include <queue>
#include <string.h>
using namespace std;
#define MAX 100001
int head[MAX];  // 表示头指针，初始化为-1
int p[5*MAX];   // 表示指向的节点
int Next[5*MAX]; // 模拟指针，初始化为0
int n,m,u,v;
int vis[MAX];   //记录遍历的状态
bool flag;
bool dfs(int u)
{
vis[u]=-1;  //正在访问，在递归栈中
for (int i=head[u]; i!=-1 && !flag; i=Next[i])
{
v=p[i];
if (vis[v]==-1)
{
flag=true;
return flag;
}
if (vis[v]==0) //没有访问过
{
vis[v]=-1;
dfs(v);
}
vis[v]=1; //访问结束
}
vis[u]=1;
return flag;
}
int main()
{
int t,cnt;
scanf("%d",&t);
while (t--)
{
cnt=0;
memset(head, -1, sizeof(head));
memset(vis, 0, sizeof(vis));
flag=false;
scanf("%d%d",&n,&m);
for (int i=0; i<m; i++)
{
scanf("%d%d",&u,&v);
p[cnt]=v;
Next[cnt]=head[u];
head[u]=cnt++;
}

for (int i=1; i<=n && !flag; i++) //遍历所有的点
{
if (vis[i]==0)
{
dfs(i);
}
}
if (!flag)
printf("Correct\n");
else
printf("Wrong\n");
}
return 0;
}

应用：

描述

小Hi和小Ho所在学校的校园网被黑客入侵并投放了病毒。这事在校内BBS上立刻引起了大家的讨论，当然小Hi和小Ho也参与到了其中。从大家各自了解的情况中，小Hi和小Ho整理得到了以下的信息：

校园网主干是由N个节点(编号1..N)组成，这些节点之间有一些单向的网路连接。若存在一条网路连接(u,v)链接了节点u和节点v，则节点u可以向节点v发送信息，但是节点v不能通过该链接向节点u发送信息。
在刚感染病毒时，校园网立刻切断了一些网络链接，恰好使得剩下网络连接不存在环，避免了节点被反复感染。也就是说从节点i扩散出的病毒，一定不会再回到节点i。
当1个病毒感染了节点后，它并不会检查这个节点是否被感染，而是直接将自身的拷贝向所有邻居节点发送，它自身则会留在当前节点。所以一个节点有可能存在多个病毒。
现在已经知道黑客在一开始在K个节点上分别投放了一个病毒。

举个例子，假设切断部分网络连接后学校网络如下图所示，由4个节点和4条链接构成。最开始只有节点1上有病毒。

最开始节点1向节点2和节点3传送了病毒，自身留有1个病毒：

其中一个病毒到达节点2后，向节点3传送了一个病毒。另一个到达节点3的病毒向节点4发送自己的拷贝：

当从节点2传送到节点3的病毒到达之后，该病毒又发送了一份自己的拷贝向节点4。此时节点3上留有2个病毒：

最后每个节点上的病毒为：

小Hi和小Ho根据目前的情况发现一段时间之后，所有的节点病毒数量一定不会再发生变化。那么对于整个网络来说，最后会有多少个病毒呢？

输入

第1行：3个整数N,M,K，1≤K≤N≤100,000，1≤M≤500,000
第2行：K个整数A[i]，A[i]表示黑客在节点A[i]上放了1个病毒。1≤A[i]≤N
第3..M+2行：每行2个整数 u,v，表示存在一条从节点u到节点v的网络链接。数据保证为无环图。1≤u,v≤N

输出

第1行：1个整数，表示最后整个网络的病毒数量 MOD 142857

样例输入

样例输出

小Hi：对于这个问题小Ho你有什么想法么？

小Ho：有，对于一个病毒来说它总会传递到一个没有邻居的节点，那我直接使用dfs模拟整个过程不就能够得到结果了吗？

小Hi：小Ho你真聪明，立刻就看穿了这个问题的本质。

小Ho：那当然啦。<得意>

小Hi：那么小Ho，我这里有这样一个网络：

这里一共有n个节点，对于节点i，它总是连接着节点i+1和节点i+2。一开始只有节点1被感染，你算算最后n个节点一共有多少个病毒？

小Ho：很显然，节点1最后只有1个病毒；节点2也只有1个病毒；节点3会接受从节点1和节点2过来的病毒，所以有2个病毒；后面依次是节点4有3个病毒，节点5有5个病毒…它们好像刚好是费波拉契数列？

小Hi：你说的没错。对于这个网络，编号为i的节点最后感染的病毒数量就是斐波拉契数列的第i项。而斐波拉契数列的增长是很惊人的，当i到达一定值时，其电脑感染的病毒数量就会很大了。

小Ho：那这又有什么关系呢？反正能得到解不是么？

小Hi：能得到解那是当然了，但是你有想过需要花费多少时间么？在你的dfs算法中，每一次进入函数就等于模拟一个病毒进入电脑。如果最后结果有10亿个病毒，那么你就需要执行10亿次函数，假设电脑每秒钟可以执行1亿次函数，那么你的dfs就需要运行10秒。如果结果有100亿，1000亿呢？

小Ho：运行时间上好像是有问题，那我应该如何解决时间的问题呢？

小Hi：其实也很简单啦。你再想想，在我们最后得到结果上每各节点病毒数量有什么关系么？

小Ho：嗯<思考>…我发现了！对于节点i来说，它最后的病毒数好像总是等于所有能够达到它的节点病毒数之和。就用你提到的那个斐波拉契数列来说，能够达到节点i的节点是节点i-1和节点i-2，所以节点i的病毒数是节点i-1和节点i-2的病毒数之和。这刚好就是斐波拉契数列的递推公式嘛！

小Hi：对，正是这样。对于一个节点i来说，如果我们能够先计算出它所有前驱节点的病毒数量，就可以直接推算出它最后的病毒数量了。

小Ho：但是怎么来计算所有前驱节点呢？

小Hi：这就要从图的性质入手了。我们现在的网络是没有环的，对于任意一个节点i，当它将自己所有的病毒都传送出去之后，它自身的病毒数量就不会改变了。那么我们不妨从没有前驱节点，也就是入度为0的节点开始考虑。

对于这些节点，它并不会再增加病毒数量。那么我们就根据它所关联的连接将病毒分发出去，然后这个节点就没有作用了。那不妨就删掉好了，它所关联的边也删掉。

这样图中又会产生一些新的没有入度的节点。这样一直删点，直到所有的点都被删掉，将所有点的病毒数量加起来不就是总的病毒数么？

我们不妨来看个例子，这里给定一个网络：

最开始只有节点1是入度为0的点，所以将它的病毒传送，然后删掉节点1：

此时节点2成为了入度为0的点，同样将其删掉：

此时节点3为入度为0的点，同样操作：

最后只剩下节点4，因为它并没有后续节点，所以病毒感染的过程也就结束了。

小Ho：这不就是拓扑排序么！因为拓扑排序可以在O(n+m)的时间解决，整个问题的时间也减少到了O(n+m)，那么再多的节点数都不怕了！

小Hi：没错，这样我们就完美地解决了这个问题。你能实现它么？

小Ho：没问题，就交给我吧！<自信>
说得很明白了吧

#include <iostream>
#include <queue>
#include <string.h>
using namespace std;
#define MAX 100001
int head[MAX];  // 表示头指针，初始化为-1
int p[5*MAX];   // 表示指向的节点
int Next[5*MAX];  // 模拟指针，初始化为0
int inDeg[MAX]; //各节点的入度
int ans[MAX];
int n,m,u,v;
void topoSort()
{
queue<int>q;
for (int i=1; i<=n; i++)
{
if (inDeg[i]==0)
{
q.push(i);
}
}
while (!q.empty())
{
u=q.front();
q.pop();
for (int i=head[u]; i!=-1; i=Next[i])
{
v=p[i];
inDeg[v]--;
ans[v]+=ans[u];  //这里
ans[v]%=142857;
if (inDeg[v]==0)
{
q.push(v);
}
}

}
}
int main()
{
int cnt,k;

cnt=0;

scanf("%d%d%d",&n,&m,&k);
for (int i=0;i<=n; i++)  //初始化
{
head[i]=-1;
inDeg[i]=0;
ans[i]=0;
}
int x;
for (int i=0; i<k; i++)
{
scanf("%d",&x);
ans[x]=1;
}
for (int i=0; i<m; i++)
{
scanf("%d%d",&u,&v);
//添加边的信息
p[cnt]=v;
Next[cnt]=head[u];
head[u]=cnt++;
inDeg[v]++;
}
topoSort();
int ans1=0;
for (int i=1; i<=n; i++)
{
ans1=(ans1+ans[i])%142857;
}
printf("%d\n",ans1);
return 0;
}

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航