图论--拓扑排序及其应用
2014-11-06 10:29
281 查看
在工程实践中,一个工程项目往往由若干个子项⽬目组成。这些子项目间往往有两种关系:
1 先后关系,即必须在某个项 ⽬完成后才能开始实施另一个子项目;
2 子项⽬目间无关系,即两个子项目可以同时进行,互不影响。
工厂里产品的生 产线上,一个产品由若干个零部件组成。零部件生产时,也存在这两种关系:先后关系,即一个部件必须在完成后才能生 产另一个部件;部件间无先后关系,即这两个部件可以同时生产。
大学里某个专业的课程学习,有些课程是基础课,它们 可独立于其他课程,即无前导课程;有些课程必须在某些基础看成是一个个顶点,课程的学习分别构成一个有向图,现在 要从这些有向图上分别找出的实施,产品的生产,课程的学习分别构成一个有向图,现在要从这些有向图上分别找出一个 施工流程图、产品生产流程图、课程学习流程图,以便顺利进行施工、产品生产和课程学习,解决这个问题可以采用拓扑
排序的方法。 设G=(V,E)是一个具有n个顶点的有向图,V中顶点的序列V1,V2,Vn称为⼀拓扑序列,当且仅当该顶点序列 满⾜足下列条件:若在有向图G中,从顶点Vi到是j有一条路径,则在序列中顶点必须排在顶点V之前。找一个有向图的一个拓扑序列的过程称为拓扑排序。
假定计算机软件专业的课程之间存在下述关系:
课程代号 课程名称 前导课程
C1 ⾼高等数学 无
C2 程序设计语⾔言 无
C3 数据结构 C2
C4 编译原理 C2,C3
C5 操作系统 C3,C6
C6 计算机组成原理 C7
C7 普通物理 C1
课程之间的先后关系可⽤用有向图表⽰示,如图所示。
对这个有向图进⾏行拓扑排序可得到⼀一个拓扑序列:C1,C2,C7,C6,C3,C4,C5。也可得到另⼀一个拓扑序列C1, C7,C2,C3,C6,C4,C5。学⽣生按照任何⼀一个拓扑序列都可以顺利地进⾏行课程学习。下⾯面给出有向图拓扑排序算法的基本步骤:
1 从图中选择⼀一个⼊入度为0的顶点,输出该顶点;
2 从图中删除该顶点及其相关联的弧;
3 重复执⾏行1、2直到所有顶点均被输出,拓扑排序完成或者图中再也没有⼊入度为0的顶点(此种情况说明原有向图含有环)。 可以证明,任何一个无环有向图,其全部顶点都可以排成一个拓扑序列。而且其拓扑序列不一定是唯一的。 下⾯以下图为例说明拓扑排序过程。
(a)邻接表 (b)有向图
首先C1、C4的入度都为0,选C1,删除C1及其边e1、e2,调整C2的⼊入度为0,C3的⼊入度为1,此时C2、C4的⼊入度为0 ,选C4,删除C4及边e3、e4,调整C3、C5的⼊入度为0,从C2、C5、C3中选C2,删除C2及边e,调整C6的⼊入度为2,从C3 、C5中选择C3,删除C3及边e6,调整C6的⼊入度为1,删除C5及边e7,调整C6的⼊入度为0,输出C6,⾄至此拓扑排完成,拓 扑序列为C1,C4,C2,C3,C5,C6。
这里拓扑排序给出两种方法:
1: 以邻接表作存储结构,给出拓扑排序的实现。算法设置一个队列(方便使用优先队列,输出相同条件下结点编号小的在前(后)的序列),将所有⼊入度为0的顶点入该队。找入度为0的 顶点,只要从依次出队即可。删除边的操作转化为将为该顶点为弧尾,所有相应弧头的入度减1。
2:类似于dfs 用一个栈来存排序后的顺序,从一个顶点开始访问,依次访问它的邻接顶点,回溯的时候将当前结点压入栈(度为0的顶点一定是最后压入栈的)
下面以poj 2376为例
输入n 表示n个结点;
从第一个结点开始依次输入该结点的邻接结点,输入0表示改结点的邻接结点结束,开始输入下一个结点的邻接结点。
如果只是判断环是否存在那就更简单了,用dfs或者并查集都可以
应用:
小Hi和小Ho所在学校的校园网被黑客入侵并投放了病毒。这事在校内BBS上立刻引起了大家的讨论,当然小Hi和小Ho也参与到了其中。从大家各自了解的情况中,小Hi和小Ho整理得到了以下的信息:
校园网主干是由N个节点(编号1..N)组成,这些节点之间有一些单向的网路连接。若存在一条网路连接(u,v)链接了节点u和节点v,则节点u可以向节点v发送信息,但是节点v不能通过该链接向节点u发送信息。
在刚感染病毒时,校园网立刻切断了一些网络链接,恰好使得剩下网络连接不存在环,避免了节点被反复感染。也就是说从节点i扩散出的病毒,一定不会再回到节点i。
当1个病毒感染了节点后,它并不会检查这个节点是否被感染,而是直接将自身的拷贝向所有邻居节点发送,它自身则会留在当前节点。所以一个节点有可能存在多个病毒。
现在已经知道黑客在一开始在K个节点上分别投放了一个病毒。
举个例子,假设切断部分网络连接后学校网络如下图所示,由4个节点和4条链接构成。最开始只有节点1上有病毒。
最开始节点1向节点2和节点3传送了病毒,自身留有1个病毒:
其中一个病毒到达节点2后,向节点3传送了一个病毒。另一个到达节点3的病毒向节点4发送自己的拷贝:
当从节点2传送到节点3的病毒到达之后,该病毒又发送了一份自己的拷贝向节点4。此时节点3上留有2个病毒:
最后每个节点上的病毒为:
小Hi和小Ho根据目前的情况发现一段时间之后,所有的节点病毒数量一定不会再发生变化。那么对于整个网络来说,最后会有多少个病毒呢?
第1行:3个整数N,M,K,1≤K≤N≤100,000,1≤M≤500,000
第2行:K个整数A[i],A[i]表示黑客在节点A[i]上放了1个病毒。1≤A[i]≤N
第3..M+2行:每行2个整数 u,v,表示存在一条从节点u到节点v的网络链接。数据保证为无环图。1≤u,v≤N
第1行:1个整数,表示最后整个网络的病毒数量 MOD 142857
样例输入
样例输出
小Hi:对于这个问题小Ho你有什么想法么?
小Ho:有,对于一个病毒来说它总会传递到一个没有邻居的节点,那我直接使用dfs模拟整个过程不就能够得到结果了吗?
小Hi:小Ho你真聪明,立刻就看穿了这个问题的本质。
小Ho:那当然啦。<得意>
小Hi:那么小Ho,我这里有这样一个网络:
这里一共有n个节点,对于节点i,它总是连接着节点i+1和节点i+2。一开始只有节点1被感染,你算算最后n个节点一共有多少个病毒?
小Ho:很显然,节点1最后只有1个病毒;节点2也只有1个病毒;节点3会接受从节点1和节点2过来的病毒,所以有2个病毒;后面依次是节点4有3个病毒,节点5有5个病毒…它们好像刚好是费波拉契数列?
小Hi:你说的没错。对于这个网络,编号为i的节点最后感染的病毒数量就是斐波拉契数列的第i项。而斐波拉契数列的增长是很惊人的,当i到达一定值时,其电脑感染的病毒数量就会很大了。
小Ho:那这又有什么关系呢?反正能得到解不是么?
小Hi:能得到解那是当然了,但是你有想过需要花费多少时间么?在你的dfs算法中,每一次进入函数就等于模拟一个病毒进入电脑。如果最后结果有10亿个病毒,那么你就需要执行10亿次函数,假设电脑每秒钟可以执行1亿次函数,那么你的dfs就需要运行10秒。如果结果有100亿,1000亿呢?
小Ho:运行时间上好像是有问题,那我应该如何解决时间的问题呢?
小Hi:其实也很简单啦。你再想想,在我们最后得到结果上每各节点病毒数量有什么关系么?
小Ho:嗯<思考>…我发现了!对于节点i来说,它最后的病毒数好像总是等于所有能够达到它的节点病毒数之和。就用你提到的那个斐波拉契数列来说,能够达到节点i的节点是节点i-1和节点i-2,所以节点i的病毒数是节点i-1和节点i-2的病毒数之和。这刚好就是斐波拉契数列的递推公式嘛!
小Hi:对,正是这样。对于一个节点i来说,如果我们能够先计算出它所有前驱节点的病毒数量,就可以直接推算出它最后的病毒数量了。
小Ho:但是怎么来计算所有前驱节点呢?
小Hi:这就要从图的性质入手了。我们现在的网络是没有环的,对于任意一个节点i,当它将自己所有的病毒都传送出去之后,它自身的病毒数量就不会改变了。那么我们不妨从没有前驱节点,也就是入度为0的节点开始考虑。
对于这些节点,它并不会再增加病毒数量。那么我们就根据它所关联的连接将病毒分发出去,然后这个节点就没有作用了。那不妨就删掉好了,它所关联的边也删掉。
这样图中又会产生一些新的没有入度的节点。这样一直删点,直到所有的点都被删掉,将所有点的病毒数量加起来不就是总的病毒数么?
我们不妨来看个例子,这里给定一个网络:
最开始只有节点1是入度为0的点,所以将它的病毒传送,然后删掉节点1:
此时节点2成为了入度为0的点,同样将其删掉:
此时节点3为入度为0的点,同样操作:
最后只剩下节点4,因为它并没有后续节点,所以病毒感染的过程也就结束了。
小Ho:这不就是拓扑排序么!因为拓扑排序可以在O(n+m)的时间解决,整个问题的时间也减少到了O(n+m),那么再多的节点数都不怕了!
小Hi:没错,这样我们就完美地解决了这个问题。你能实现它么?
小Ho:没问题,就交给我吧!<自信>
说得很明白了吧
1 先后关系,即必须在某个项 ⽬完成后才能开始实施另一个子项目;
2 子项⽬目间无关系,即两个子项目可以同时进行,互不影响。
工厂里产品的生 产线上,一个产品由若干个零部件组成。零部件生产时,也存在这两种关系:先后关系,即一个部件必须在完成后才能生 产另一个部件;部件间无先后关系,即这两个部件可以同时生产。
大学里某个专业的课程学习,有些课程是基础课,它们 可独立于其他课程,即无前导课程;有些课程必须在某些基础看成是一个个顶点,课程的学习分别构成一个有向图,现在 要从这些有向图上分别找出的实施,产品的生产,课程的学习分别构成一个有向图,现在要从这些有向图上分别找出一个 施工流程图、产品生产流程图、课程学习流程图,以便顺利进行施工、产品生产和课程学习,解决这个问题可以采用拓扑
排序的方法。 设G=(V,E)是一个具有n个顶点的有向图,V中顶点的序列V1,V2,Vn称为⼀拓扑序列,当且仅当该顶点序列 满⾜足下列条件:若在有向图G中,从顶点Vi到是j有一条路径,则在序列中顶点必须排在顶点V之前。找一个有向图的一个拓扑序列的过程称为拓扑排序。
假定计算机软件专业的课程之间存在下述关系:
课程代号 课程名称 前导课程
C1 ⾼高等数学 无
C2 程序设计语⾔言 无
C3 数据结构 C2
C4 编译原理 C2,C3
C5 操作系统 C3,C6
C6 计算机组成原理 C7
C7 普通物理 C1
课程之间的先后关系可⽤用有向图表⽰示,如图所示。
对这个有向图进⾏行拓扑排序可得到⼀一个拓扑序列:C1,C2,C7,C6,C3,C4,C5。也可得到另⼀一个拓扑序列C1, C7,C2,C3,C6,C4,C5。学⽣生按照任何⼀一个拓扑序列都可以顺利地进⾏行课程学习。下⾯面给出有向图拓扑排序算法的基本步骤:
1 从图中选择⼀一个⼊入度为0的顶点,输出该顶点;
2 从图中删除该顶点及其相关联的弧;
3 重复执⾏行1、2直到所有顶点均被输出,拓扑排序完成或者图中再也没有⼊入度为0的顶点(此种情况说明原有向图含有环)。 可以证明,任何一个无环有向图,其全部顶点都可以排成一个拓扑序列。而且其拓扑序列不一定是唯一的。 下⾯以下图为例说明拓扑排序过程。
(a)邻接表 (b)有向图
首先C1、C4的入度都为0,选C1,删除C1及其边e1、e2,调整C2的⼊入度为0,C3的⼊入度为1,此时C2、C4的⼊入度为0 ,选C4,删除C4及边e3、e4,调整C3、C5的⼊入度为0,从C2、C5、C3中选C2,删除C2及边e,调整C6的⼊入度为2,从C3 、C5中选择C3,删除C3及边e6,调整C6的⼊入度为1,删除C5及边e7,调整C6的⼊入度为0,输出C6,⾄至此拓扑排完成,拓 扑序列为C1,C4,C2,C3,C5,C6。
这里拓扑排序给出两种方法:
1: 以邻接表作存储结构,给出拓扑排序的实现。算法设置一个队列(方便使用优先队列,输出相同条件下结点编号小的在前(后)的序列),将所有⼊入度为0的顶点入该队。找入度为0的 顶点,只要从依次出队即可。删除边的操作转化为将为该顶点为弧尾,所有相应弧头的入度减1。
2:类似于dfs 用一个栈来存排序后的顺序,从一个顶点开始访问,依次访问它的邻接顶点,回溯的时候将当前结点压入栈(度为0的顶点一定是最后压入栈的)
下面以poj 2376为例
输入n 表示n个结点;
从第一个结点开始依次输入该结点的邻接结点,输入0表示改结点的邻接结点结束,开始输入下一个结点的邻接结点。
#include <iostream> #include <stdio.h> #include <queue> #include <stack> #include <string.h> using namespace std; struct node { int v; int next; }e[505]; int head[505]; //邻接表头 int indegree[505],n,m; //顶点入度统计数组 bool vis[505]; stack<int>s; void topologicalSort1() { queue<int>q; for (int i=1; i<=n; i++) { if(indegree[i]==0) { q.push(i); } } bool flag=false; while (!q.empty()) { int t; t=q.front(); q.pop(); if(flag) { printf(" %d",t); } else { printf("%d",t); flag=true; } for (int i=head[t]; i!=-1; i=e[i].next) { indegree[e[i].v]--; if(indegree[e[i].v]==0) { q.push(e[i].v); } } } printf("\n"); } void dfs(int u) { vis[u]=true; for (int i=head[u]; i!=-1; i=e[i].next) //尝试访问结点u的邻接结点 { if(!vis[e[i].v]) { dfs(e[i].v); } } s.push(u); //在递归出口加入此结点 } void topologicalSort2() { memset(vis, false, sizeof(vis)); while (!s.empty()) { s.pop(); } for (int i=1; i<=n; i++) //尝试访问每一个结点 { if(!vis[i]) { dfs(i); } } int ans=1; while (!s.empty()) //输出序列 { if(ans<n) { printf("%d ",s.top()); } else { printf("%d\n",s.top()); } s.pop(); } } int main() { while (scanf("%d",&n)!=EOF) { memset(indegree, 0, sizeof(indegree)); memset(head, -1, sizeof(head)); int v; int cnt=0; for (int i=1; i<=n; i++) { while (scanf("%d",&v) && v) { //创建邻接表 e[cnt].v=v; e[cnt].next=head[i]; head[i]=cnt++; indegree[v]++; } } topologicalSort2(); } return 0; }
如果只是判断环是否存在那就更简单了,用dfs或者并查集都可以
//拓扑排序判环 #include <iostream> #include <queue> #include <string.h> using namespace std; #define MAX 100001 int head[MAX]; // 表示头指针,初始化为-1 int p[5*MAX]; // 表示指向的节点 int Next[5*MAX]; // 模拟指针,初始化为0 int n,m,u,v; int vis[MAX]; //记录遍历的状态 bool flag; bool dfs(int u) { vis[u]=-1; //正在访问,在递归栈中 for (int i=head[u]; i!=-1 && !flag; i=Next[i]) { v=p[i]; if (vis[v]==-1) { flag=true; return flag; } if (vis[v]==0) //没有访问过 { vis[v]=-1; dfs(v); } vis[v]=1; //访问结束 } vis[u]=1; return flag; } int main() { int t,cnt; scanf("%d",&t); while (t--) { cnt=0; memset(head, -1, sizeof(head)); memset(vis, 0, sizeof(vis)); flag=false; scanf("%d%d",&n,&m); for (int i=0; i<m; i++) { scanf("%d%d",&u,&v); p[cnt]=v; Next[cnt]=head[u]; head[u]=cnt++; } for (int i=1; i<=n && !flag; i++) //遍历所有的点 { if (vis[i]==0) { dfs(i); } } if (!flag) printf("Correct\n"); else printf("Wrong\n"); } return 0; }
应用:
描述
小Hi和小Ho所在学校的校园网被黑客入侵并投放了病毒。这事在校内BBS上立刻引起了大家的讨论,当然小Hi和小Ho也参与到了其中。从大家各自了解的情况中,小Hi和小Ho整理得到了以下的信息:校园网主干是由N个节点(编号1..N)组成,这些节点之间有一些单向的网路连接。若存在一条网路连接(u,v)链接了节点u和节点v,则节点u可以向节点v发送信息,但是节点v不能通过该链接向节点u发送信息。
在刚感染病毒时,校园网立刻切断了一些网络链接,恰好使得剩下网络连接不存在环,避免了节点被反复感染。也就是说从节点i扩散出的病毒,一定不会再回到节点i。
当1个病毒感染了节点后,它并不会检查这个节点是否被感染,而是直接将自身的拷贝向所有邻居节点发送,它自身则会留在当前节点。所以一个节点有可能存在多个病毒。
现在已经知道黑客在一开始在K个节点上分别投放了一个病毒。
举个例子,假设切断部分网络连接后学校网络如下图所示,由4个节点和4条链接构成。最开始只有节点1上有病毒。
最开始节点1向节点2和节点3传送了病毒,自身留有1个病毒:
其中一个病毒到达节点2后,向节点3传送了一个病毒。另一个到达节点3的病毒向节点4发送自己的拷贝:
当从节点2传送到节点3的病毒到达之后,该病毒又发送了一份自己的拷贝向节点4。此时节点3上留有2个病毒:
最后每个节点上的病毒为:
小Hi和小Ho根据目前的情况发现一段时间之后,所有的节点病毒数量一定不会再发生变化。那么对于整个网络来说,最后会有多少个病毒呢?
输入
第1行:3个整数N,M,K,1≤K≤N≤100,000,1≤M≤500,000第2行:K个整数A[i],A[i]表示黑客在节点A[i]上放了1个病毒。1≤A[i]≤N
第3..M+2行:每行2个整数 u,v,表示存在一条从节点u到节点v的网络链接。数据保证为无环图。1≤u,v≤N
输出
第1行:1个整数,表示最后整个网络的病毒数量 MOD 142857样例输入
4 4 1 1 1 2 1 3 2 3 3 4
样例输出
6
小Hi:对于这个问题小Ho你有什么想法么?
小Ho:有,对于一个病毒来说它总会传递到一个没有邻居的节点,那我直接使用dfs模拟整个过程不就能够得到结果了吗?
小Hi:小Ho你真聪明,立刻就看穿了这个问题的本质。
小Ho:那当然啦。<得意>
小Hi:那么小Ho,我这里有这样一个网络:
这里一共有n个节点,对于节点i,它总是连接着节点i+1和节点i+2。一开始只有节点1被感染,你算算最后n个节点一共有多少个病毒?
小Ho:很显然,节点1最后只有1个病毒;节点2也只有1个病毒;节点3会接受从节点1和节点2过来的病毒,所以有2个病毒;后面依次是节点4有3个病毒,节点5有5个病毒…它们好像刚好是费波拉契数列?
小Hi:你说的没错。对于这个网络,编号为i的节点最后感染的病毒数量就是斐波拉契数列的第i项。而斐波拉契数列的增长是很惊人的,当i到达一定值时,其电脑感染的病毒数量就会很大了。
小Ho:那这又有什么关系呢?反正能得到解不是么?
小Hi:能得到解那是当然了,但是你有想过需要花费多少时间么?在你的dfs算法中,每一次进入函数就等于模拟一个病毒进入电脑。如果最后结果有10亿个病毒,那么你就需要执行10亿次函数,假设电脑每秒钟可以执行1亿次函数,那么你的dfs就需要运行10秒。如果结果有100亿,1000亿呢?
小Ho:运行时间上好像是有问题,那我应该如何解决时间的问题呢?
小Hi:其实也很简单啦。你再想想,在我们最后得到结果上每各节点病毒数量有什么关系么?
小Ho:嗯<思考>…我发现了!对于节点i来说,它最后的病毒数好像总是等于所有能够达到它的节点病毒数之和。就用你提到的那个斐波拉契数列来说,能够达到节点i的节点是节点i-1和节点i-2,所以节点i的病毒数是节点i-1和节点i-2的病毒数之和。这刚好就是斐波拉契数列的递推公式嘛!
小Hi:对,正是这样。对于一个节点i来说,如果我们能够先计算出它所有前驱节点的病毒数量,就可以直接推算出它最后的病毒数量了。
小Ho:但是怎么来计算所有前驱节点呢?
小Hi:这就要从图的性质入手了。我们现在的网络是没有环的,对于任意一个节点i,当它将自己所有的病毒都传送出去之后,它自身的病毒数量就不会改变了。那么我们不妨从没有前驱节点,也就是入度为0的节点开始考虑。
对于这些节点,它并不会再增加病毒数量。那么我们就根据它所关联的连接将病毒分发出去,然后这个节点就没有作用了。那不妨就删掉好了,它所关联的边也删掉。
这样图中又会产生一些新的没有入度的节点。这样一直删点,直到所有的点都被删掉,将所有点的病毒数量加起来不就是总的病毒数么?
我们不妨来看个例子,这里给定一个网络:
最开始只有节点1是入度为0的点,所以将它的病毒传送,然后删掉节点1:
此时节点2成为了入度为0的点,同样将其删掉:
此时节点3为入度为0的点,同样操作:
最后只剩下节点4,因为它并没有后续节点,所以病毒感染的过程也就结束了。
小Ho:这不就是拓扑排序么!因为拓扑排序可以在O(n+m)的时间解决,整个问题的时间也减少到了O(n+m),那么再多的节点数都不怕了!
小Hi:没错,这样我们就完美地解决了这个问题。你能实现它么?
小Ho:没问题,就交给我吧!<自信>
说得很明白了吧
#include <iostream> #include <queue> #include <string.h> using namespace std; #define MAX 100001 int head[MAX]; // 表示头指针,初始化为-1 int p[5*MAX]; // 表示指向的节点 int Next[5*MAX]; // 模拟指针,初始化为0 int inDeg[MAX]; //各节点的入度 int ans[MAX]; int n,m,u,v; void topoSort() { queue<int>q; for (int i=1; i<=n; i++) { if (inDeg[i]==0) { q.push(i); } } while (!q.empty()) { u=q.front(); q.pop(); for (int i=head[u]; i!=-1; i=Next[i]) { v=p[i]; inDeg[v]--; ans[v]+=ans[u]; //这里 ans[v]%=142857; if (inDeg[v]==0) { q.push(v); } } } } int main() { int cnt,k; cnt=0; scanf("%d%d%d",&n,&m,&k); for (int i=0;i<=n; i++) //初始化 { head[i]=-1; inDeg[i]=0; ans[i]=0; } int x; for (int i=0; i<k; i++) { scanf("%d",&x); ans[x]=1; } for (int i=0; i<m; i++) { scanf("%d%d",&u,&v); //添加边的信息 p[cnt]=v; Next[cnt]=head[u]; head[u]=cnt++; inDeg[v]++; } topoSort(); int ans1=0; for (int i=1; i<=n; i++) { ans1=(ans1+ans[i])%142857; } printf("%d\n",ans1); return 0; }
相关文章推荐
- 拓扑排序模板及其应用
- 有向无环图及其应用(拓扑排序)
- 拓扑排序及其实际应用
- 从七桥问题开始:全面介绍图论及其应用
- 拓扑排序及其应用
- 图论及其应用-哈密尔顿图(alpha)
- 第七章-图(6)有向无环图及其应用-拓扑排序
- 有向无环图及其应用、拓扑排序
- Hook及其应用
- SSE指令介绍及其C、C++应用
- 动态建立弹出式菜单技术及其应用示例
- 射频技术系列谈:射频技术及其在供应链管理中的应用之一
- [技术概述]移动流媒体技术及其应用(转载)
- 认识class Class及其应用
- 视频会议系统及其应用
- Turbo码简介及其在第三代移动通信中的应用
- EJB核心技术及其应用(转载)
- EJB核心技术及其应用
- EJB核心技术及其应用
- 动态建立弹出式菜单技术及其应用示例