您的位置：首页 > 其它

并查集 (Union-Find Sets)及其应用

2009-07-08 16:22 323 查看

并查集 (Union-Find Sets)及其应用

并查集：

(union-find sets)是一种简单的用途广泛的集合. 并查集是若干个不相交集合，能够实现较快的合并和判断元素所在集合的操作，应用很多。一般采取树形结构来存储并查集，并利用一个rank数组来存储集合的深度下界，在查找操作时进行路径压缩使后续的查找操作加速。这样优化实现的并查集，空间复杂度为O(N)，建立一个集合的时间复杂度为O(1)，N次合并M查找的时间复杂度为O(M Alpha(N))，这里Alpha是Ackerman函数的某个反函数，在很大的范围内（人类目前观测到的宇宙范围估算有10的80次方个原子，这小于前面所说的范围）这个函数的值可以看成是不大于4的，所以并查集的操作可以看作是线性的。它支持以下三种操作:

　　－Union (Root1, Root2) //并操作；把子集合Root2并入集合Root1中.要求：Root1和 Root2互不相交,否则不执行操作.
　　－Find (x) //搜索操作；搜索元素x所在的集合,并返回该集合的名字.
　　－UFSets (s) //构造函数。将并查集中s个集合初始化为s个只有一个单元素的子集合.
　　－对于并查集来说，每个集合用一棵树表示。
　　－集合中每个元素的元素名分别存放在树的结点中，此外，树的每一个结点还有一个指向其双亲结点的指针。
　　－设 S1= {0, 6, 7, 8 }，S2= { 1, 4, 9 }，S3= { 2, 3, 5 }

－为简化讨论，忽略实际的集合名，仅用表示集合的树的根来标识集合。
　　－为此，采用树的双亲表示作为集合存储表示。集合元素的编号从0到 n-1。其中 n 是最大元素个数。在双亲表示中，第 i 个数组元素代表包含集合元素 i 的树结点。根结点的双亲为-1，表示集合中的元素个数。为了区别双亲指针信息( ≥ 0 )，集合元素个数信息用负数表示。

S1 ∪ S2的可能的表示方法:

void ufsets(int s)
{//构造函数
int i, parent[s];

for(i = 0; i < s; i++){
parent[i] = -1;
}
}

int find(int x)//搜索操作
{
if(parent[x] <= 0){
return x;
}

else{
return find(parent[x]);
}
void union(int root1, int root2){//合并操作
parent[root2] = root1;//root2指向root1
}
Find和Union操作性能不好。假设最初 n 个元素构成 n 棵树组成的森林，parent[i] = -1。做处理Union(0, 1), Union(1, 2), …, Union(n-2, n-1)后，将产生如图所示的退化的树。

执行一次Union操作所需时间是O(1)，n-1次Union操作所需时间是O(n)。若再执行Find(0), Find(1), …, Find(n-1), 若被搜索的元素为i，完成Find(i)操作需要时间为O(i)，完成 n 次搜索需要的总时间将达到

Union操作的加权规则

　　为避免产生退化的树，改进方法是先判断两集合中元素的个数，如果以 i 为根的树中的结点个数少于以 j 为根的树中的结点个数，即parent[i] > parent[j]，则让 j 成为 i 的双亲，否则，让i成为j的双亲。此即Union的加权规则。

parent[0](== -4) < parent[4] (== -3)
　　void WeightedUnion(int Root1, int Root2) {
　　　//按Union的加权规则改进的算法
　　　int temp = parent[Root1] + parent[Root2];
　　　if ( parent[Root2] < parent[Root1] ) {
　　　　parent[Root1] = Root2; //Root2中结点数多
　　　　parent[Root2] = temp; 　//Root1指向Root2
　　　}
　　　else {
　　　　parent[Root2] = Root1; //Root1中结点数多
　　　　parent[Root1] = temp; 　//Root2指向Root1
　　　}
　　}

使用加权规则得到的树

下面是几到用并查集可以方便解决的问题:

题目：亲戚(Relations)
或许你并不知道，你的某个朋友是你的亲戚。他可能是你的曾祖父的外公的女婿的外甥的表姐的孙子。如果能得到完整的家谱，判断两个人是否亲戚应该是可行的，但如果两个人的最近公共祖先与他们相隔好几代，使得家谱十分庞大，那么检验亲戚关系实非人力所能及.在这种情况下，最好的帮手就是计算机。
为了将问题简化，你将得到一些亲戚关系的信息，如同Marry和Tom是亲戚，Tom和B en是亲戚，等等。从这些信息中，你可以推出Marry和Ben是亲戚。请写一个程序，对于我们的关心的亲戚关系的提问，以最快的速度给出答案。

参考输入输出格式输入由两部分组成。
第一部分以N，M开始。N为问题涉及的人的个数(1 ≤ N ≤ 20000)。这些人的编号为1,2,3,…,N。下面有M行(1 ≤ M ≤ 1000000)，每行有两个数ai, bi，表示已知ai和bi是亲戚.
第二部分以Q开始。以下Q行有Q个询问(1 ≤ Q ≤ 1 000 000)，每行为ci, di，表示询问ci和di是否为亲戚。
对于每个询问ci, di，若ci和di为亲戚，则输出Yes，否则输出No。

样例输入与输出
输入relation.in
10 7
2 4
5 7
1 3
8 9
1 2
5 6
2 3
3
3 4
7 10
8 9
输出relation.out
Yes
No
Yes
如果这道题目不用并查集，而只用链表或数组来存储集合，那么效率很低，肯定超时。
例程:

#include <stdio.h>

int n, m, q;
int pre[20000], rank[20000];

void makeset(int x)
{
pre[x] = -1;
rank[x] = 1;
}

void unionone(int a, int b)
{
int root1 = find(a);
int root2 = find(b);

if(rank[root1] > rank[root2]){
pre[root2] = root1;
rank[root1]++;
}
else{
pre[root1] = root2;
rank[root2]++;
}
}

int find(int x)
{
int r = x, q;

while(pre[r] != -1){
r = pre[r];
}
return r;
}

int main(int argc, char **argv)
{
int a, b, c, d, i;

scanf("%d", &n);
getchar();
scanf("%d", &m);
getchar();

for(i = 0; i < n; i++){
makeset(i);
}

for(i = 0; i < m; i++){
scanf("%d %d", &a, &b);
getchar();
if(find(a) != find(b)){
unionone(a, b);
}
}

scanf("%d", &q);
getchar();

for(i = 0; i < q; i++){
scanf("%d %d", &c, &d);
getchar();
if(find(c) == find(d)){
printf("YES/n");
}
else{
printf("NO/n");
}
}

return 0;
}

原文地址 http://hi.baidu.com/zhanggmcn/blog/item/b8cbf963fcfdc4630d33fafb.html

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航