您的位置:首页 > 其它

[trick]dsu on tree

2017-10-18 21:25 323 查看
原网址(鸣谢Yveh)

UPD 17.3.27:这个技巧实际上局限性也很明显。第一只能支持子树查询,第二不支持修改操作。

概述

写这篇文章的原因是NOIP前刷Codeforces做到一道题,用这种方式,以很低的代码复杂度做到的优秀时间复杂度。

于是我学习了一下CF上这篇文章,翻译过来安利一下,也算作是自己的学习笔记吧。

什么是dsu on tree

dsu on tree用来解决这样一类问题:统计树上一个节点的子树中具有某种特征的节点数。

例如子树中颜色为x的个数。

这种方法可以做到O(nlogn)的复杂度。

那么dsu到底是个什么玩意呢?其实它的中文译名就是众所周知的并查集…

有的小朋友就会问了,并查集怎么跑到树上去的呢?

恩……其实说白了就是启发式合并:在做一类维护问题的时候,将size较小的合并到较大的size上,从而达到降低时间复杂度的目的。

不是很懂为什么叫dsu,因为并查集的按秩合并思想?

一个例子

以上面的问题举个例子。

给出一棵树,每个节点有一种颜色。

给出若干次询问形如:树中节点x的个数。

下面讨论了几种做法。

代码我直接粘的原文代码。

暴力

int cnt[maxn];
void add(int v, int p, int x){
cnt[ col[v] ] += x;
for(auto u: g[v])
if(u != p)
add(u, v, x)
}
void dfs(int v, int p){
add(v, p, 1);
//now cnt[c] is the number of vertices in subtree of vertice v that has color c. You can answer the queries easily.
add(v, p, -1);
for(auto u : g[v])
if(u != p)
dfs(u, v);
}


在这种做法中,每次统计x的子树的贡献加入,统计结束后,再暴力删除贡献,消除影响。

时间复杂度O(n2)

但是这样有很多无用的删除操作,能不能减少这种操作呢。

平衡树启发式合并

map<int, int> *cnt[maxn];
void dfs(int v, int p){
int mx = -1, bigChild = -1;
for(auto u : g[v])
if(u != p){
dfs(u, v);
if(sz[u] > mx)
mx = sz[u], bigChild = u;
}
if(bigChild != -1)
cnt[v] = cnt[bigChild];
(*cnt[v])[ col[v] ] ++;
for(auto u : g[v])
if(u != p && u != bigChild){
for(auto x : *cnt[u])
(*cnt[v])[x.first] += x.second;
}
//now (*cnt)[c] is the number of vertices in subtree of vertice v that has color c. You can answer the queries easily.

}


在这种做法中,每个节点开了一棵平衡树。按照dfs序来统计答案。统计到x的时候,保留其最大的孩子,将其他孩子合并到最大的孩子上(启发式合并)。

时间复杂度O(nlog2n)

这样虽然减少了操作次数,但是单次操作次数变为了O(logn)

(Splay的启发式合并是O(nlogn)的?但是因为常数和代码复杂度关系,不是很值得专治数据结构学傻)

有没有更优秀的做法呢。

树链剖分

int cnt[maxn];
bool big[maxn];
void add(int v, int p, int x){
cnt[ col[v] ] += x;
for(auto u: g[v])
if(u != p && !big[u])
add(u, v, x)
}
void dfs(int v, int p, bool keep){
int mx = -1, bigChild = -1;
for(auto u : g[v])
if(u != p && sz[u] > mx)
mx = sz[u], bigChild = u;
for(auto u : g[v])
if(u != p && u != bigChild)
dfs(u, v, 0);  // run a dfs on small childs and clear them from cnt
if(bigChild != -1)
dfs(bigChild, v, 1), big[bigChild] = 1;  // bigChild marked as big and not cleared from cnt
add(v, p, 1);
//now cnt[c] is the number of vertices in subtree of vertice v that has color c. You can answer the queries easily.
if(bigChild != -1)
big[bigChild] = 0;
if(keep == 0)
add(v, p, -1);
}


在这种做法中,我们先进行树链剖分。

dfs的时候,首先dfs节点x的下一个轻儿子,一次类推。

然后dfs节点x的重儿子,无需消去影响。

在最后,我们为了统计x轻儿子的贡献加回来。

看起来很暴力,但是实际上它的时间复杂度是O(nlogn)的,跑得飞快。

可以这么考虑:只有dfs到轻边时,才会将轻边的子树中合并到上一级的重链,树链剖分将一棵树分割成了不超过logn条重链。

每一个节点最多向上合并logn。

所以整体复杂度是O(nlogn)的。

其他做法

类似于这种树上子树的统计问题,还有一些其他的做法。

dfs序莫队

一个子树中的节点在dfs序中是连续的,所以可以通过dfs序,将子树问题转化为序列问题,这样就可以跑莫队了。

时间复杂度O(qn√)

dfs序主席树

还可以通过dfs序建出主席树,查询就是差分后的单点查询。

时间复杂度O((n+q)logn)

但是空间复杂度是O(nlogn)的
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: