您的位置:首页 > 其它

R语言将层次聚类中的树分成簇

2017-06-11 17:03 369 查看

说明

在聚类树图中可以观测到聚类的层次,但是仍然得不到组的信息,不过我们可以定义一个聚类树图会拥有多少个簇,并控制树的高度以便将树分成不同的组。

操作

接上节的数据hc

将数据分成四组

fit = cutree(hc,4)


检查数据的簇标签

fit
[1] 1 1 2 1 2 1 2 2 1 1 1 2 2 1 1 1 2 1 2 3 4 3 4 3 3 4 4 3 4 4 4 3 3 3 4 4 3 4 4 4 4 4 4 4 3 3 4 4 4 3 4 3 3 4 4 4 3 4 4 3


统计每一个簇中的对象数

table(fit)
fit
1  2  3  4
11  8 16 25


使用红色矩形框可视化矩形的簇

plot(hc,hang = -0.01,cex =0.7)
rect.hclust(hc,k=4,border = "red")




除了使用红色矩形来框来界定簇,还可以使用它对单独某个簇进行标记:

plot(hc,hang = -0.01,cex =0.7)
rect.hclust(hc,k = 4,which = 2,border = "red")




标记特定簇

还可以调用dendextend包,使用不同的颜色来绘制红色矩形框的各个不同聚簇。

根据分支所在的不同簇,对其涂色

library(dendextend)#delete
dend %>% color_branches(k=4) %>% plot(horiz = TRUE,main = "Horizontal Dendrogram")




不同簇不同色

在这些簇周围添加红色矩形框

dend %>% color_branches(k=4) %>% plot(horiz = TRUE,main = "Horizontal Dendrogram")
dend %>% rect.dendrogram(k=4,horiz = TRUE)




最后,在图中添加一条切割线来展示对树的操作结:

dend %>% color_branches(k=4) %>% plot(horiz = TRUE,main = "Horizontal Dendrogram")
dend %>% rect.dendrogram(k=4,horiz = TRUE)abline(v = heights_per_k.dendrogram(dend)["4"] + .1,lwd = 2,lty = 2,col = "blue")




水平聚类树中绘制分割线
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: