R语言聚类算法之密度聚类(Density-based Methods)
2017-02-16 09:58
302 查看
1.原理解析:
1.从数据集中选择一个未处理的样本点
2.以1为圆心,做半径为E的圆,由于圆内圈入点的个数为3,满足密度阈值Minpts,因此称点1为核心对象(黑色实心圆点),且将圈内的4个点形成一个簇,其中点1直接密度可达周围的3个灰色实心原点;
3.重复步骤2若干次,其中点1直接密度可达核心对象3,且点2密度可达点3.
4.当该过程进行到图Ⅳ,4的E邻域内仅有2个点,小雨阈值MinPts,因此点4为边缘点(非核心对象),记为ⓧ,继续考察其他点.
5.当所有对象都被考察,该过程结束,得到图Ⅷ.椭圆形内有若干核心对象和边缘点,这些点都是密度相连的.
6.为个点归类,如图Ⅸ:点集黑圈相互密度可达,属于类别1:点集黑三角相互密度可达,属于新的一类,记为类别2;点集白圈与类别1样本点密度相连,属于类别3;点集白三角与类别2样本点密度相连,属于类别4;点 ⓧ既非核心对象,也不密度相连,为噪声点.
2.在R语言中的应用
密度聚类(Density-based Methods)主要应用到了fpc包中的dbscan函数。
dbscan(data,eps,MinPts=5,scale=FALSE,method=c(“hybird”,”raw”,”dist”),seeds=TRUE,showplot=FALSE,countmode=NULL)
3.以iris数据集为例进行分析
1)应用模型并查看模型的相应参数
ds=dbscan(iris[,-5],eps=0.3,MinPts=4)
ds[1:length(ds)]
1.从数据集中选择一个未处理的样本点
2.以1为圆心,做半径为E的圆,由于圆内圈入点的个数为3,满足密度阈值Minpts,因此称点1为核心对象(黑色实心圆点),且将圈内的4个点形成一个簇,其中点1直接密度可达周围的3个灰色实心原点;
3.重复步骤2若干次,其中点1直接密度可达核心对象3,且点2密度可达点3.
4.当该过程进行到图Ⅳ,4的E邻域内仅有2个点,小雨阈值MinPts,因此点4为边缘点(非核心对象),记为ⓧ,继续考察其他点.
5.当所有对象都被考察,该过程结束,得到图Ⅷ.椭圆形内有若干核心对象和边缘点,这些点都是密度相连的.
6.为个点归类,如图Ⅸ:点集黑圈相互密度可达,属于类别1:点集黑三角相互密度可达,属于新的一类,记为类别2;点集白圈与类别1样本点密度相连,属于类别3;点集白三角与类别2样本点密度相连,属于类别4;点 ⓧ既非核心对象,也不密度相连,为噪声点.
2.在R语言中的应用
密度聚类(Density-based Methods)主要应用到了fpc包中的dbscan函数。
dbscan(data,eps,MinPts=5,scale=FALSE,method=c(“hybird”,”raw”,”dist”),seeds=TRUE,showplot=FALSE,countmode=NULL)
3.以iris数据集为例进行分析
1)应用模型并查看模型的相应参数
ds=dbscan(iris[,-5],eps=0.3,MinPts=4)
ds[1:length(ds)]
相关文章推荐
- R语言聚类算法之密度聚类(Density-based Methods)
- 密度聚类(Density peaks Clustering)Python实现
- 聚类算法——python实现密度聚类(DBSCAN)
- 聚类算法之层次聚类与密度聚类
- Density-Based Spatial Clustering of Applications with Noise(DBSCAN密度聚类)
- DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)
- 聚类算法总结 划分法,层次聚类,基于网格,基于密度,谱聚类,基于模型,模糊聚类
- 聚类分析之基于密度的聚类算法(DBSCAN)
- R语言 密度聚类
- 密度聚类(Density peaks Clustering)Python实现
- R语言聚类算法之期望最大化聚类(Expectation Maximization Algorithm)
- 聚类分析(六)基于密度的聚类算法 — OPTICS
- 聚类算法之DBSCAN(具有噪声的基于密度的聚类方法)
- 基于密度的聚类算法(Clustering by fast search and find of density peaksd)
- 基于密度的聚类:DBSCAN(Density-based Spatial Clustering of Applications with Noise)
- 密度聚类。Clustering by fast search and find of density peaksd
- 基于密度的聚类----DBSCAN算法使用(R语言)
- R语言聚类算法之系谱聚类(Hierarchical Method)
- R语言聚类算法之期望最大化聚类(Expectation Maximization Algorithm)
- 机器学习总结(十):常用聚类算法(Kmeans、密度聚类、层次聚类)及常见问题