您的位置:首页 > 其它

R语言聚类算法之k均值聚类(K-means)

2017-05-08 00:00 489 查看
1.原理解析:
随机选取k(预设类别数)个样本作为起始中心点,将其余样本归入相似度最高中心点所在簇(cluster),再确立当前簇中样本坐标的均值为新的中心点,一次循环迭代下去,直至所有样本所属类别不再变动.



2.在R语言中的应用
在k均值聚类中我们应用到了stats包(R语言内置包)中的kmeans函数。
kmeans(x,centers,iter.max = 10,nstart = 1,algorithm = c(“Hartigan-Wong”,”Loyd”,”For-gy”,”MacQueen”))
3.以iris数据集为例进行判别分析
1)应用模型并查看模型的相应参数
fit_km=kmeans(iris[,-5],center=3)
fit_km[1:length(fit_km)]

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: