您的位置：首页 > 其它

Kmeans算法和KNN算法（一个水货的自我学习）

2015-08-22 21:17 260 查看

Kmeans是聚类算法的一种，它在数据挖掘方面有着很多的应用。它的优点是，原理简单，比较容易实现；缺点是，比较依赖于k值的选择，对异常值比较敏感。

它的原理是：

一堆数据中选取k个簇，并任意选择k个中心点，分别计算其余的值与这k个中心点的欧式距离，距离最小的归为一类，并将两者的平均值作为新的聚类中心，然后按照之前的方法重新归类、计算中心，直到聚类中心不发生改变为止。

KNN算法（K近邻算法）

是分类算法的一种，（注意分类与聚类的区别），它的原理是：

给出一个测试对象，分别计算这个测试对象与训练集中每个对象的距离，找出k个与测试对象最近的训练对象，看这k个训练对象属于哪一类，这个测试对象就是属于哪一类的。

今天先到这里，有机会会把这两个算法用程序运行一下。

恩，加油

明天开始看论文咯。

参考文献：基本Kmeans算法介绍及其实现 - Liam Q的专栏 - 博客频道 - CSDN.NET
http://blog.csdn.net/qll125596718/article/details/8243404
基本Kmeans算法介绍及其实现 - Liam Q的专栏 - 博客频道 - CSDN.NET
http://blog.csdn.net/qll125596718/article/details/8243404

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航