经典聚类算法——K-means
2016-07-21 13:33
190 查看
分类:有标签算法(监督学习)
聚类:无标签算法(无监督学习)
聚类主要思想:类内距离最小,类间距离最大。
K-means:将数据集算法将输入数据集D聚成K个簇,然后输出聚簇代表集合C(k个,即中心点),聚簇成员向量M。
步骤:确定k,选择k个聚类中心,将数据集的元素就近分配到k个簇中,更新k个簇的聚类中心,再重复分配元素,直聚类中心不再改变为止。
局限性:K-均值算法依赖于初始值的选取,仅能取得局部最优解,未必能得到全局最优解。
困难:参数k的取值困难,对于噪声点敏感。
空聚类解决办法:m从最大的聚簇中随机选取一个点作为新的簇的代表。
数据要求:数值型。
缺失值:替换。
效率低。
聚类:无标签算法(无监督学习)
聚类主要思想:类内距离最小,类间距离最大。
K-means:将数据集算法将输入数据集D聚成K个簇,然后输出聚簇代表集合C(k个,即中心点),聚簇成员向量M。
步骤:确定k,选择k个聚类中心,将数据集的元素就近分配到k个簇中,更新k个簇的聚类中心,再重复分配元素,直聚类中心不再改变为止。
局限性:K-均值算法依赖于初始值的选取,仅能取得局部最优解,未必能得到全局最优解。
困难:参数k的取值困难,对于噪声点敏感。
空聚类解决办法:m从最大的聚簇中随机选取一个点作为新的簇的代表。
数据要求:数值型。
缺失值:替换。
效率低。
相关文章推荐
- 逻辑坐标系 设备坐标系 客户坐标系 屏幕坐标系
- java接口和抽象类
- UIAlertView和UIAlertController那点事儿
- Java如何判断线程池所有任务是否执行完毕
- OpenCV学习笔记——腐蚀与膨胀
- Xamarin.Forms项目无法添加服务引用
- AngularJS的学习--$on、$emit和$broadcast的使用
- Hadoop DataNode, NameNode无法启动
- Xamarin.Forms项目无法添加服务引用
- MySQL Replication的相关文件
- 欢迎使用CSDN-markdown编辑器
- Android Studio插件整理
- 实例深入理解Java wait/notify执行机制
- 最大和子矩阵
- POJ 3259 Wormholes 【判断是否存在负环】
- java实现查找数组中重复次数最多的字符串
- 养成领袖风格与习惯
- MAVEN项目标准目录结构
- AngularJS之input指令
- qt下QWT编译 配置和使用