机器学习与智能优化 之 自顶而下聚类:K均值
2015-02-01 08:17
323 查看
要点
无监督学习构建模型仅仅通过输入数据,而不用借助分类标签。特别地,聚类旨在将相同类别的物体放到相同的类中,不同的物体放到不同的类中。聚类启动的信息可以是一组点之间的关系(外在表示)或者表示独立点的一组向量(内在表示)。在第二种情况中,一个均值向量可以作为聚类成员的中心。
聚类的目标有:通过抽象压缩信息(考虑组而不是单个成员),了解实验点的全局结构(实验点并不是在输入空间上随机分布的而是聚在有选择的区域),使用聚类中心降低认知负担。
没有独立的最佳聚类评价标准,有趣的结果由相似度测量方法和后续步骤中组之间的关联决定。一言以蔽之,同一个聚类成员之间高相似性,不同聚类之间高差异性。
自顶向下的聚类首先选择指定的聚类数目,然后分割样本。K均值先确定K个中心位置,将样本归类到离它们最近的中心,通过样本均值重新计算中心再重新归类……
聚类让你从一个新的角度看待你的宠物狗托比。狗是有四个爪子,会叫高兴的时候会摇尾巴的器官聚类。托比是与你最喜爱的小宠的经历与情感的聚类。
无监督学习构建模型仅仅通过输入数据,而不用借助分类标签。特别地,聚类旨在将相同类别的物体放到相同的类中,不同的物体放到不同的类中。聚类启动的信息可以是一组点之间的关系(外在表示)或者表示独立点的一组向量(内在表示)。在第二种情况中,一个均值向量可以作为聚类成员的中心。
聚类的目标有:通过抽象压缩信息(考虑组而不是单个成员),了解实验点的全局结构(实验点并不是在输入空间上随机分布的而是聚在有选择的区域),使用聚类中心降低认知负担。
没有独立的最佳聚类评价标准,有趣的结果由相似度测量方法和后续步骤中组之间的关联决定。一言以蔽之,同一个聚类成员之间高相似性,不同聚类之间高差异性。
自顶向下的聚类首先选择指定的聚类数目,然后分割样本。K均值先确定K个中心位置,将样本归类到离它们最近的中心,通过样本均值重新计算中心再重新归类……
聚类让你从一个新的角度看待你的宠物狗托比。狗是有四个爪子,会叫高兴的时候会摇尾巴的器官聚类。托比是与你最喜爱的小宠的经历与情感的聚类。
相关文章推荐
- 机器学习与智能优化 之 自底向上(层次)聚类
- 机器学习:k均值聚类
- 机器学习练习(七)—— K-均值聚类与主成分分析
- 机器学习经典算法详解及Python实现--聚类及K均值、二分K-均值聚类算法
- 机器学习与智能优化 之 KNN
- R语言获取优化的k均值聚类
- 如何为时间序列数据优化K-均值聚类速度?
- 机器学习(三)k均值聚类
- 机器学习笔记—K-均值聚类
- Spark数据挖掘-基于 K 均值聚类的网络流量异常检测(2): 模型优化
- 机器学习教程之10-聚类(Clustering)-K均值聚类(K-means)的sklearn实现
- 机器学习实战 - 第十章 K-均值聚类 代码报错整理
- 机器学习与智能优化 之 统计学习理论和支持向量机
- 机器学习与智能优化 之 规则、决策树和森林
- 机器学习与智能优化 之 学习也民主
- 机器学习作业9 - 自动确定k值的k均值聚类
- 斯坦福大学机器学习笔记——聚类(k-均值聚类算法、损失函数、初始化、聚类数目的选择)
- 机器学习理论与实战(十)K均值聚类和二分K均值聚类 .
- 机器学习-K均值聚类(python3代码实现)
- 机器学习--k均值聚类