模式识别学习笔记(四)---聚类算法的技术方案
2016-01-03 13:57
225 查看
聚类分析有很多具体的算法,有的比较简单,有的相对复杂和完善,但归纳起来就是三大类:
1、按最小距离原则简单聚类方法
2、按最小距离原则进行两类合并的方法
3、依据准则函数动态聚类方法(此方法下次单独详细写实现步骤,本文主要讲前两种方法)
设定一些分类的控制参数,定义一个能表征聚类结果优劣的准则函数,聚类过程就是使准则函数取极值的优化过程。
算法运行中,类心不断地修正,各模式的类别的指定也不断地更改。这类方法有---C均值法、ISODATA法等。
(1)简单聚类方法:
针对具体问题确定相似性阈值,将模式到各聚类中心间的距离与阈值比较,当大于阈值时该模式就作为另一类的中心,小于阈值时按最小距离原则将其分划到某一类中。
这类算法运行中模式的类别及类的中心一旦确定将不会改变。
(2)按最小距离原则进行两类合并的方法:
首先视各模式自成一类,然后将距离最小的两类合并成一类,不断地重复这个过程,直到成为两类为止。
这类算法运行中,类心不断地修正,但模式类别一旦指定后就不再改变,就是模式一旦划为一类后就不再被分划开,这类算法也称为谱系聚类法。
谱系聚类法:
1、按最小距离原则简单聚类方法
2、按最小距离原则进行两类合并的方法
3、依据准则函数动态聚类方法(此方法下次单独详细写实现步骤,本文主要讲前两种方法)
设定一些分类的控制参数,定义一个能表征聚类结果优劣的准则函数,聚类过程就是使准则函数取极值的优化过程。
算法运行中,类心不断地修正,各模式的类别的指定也不断地更改。这类方法有---C均值法、ISODATA法等。
(1)简单聚类方法:
针对具体问题确定相似性阈值,将模式到各聚类中心间的距离与阈值比较,当大于阈值时该模式就作为另一类的中心,小于阈值时按最小距离原则将其分划到某一类中。
这类算法运行中模式的类别及类的中心一旦确定将不会改变。
(2)按最小距离原则进行两类合并的方法:
首先视各模式自成一类,然后将距离最小的两类合并成一类,不断地重复这个过程,直到成为两类为止。
这类算法运行中,类心不断地修正,但模式类别一旦指定后就不再改变,就是模式一旦划为一类后就不再被分划开,这类算法也称为谱系聚类法。
谱系聚类法:
相关文章推荐
- 对内存的优化
- 语言对比-线程支持
- Java多线程之生产者消费者2
- MySQL的事务级别测试
- centos的软件安装方法rpm和yum
- dell N5010
- dell N5010
- android图片操作之 Matrix
- Struts2上传文件最大尺寸设置
- 正则表达
- 利用caffe生成 lmdb 格式的文件,并对网络进行FineTuning
- Centos 7网络配置
- 杭电OJ tree(并查集)
- 自定义列表li项目符号
- countUp.js 数字动画
- 搭建jekyll博客
- centos5.5配置网络连接(阿和整理)
- 误操作生成的“病毒“解决方法
- jbpm6.1.0 jbpm-console
- 做自己想做的工作,你也可以!