您的位置:首页 > 编程语言 > Python开发

机器学习-周志华-个人练习9.6

2017-05-09 23:33 621 查看

9.6 试析AGNES算法使用最小距离和最大距离的区别。



根据定义,如上图所示,最大和最小距离分别代表聚类簇i与j间距离最近的样本点或距离最远样本点之间的距离,而其具体几何含义是什么呢?根据个人的理解,参考了icefire的回答但有一些不同看法,我用维基百科上关于Hausdorff distance的示意图进行表示。

如下图所示,图中左下方的黑色虚线代表Hausdorff距离,而黑色实线代表dmin,灰色实线代表dmax,显然这些距离都满足对称性。

对于对于dmin,我们可认为是以Y集合中所有点为圆心同时向外不断扩大的圆,当第一个圆开始接触到集合X中的点,也就是形成第一个外切圆时所对应的半径即为dmin。

对于dmax,我们也认为是以Y集合中所有点为圆心同时向外不断扩大的圆,随着圆扩大,当最后一个圆能够完全包含X时的圆半径即为dmax。同时,由对称性可知,反过来,以X集合中所有点为圆心,使圆半径同时不断扩大,那么达到这个dmax时对应的条件是:最后一个圆的半径扩大到恰好同时包含了X和Y中所有样本,成为外接圆。综上所述,dmax就是在一个集合上,以所有点为圆心形成不断向外扩大的圆,在所有圆中最晚形成能够完全包住另一集合中所有样本的外接圆时对应的半径即为dmax。

顺带一提,正如icefire所表示的,Hausdorff距离就是以Y(X)集合中所有点为圆心同时向外不断扩大的圆,当最后一个圆开始接触到集合X(Y)中的点,也就是形成最后一个外切圆时所对应的半径中的较大者即为Hausdorff距离。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  机器学习 python AGNES