机器学习基础(三十三)—— 皮尔逊相关度评价
2016-03-30 11:46
218 查看
除了欧几里得距离,还有一种更复杂一些的方法可以用来判断人们兴趣的相似度(相似一定发生在两个之间)。那就是皮尔逊相关系数,该相关系数是判断两组数据与某一直线拟合程度的一种度量。它在数据不是很规范(normalized)的时候(比如,某影评者对影片的评价总是相对于平均水平偏离很大时),会倾向于给出更好的结果。
如果某人总是倾向于给出比另一个人高的分值,而二者的分差又始终保持一致,也即二者呈线性关系,则会得到较高的皮尔逊相关度。
ρX,Y=cov(X,Y)D(X)−−−−−√D(Y)−−−−−√
对应与 numpy 库中的 np.corrcoef() 函数。
如果某人总是倾向于给出比另一个人高的分值,而二者的分差又始终保持一致,也即二者呈线性关系,则会得到较高的皮尔逊相关度。
ρX,Y=cov(X,Y)D(X)−−−−−√D(Y)−−−−−√
对应与 numpy 库中的 np.corrcoef() 函数。
np.corrcoef(X, Y)[0][1]
相关文章推荐
- VC API常用函数简单例子大全
- Java学习笔记-笔试考点
- javascript的原型链简单了解
- 整理关于Windows自旋锁实现
- 2016-03-29 面试总结
- 循环广告栏的实现一
- linux64位shellcode代码注入
- Html5之高级-7 HTML5 Chart.js(概述、入门、使用)
- ActivityGroup实现Tab功能
- 设计模式-工厂方法模式
- Java中Collection和Collections的区别(引用自:http://www.cnblogs.com/dashi/p/3597937.html)
- Camera.Parameters 参数
- MySQL 添加列,修改列,删除列
- 应如何取B/S的B端的IP
- break 语句有一个可选参数,表示跳出几层循环
- 柳峰微信公众平台开发教程企业号修改篇(企业菜单篇)
- PHP获取网页所有连接的方法(附demo源码下载)
- Leetcode 171
- uestc1139菲波拉契数制升级版
- 柳峰微信公众平台开发教程企业号修改篇(企业菜单篇)