几种相似度计算公式
2014-05-13 16:42
253 查看
参考论文: Item-Based Collaborative Filtering Recommendation Algorithms
余弦相似度、改进的余弦相似度、皮尔森相似度,具体描述参考:http://blog.csdn.net/bornhe/article/details/7425642
Cosine Similarity:
Adjusted Cosine Similarity:
Pearson’s Collection Similarity:
注意:以上给出的例子公式中,改进的余弦相似度和皮尔森相似度公式都是计算的物品间的相似度,注意两个公式的区别。皮尔森相似度中减去的平均值为物品的平均评分,改进的余弦相似度减去的平均值为用户的平均评分。若是计算用户间的相似度,该减去的平均值需要作相应的调整。《推荐系统》p10中提到,对于基于用户的推荐系统(至少在研究最充分的推荐领域)来说,
Pearson相关系数比其他度量用户相似度的方法更胜一筹,不过对于后来发现的基于物品的推荐技术,余弦相似度方法比Pearson相关度量表现更好。下面式子为计算用户间的皮尔森相似度:
Mahout中相似度计算,对评分向量进行归一化操作:
AbstractVector.java
余弦相似度、改进的余弦相似度、皮尔森相似度,具体描述参考:http://blog.csdn.net/bornhe/article/details/7425642
Cosine Similarity:
Adjusted Cosine Similarity:
Pearson’s Collection Similarity:
注意:以上给出的例子公式中,改进的余弦相似度和皮尔森相似度公式都是计算的物品间的相似度,注意两个公式的区别。皮尔森相似度中减去的平均值为物品的平均评分,改进的余弦相似度减去的平均值为用户的平均评分。若是计算用户间的相似度,该减去的平均值需要作相应的调整。《推荐系统》p10中提到,对于基于用户的推荐系统(至少在研究最充分的推荐领域)来说,
Pearson相关系数比其他度量用户相似度的方法更胜一筹,不过对于后来发现的基于物品的推荐技术,余弦相似度方法比Pearson相关度量表现更好。下面式子为计算用户间的皮尔森相似度:
Mahout中相似度计算,对评分向量进行归一化操作:
AbstractVector.java
public Vector normalize() { return divide(Math.sqrt(dotSelf())); } //计算向量模的平方 public double dotSelf() { double result = 0.0; Iterator<Element> iter = iterateNonZero(); while (iter.hasNext()) { double value = iter.next().get(); result += value * value; } return result; } //归一化,每一维的值除以模 public Vector divide(double x) { if (x == 1.0) { return like().assign(this); } Vector result = like().assign(this); Iterator<Element> iter = result.iterateNonZero(); while (iter.hasNext()) { Element element = iter.next(); element.set(element.get() / x); } return result; }
相关文章推荐
- Mahout的taste里的几种相似度计算方法
- 推荐系统中常见的几种相似度计算方法和其适用数据
- 文本相似度计算的几个距离公式(欧氏距离、余弦相似度、Jaccard距离、编辑距离)
- Mahout推荐引擎中的几种相似度计算简要介绍
- Lucene实现自定义相似度计算公式
- 句子相似度计算的几种方法
- 几种CRC16计算公式、初始值、标志位等参数汇总
- Lua几种计算公式
- 一些距离及相似度计算公式
- 公式不计算等几种常见问题的解决办法
- Mahout的taste里的几种相似度计算方法
- jaccard相似度计算公式
- 几种日起计算公式,未完待续
- 固定资产折旧方法与计算公式,固定资产的折旧方法有几种?
- 几种距离计算公式在数据挖掘中的应用场景分析
- [推荐系统]mahout中实现的几种相似度计算方法
- 固定资产折旧方法与计算公式,固定资产的折旧方法有几种?
- Mahout的taste里的几种相似度计算方法
- Mahout的taste里的几种相似度计算方法
- 推荐系统的几种相似度计算