您的位置：首页 > 其它

推荐系统基础之一－简介

2016-05-16 19:53 316 查看

1.什么是推荐系统

根据用户的信息需求、兴趣等，将用户感兴趣的信息、产品等推荐给用户的个性化信息推荐de系统。

和搜索引擎相比，推荐系统通过研究用户的兴趣偏好，进行个性化计算，由系统发现用户的兴趣点，从而引导用户发现自己的信息需求。

2.为什么需要推荐系统

为了解决用户在无明确需求场景下信息过载问题的，目的是将长尾内容暴露到可能感兴趣的人面前。

3.怎样评判推荐内容好坏

参考项亮的<<推荐系统实践>>

3.1用户满意度

基本在实际操作中不可用，首先这是一个相对主观的指标，一般依靠用户调研获取，而用户基本也不知道自己想要什么，最多谈一个表面上的感受，参考价值不大。其次最关心推荐系统好坏的往往是这个项目的PM，用户满意度的概念很容易被偷换成PM满意度或老板满意度。所以在实际情况下，会用衡量准确度的客观指标来参考，比如通过点击率的统计看用户对推出内容的满意程度。

3.2预测准确度

评分预测：根据用户对物品历史评分，获得用户的兴趣模型，从模型中分析用户对另一物品的评分。

准确度通过均方根误差（RMSE）和平均绝对误差（MAE）计算。

TopN推荐：给用户一个个性化推荐列表，通过准确率／召回率度量

3.3覆盖率（coverage）

覆盖率：推荐系统挖掘长尾信息的能力。

推荐的物品占总物品集合的比例。统计推荐列表物品出现次数的分布，若分布较平，说明覆盖率较高；

经济学中的两个指标定义：信息熵、基尼系数

马太效应：强者更强，弱者更弱。

设G1为初始用户行为中计算的物品流行度基尼系数；

设G2为推荐计算的物品流行度基尼系数；

若G2>G1,说明推荐算法具有马太效应。

3.4多样性

衡量推荐系统好坏另一个最重要指标，也是推荐系统到最后最容易出现的问题—过度收敛。

3.5新颖性

推出那些用户之前没有接触过的内容。

3.6惊喜度

旨在推出和之前内容没有任何关系但用户又很满意的内容，这也是一个很主观的指标，较难衡量。

还有一些跟场景比较相关的指标这里就不赘述了，比如信任度，实时性，健壮性。在不同的应用场合比如社交可能更关心信任度，新闻更关心实时性，反作弊更关心健壮性。

最后以上指标并不是都越高越好，几项指标都有内在联系。比如多样性和新颖性高了准确度就会下降，所以几项指标的最优搭配，才是衡量一个好推荐系统的标准。不同标准在不同的应用场合也有所不同。

3.7评测维度分类

用户

物品

时间

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航