您的位置:首页 > 其它

推荐系统基础之一-简介

2016-05-16 19:53 316 查看

1.什么是推荐系统

根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户的个性化信息推荐de系统。

和搜索引擎相比,推荐系统通过研究用户的兴趣偏好,进行个性化计算,由系统发现用户的兴趣点,从而引导用户发现自己的信息需求。

2.为什么需要推荐系统

为了解决用户在无明确需求场景下信息过载问题的,目的是将长尾内容暴露到可能感兴趣的人面前。

3.怎样评判推荐内容好坏

参考项亮的<<推荐系统实践>>

3.1用户满意度

基本在实际操作中不可用,首先这是一个相对主观的指标,一般依靠用户调研获取,而用户基本也不知道自己想要什么,最多谈一个表面上的感受,参考价值不大。其次最关心推荐系统好坏的往往是这个项目的PM,用户满意度的概念很容易被偷换成PM满意度或老板满意度。所以在实际情况下,会用衡量准确度的客观指标来参考,比如通过点击率的统计看用户对推出内容的满意程度。

3.2预测准确度

评分预测:根据用户对物品历史评分,获得用户的兴趣模型,从模型中分析用户对另一物品的评分。

准确度通过 均方根误差(RMSE)和平均绝对误差(MAE)计算。

TopN推荐:给用户一个个性化推荐列表,通过准确率/召回率度量

3.3覆盖率(coverage)

覆盖率:推荐系统挖掘长尾信息的能力。

推荐的物品占总物品集合的比例。统计推荐列表物品出现次数的分布,若分布较平,说明覆盖率较高;

经济学中的两个指标定义:信息熵、基尼系数

马太效应:强者更强,弱者更弱。

设G1为初始用户行为中计算的物品流行度基尼系数;

设G2为推荐计算的物品流行度基尼系数;

若G2>G1,说明推荐算法具有马太效应。

3.4多样性

衡量推荐系统好坏另一个最重要指标,也是推荐系统到最后最容易出现的问题—过度收敛。

3.5新颖性

推出那些用户之前没有接触过的内容。

3.6惊喜度

旨在推出和之前内容没有任何关系但用户又很满意的内容,这也是一个很主观的指标,较难衡量。

还有一些跟场景比较相关的指标这里就不赘述了,比如信任度,实时性,健壮性。在不同的应用场合比如社交可能更关心信任度,新闻更关心实时性,反作弊更关心健壮性。

最后以上指标并不是都越高越好,几项指标都有内在联系。比如多样性和新颖性高了准确度就会下降,所以几项指标的最优搭配,才是衡量一个好推荐系统的标准。 不同标准在不同的应用场合也有所不同。

3.7评测维度分类

用户

物品

时间
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: