推荐系统基础之一-简介
2016-05-16 19:53
316 查看
1.什么是推荐系统
根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户的个性化信息推荐de系统。和搜索引擎相比,推荐系统通过研究用户的兴趣偏好,进行个性化计算,由系统发现用户的兴趣点,从而引导用户发现自己的信息需求。
2.为什么需要推荐系统
为了解决用户在无明确需求场景下信息过载问题的,目的是将长尾内容暴露到可能感兴趣的人面前。3.怎样评判推荐内容好坏
参考项亮的<<推荐系统实践>>3.1用户满意度
基本在实际操作中不可用,首先这是一个相对主观的指标,一般依靠用户调研获取,而用户基本也不知道自己想要什么,最多谈一个表面上的感受,参考价值不大。其次最关心推荐系统好坏的往往是这个项目的PM,用户满意度的概念很容易被偷换成PM满意度或老板满意度。所以在实际情况下,会用衡量准确度的客观指标来参考,比如通过点击率的统计看用户对推出内容的满意程度。3.2预测准确度
评分预测:根据用户对物品历史评分,获得用户的兴趣模型,从模型中分析用户对另一物品的评分。准确度通过 均方根误差(RMSE)和平均绝对误差(MAE)计算。
TopN推荐:给用户一个个性化推荐列表,通过准确率/召回率度量
3.3覆盖率(coverage)
覆盖率:推荐系统挖掘长尾信息的能力。推荐的物品占总物品集合的比例。统计推荐列表物品出现次数的分布,若分布较平,说明覆盖率较高;
经济学中的两个指标定义:信息熵、基尼系数
马太效应:强者更强,弱者更弱。
设G1为初始用户行为中计算的物品流行度基尼系数;
设G2为推荐计算的物品流行度基尼系数;
若G2>G1,说明推荐算法具有马太效应。
3.4多样性
衡量推荐系统好坏另一个最重要指标,也是推荐系统到最后最容易出现的问题—过度收敛。3.5新颖性
推出那些用户之前没有接触过的内容。3.6惊喜度
旨在推出和之前内容没有任何关系但用户又很满意的内容,这也是一个很主观的指标,较难衡量。还有一些跟场景比较相关的指标这里就不赘述了,比如信任度,实时性,健壮性。在不同的应用场合比如社交可能更关心信任度,新闻更关心实时性,反作弊更关心健壮性。
最后以上指标并不是都越高越好,几项指标都有内在联系。比如多样性和新颖性高了准确度就会下降,所以几项指标的最优搭配,才是衡量一个好推荐系统的标准。 不同标准在不同的应用场合也有所不同。
3.7评测维度分类
用户物品
时间
相关文章推荐
- JavaCAS操作
- [dp+数论]bzoj1004
- 学习心得 六 修改
- 数据库索引
- Sublime Text 3 绝对神器
- Android中EditText中的InputType
- hdoj 2055 An easy problem (单个字符)
- CSS 3 伪元素选择器
- iOS中直接使用Gif图片
- php中redis的安装
- 团体程序设计天梯赛-L3-004. 肿瘤诊断
- linux下常用文本编辑器的控制台启动命令
- [NOI2016模拟5.14]最长公共子序列
- CSS 3 伪类选择器
- 解决对话框报错方案
- chrome的广告过滤插件下载地址
- php使用ffmpeg向视频中添加文字字幕
- Unsupported major.minor version 52.0
- php使用ffmpeg向视频中添加文字字幕
- 验证码的发展史