协同过滤中item-based与user-based选择依据
2016-11-12 11:29
246 查看
协同过滤是大家熟知的推荐算法。 总的来说协同过滤又可以分为以下两大类:
Neighborhood-based:计算相似item 或user后进行推荐
Model-based: 直接训练模型预测Rating
在Neighborhoold-based算法中,又细分为user-based CF(Collaborative Filtering)和item-based CF。合适选择使用userd-based CF,什么时候item-based CF更适用就会是一个需要权衡的问题。一般而言,可以以以下几个标准进行选择:
1.Accuracy:一般而言,少数置信的邻居的推荐要比很多的没有太多区分性的邻居更加准确,所以一般我们会选择数量较少的因素(item or user)作为based的算法。 例如, amazon中的商品的种类很多,但远没有注册的用户多,所以该场景使用item-based CF比较合适; 反过来,在百度关键词推荐系统中,商业客户(user)量级是100W左右,而待推荐的关键词(item)是10亿量级,此时使用user-based会是更明智的选择。
2.Efficiency
3.Stability:一般情况下倾向于使用变动频率和变动量较少的因素作为based的因素, 例如item变动较少, 则选择item-based, 否则选择user-based
4.Justifablity(说服力):推荐系统中,推荐理由越白盒,用户越容易理解就越有说服力。所以从这方面考虑,item-based CF会更有说服力,例如显示‘因为你浏览了三星 Galaxy,所以给你推荐了HTC One’的理由会比‘和你相似的用户也喜欢XXX’更有说服力,因为推荐系统是不披露哪些用户和我详细,怎么证明和我相似的,而且这种说法显得比较含糊。
5.Serendipity:多样性就是user-based的一大优势,和自己相似的用户,总能发现一些自己还没发现的新东西。 如果追求多样性, userd-based会是不错的选择。
当然上述原则都不是绝对的,而且在真实工业界推荐系统中, 两种方法一般都是混合着使用。例如百度关键词推荐系统中,就会分别使用item-based和user-based方法找到待推荐关键词候选后,再统一使用model进行后续ranking。
参考文献:
RSs Handbook
Evaluating Collaborative Filtering Recommender Systems, Jonathan L.Herlocker
Neighborhood-based:计算相似item 或user后进行推荐
Model-based: 直接训练模型预测Rating
在Neighborhoold-based算法中,又细分为user-based CF(Collaborative Filtering)和item-based CF。合适选择使用userd-based CF,什么时候item-based CF更适用就会是一个需要权衡的问题。一般而言,可以以以下几个标准进行选择:
1.Accuracy:一般而言,少数置信的邻居的推荐要比很多的没有太多区分性的邻居更加准确,所以一般我们会选择数量较少的因素(item or user)作为based的算法。 例如, amazon中的商品的种类很多,但远没有注册的用户多,所以该场景使用item-based CF比较合适; 反过来,在百度关键词推荐系统中,商业客户(user)量级是100W左右,而待推荐的关键词(item)是10亿量级,此时使用user-based会是更明智的选择。
2.Efficiency
3.Stability:一般情况下倾向于使用变动频率和变动量较少的因素作为based的因素, 例如item变动较少, 则选择item-based, 否则选择user-based
4.Justifablity(说服力):推荐系统中,推荐理由越白盒,用户越容易理解就越有说服力。所以从这方面考虑,item-based CF会更有说服力,例如显示‘因为你浏览了三星 Galaxy,所以给你推荐了HTC One’的理由会比‘和你相似的用户也喜欢XXX’更有说服力,因为推荐系统是不披露哪些用户和我详细,怎么证明和我相似的,而且这种说法显得比较含糊。
5.Serendipity:多样性就是user-based的一大优势,和自己相似的用户,总能发现一些自己还没发现的新东西。 如果追求多样性, userd-based会是不错的选择。
当然上述原则都不是绝对的,而且在真实工业界推荐系统中, 两种方法一般都是混合着使用。例如百度关键词推荐系统中,就会分别使用item-based和user-based方法找到待推荐关键词候选后,再统一使用model进行后续ranking。
参考文献:
RSs Handbook
Evaluating Collaborative Filtering Recommender Systems, Jonathan L.Herlocker
相关文章推荐
- 协同过滤中item-based与user-based选择依据
- 【推荐系统】协同过滤(CF)算法详解,item-base,user-based,SVD,SVD++
- 【转载】协同过滤(CF)算法详解,item-base,user-based,SVD,SVD++
- 协同过滤中item-based与user-based选择依据
- 基于物品的协同过滤(item-based collaborative filtering)
- Spark 基于item和user 的协同过滤实现
- Unifying User-Based and Item-Based Collaborative Filtering Approaches by Similarity Function 译文与j...
- 基于用户的协同过滤(UserBased Recommendation)
- Sharepoint 2010:基于当前用户判断访问列表项目的权限 --Determine access to SPListItem based on a Current User
- User-Based CF VS. Item-Based CF
- 推荐系统user-based和item-based协同过滤算法定性比较
- A Hybrid User and Item-Based Collaborative Filtering with Smoothing on Sparse Data
- 推荐决策 对比user-based 和item-based推荐算法
- A Hybrid User and Item-Based Collaborative Filtering with Smoothing on Sparse Data
- 推荐决策 对比user-based 和item-based推荐算法
- 基于用户的协同过滤(user-based collaborative filtering)
- SQL注入天书—ASP注入漏洞全接触 选择自 digituser 的 Blog
- android开发 recycleview的item中加入checkbox实现批量选择条目(复用时防止checkbox勾选状态错乱)
- RecyclerView选择item滚动到顶部
- Android学习笔记(25) --- 硬键盘+GridView选择Item问题