您的位置:首页 > 其它

毕业设计的探索与研究2:有关基于内容推荐算法原理的笔记

2018-01-21 21:00 363 查看
(学习资料来源于网络,如有雷同,纯属学习)

推荐算法:Content Based

作为最基础的算法,基于内容的推荐算法原理理解起来并不难,但是用代码实现就是另外一件事情了,现在只是简单理解一下原理,至于实现的事情今后再慢慢补上。

1. 引入item属性的Content based

a) 结构图如下:

 


b) 引入一组概念:正排表和倒排表

正排表:

Music1:治愈/舒缓/通俗

Music2:摇滚/热血/动感



与之相对应的倒排表是:

治愈:Music1、Music3、Music6…

舒缓:Music1、Music8、Music11…

通俗:Music1、Music19…



通常获取的数据都是属于正排表,所以对于这些数据,需要做的内容分析第一步是:将正排表转换成倒排表

c) 优缺点:

优点:
提升推荐结果的相关性
结果可解释
推荐结果容易被用户感知

缺点:
无个性化
依赖于对item的深度分析

2. 引入User属性的Content based

a) 结构如下

 


b) 优缺点

优点:
用户模型刻画了用户兴趣需求
推荐形式多样,具有个性化
结果可解释

缺点:
推荐精度低
马太效应(用户喜欢看的一直推荐,形成闭环)
用户行为稀疏导致覆盖率低

下一步的学习计划:

1.深入研究协同过滤算法
2.阅读购买书目(明后天到)
3.除算法外,学习其他技术点,如中文分词,mapreduce等
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: