因式分解结合最近邻:多层面的协同过滤模型
2017-04-26 11:16
288 查看
摘要
推荐系统为用户提供个性化的产品和服务。这些系统大部分都使用协同过滤,通过分析过去行为以建立用户和产品之间的联系。CF的2个比较成功的方法,其一是隐语义模型LFM,它直接描述用户和产品;另一是近邻模型,它分析用户或产品之间的相似度。在本文中,为这两种方法引入一些创新。因子模型和近邻模型可以顺利的融合,因此可以得到一个更准确的组合模型。通过扩展模型以利用用户的显式和隐式反馈来实现进一步的精度改进。本方法已经在netflix数据上测试过,比之前发表过的结果都好。另外,我们建议一个新的评估指标,其中突出了方法之间的差异,基于他们在top k推荐任务中的表现。引言
现在的消费者面对的是过多的选择,电商和内容供应商提供巨大的产品选择,具有前所未有的机会,以满足各种特殊需求和口味。用最合适的产品匹配消费者并不是微不足道的,它是提升用户满意度和忠诚度的关键。这强调了推荐系统的突出地位,它为适合用户口味的产品提供个性化推荐。推荐系统通常是基于cf的,它根据用户过去的行为比如建模,不需要显示配置。显然,CF技术不需要专业领域知识,并且避免了大量数据采集。直接依赖用户行为可以发现复杂和意想不到的模式,然而使用已知的数据属性进行配置是困难或不可能的。因此,CF在过去十年中引起了极大的关注,导致了一些成功的商业系统,包括Amazon [15],TiVo和Netflix,取得了显着的进步。
为了建立推荐系统,CF系统需要比较根本不同的对象:用户和物品。 有两个主要方法来促进这种比较,这构成了CF的两个主要方法:近邻模型和因子模型。
近邻模型主要是计算用户或者物品之间的关系。面向物品的方法根据相同用户对相似物品的评级来评估用户对物品的偏好。从某种意义上说,这些方法通过将用户作为物品评级的篮子将用户转换为物品空间。这样,我们不再需要将用户与物品进行比较,而是直接将物品与物品相关联。
因子分析模型,例如奇异值分解(SVD),包括通过将物品和用户转换为相同潜在因素空间的替代方法,从而使它们直接可比。 潜在空间试图通过对用户反馈自动推断的因素对产品和用户进行表征来解释评级。 例如,当产品是电影时,因素可能会衡量明显的维度,如喜剧与戏剧,动作量或儿童的方向; 不太明确的定义,如人物发展的深度或“奇怪”,或完全不可解释的维度。
参考文献
http://blog.csdn.net/harryhuang1990/article/details/9924377相关文章推荐
- 结合因式分解(SVD++)与近邻模型的混合协同过滤推荐系统
- 基于用户的协同过滤推荐模型
- (数据挖掘-入门-1)基于用户的协同过滤之最近邻
- (数据挖掘-入门-1)基于用户的协同过滤之最近邻
- 【推荐系统】协同过滤之基于用户的最近邻推荐
- 协同过滤之 一、基于用户最近邻的推荐算法
- 协同过滤推荐算法
- 敏捷开发协同瀑布式项目管理平台(三)发布日报模型设计
- 矩阵分解在协同过滤推荐算法中的应用
- DAY5作业-结合盒子模型,优化DY4的卡片,同时也制作了一张新的卡片。
- spark之CF协同过滤
- Extjs结合后台数据库动态生成多层菜单树
- [机器学习]协同过滤,LFM(隐语义)算法
- 非常的好的协同过滤入门文章
- 军用仓库物流与信息流协同的数据模型研究
- 基于协同过滤思想的 道具推荐引擎 算法设计
- lecture10-模型的结合与全贝叶斯学习
- 基于用户协同过滤python源码【多线程计算RMSE值】
- Spark 协同过滤ALS之Item2Item相似度计算优化