您的位置：首页 > 其它

user-cf算法思考-K值的确定

2014-11-01 21:50 197 查看

在user-cf的过程中，考虑如下的case：

user-A like item-a item-b item-d

user-B like item-a item-c

user-C like item-b item-c

user-D like item-c item-d item-e

考虑给user-A进行推荐，首先user-cf要确定相邻user的个数K。

书上说，user-cf中K的值过大或者过小都不好。user-A的推荐中，K值最小的极限K=1，即只考虑和user-A最相似的user，会因过于片面而效果不好；K值去最大的极限，即K=user_number，即所有的user都和user-A相邻，那么给user-A的推荐就会过于倾向于热门物品，而不是个性化物品。

个人认为，在user-cf的推荐中，user-A和所有相似度不为0的user进行推荐，K值越大越好。因为这样才能全方位利用相似user的信息，如果K值过大导致推荐倾向热门物品，是因为相似度计算公式不够好，不能够对和A最相似的物品给予足够的权重。

在此处只考虑K=user_number进行计算。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航