user-cf算法思考-K值的确定
2014-11-01 21:50
197 查看
在user-cf的过程中,考虑如下的case:
user-A like item-a item-b item-d
user-B like item-a item-c
user-C like item-b item-c
user-D like item-c item-d item-e
考虑给user-A进行推荐,首先user-cf要确定相邻user的个数K。
书上说,user-cf中K的值过大或者过小都不好。user-A的推荐中,K值最小的极限K=1,即只考虑和user-A最相似的user,会因过于片面而效果不好;K值去最大的极限,即K=user_number,即所有的user都和user-A相邻,那么给user-A的推荐就会过于倾向于热门物品,而不是个性化物品。
个人认为,在user-cf的推荐中,user-A和所有相似度不为0的user进行推荐,K值越大越好。因为这样才能全方位利用相似user的信息,如果K值过大导致推荐倾向热门物品,是因为相似度计算公式不够好,不能够对和A最相似的物品给予足够的权重。
在此处只考虑K=user_number进行计算。
user-A like item-a item-b item-d
user-B like item-a item-c
user-C like item-b item-c
user-D like item-c item-d item-e
考虑给user-A进行推荐,首先user-cf要确定相邻user的个数K。
书上说,user-cf中K的值过大或者过小都不好。user-A的推荐中,K值最小的极限K=1,即只考虑和user-A最相似的user,会因过于片面而效果不好;K值去最大的极限,即K=user_number,即所有的user都和user-A相邻,那么给user-A的推荐就会过于倾向于热门物品,而不是个性化物品。
个人认为,在user-cf的推荐中,user-A和所有相似度不为0的user进行推荐,K值越大越好。因为这样才能全方位利用相似user的信息,如果K值过大导致推荐倾向热门物品,是因为相似度计算公式不够好,不能够对和A最相似的物品给予足够的权重。
在此处只考虑K=user_number进行计算。
相关文章推荐
- 【转载】协同过滤(CF)算法详解,item-base,user-based,SVD,SVD++
- 【推荐系统】协同过滤(CF)算法详解,item-base,user-based,SVD,SVD++
- 推荐算法之用户推荐(UserCF)和物品推荐(ItemCF)对比
- 协同过滤算法之UserCF算法的python实现及部分优化
- 推荐算法之用户推荐(UserCF)和物品推荐(ItemCF)对比
- 推荐算法之用户推荐(UserCF)和物品推荐(ItemCF)对比
- 推荐算法之用户推荐(UserCF)和物品推荐(ItemCF)对比
- 菜鸟更要独立思考之二 改进一个不使用wait和notify顺序打印ABC 10次的算法
- 确定两个字符串通过重新排序是否可以相同的算法
- 算法思考-------杨辉三角(c语言)
- 【打CF,学算法——二星级】Codeforces 703B Mishka and trip (统计)
- 第二章 算法基础 思考题2-4(逆序对)
- 算法:全排列的一点点思考
- 专访DeepID发明者孙祎:关于深度学习与人脸算法的深层思考
- User-Based CF VS. Item-Based CF
- 第二次实验-----算法基本功与综合思考
- 第2次实验——算法基本功 与 综合思考
- 关于独立按键扫描程序的思考(整合两种算法)
- 算法题——确定两串乱序同构
- 今日头条面试算法题——确定ABCDE五个学校名次