您的位置:首页 > 其它

昨天,我发布了微博寻人二代系统-微博寻人链

2012-09-16 10:33 155 查看
昨晚在新浪博客发了个博文,分享了些开发思考:http://blog.sina.com.cn/s/blog_593af2a701017jxn.html

这里就技术性问题,做一个分享,谈谈开发过程中最困难的问题。

微博寻人链,简单来说,就是你有一个话题,你想知道,什么人是讨论这个话题,最积极的人。你如“小米”,这个概念,谁是最爱讨论的人。就解决这个问题。

第一版索引上去以后,效果很不好,原因是很多小号(营销账号),虽然大量转发和讨论,但是不客观,不权威,因此按照讨论数排序,是不合理的。

第二版索引追加了粉丝数,如果两个人粉丝数多,说明有价值,这样也会出现一个问题,前排基本被李开复,薛蛮子,雷军等大号垄断,即便这个话题并不是和他们有关,例如一些专业学科类问题。

第三版索引追加了领域权威性,这样效果才可接受了。但因为要想出现一个<人,人,关键词>的三元组,而且是在微博这么关键词很少,文章很短的情况下,所以三元组出现的概率极低。因此如果需要效果,就需要大量数据,未来还需要持续扩充。

如果朋友们对社交挖掘感兴趣,可以参加我组织的西瓜大会,在线下进行充分的交流,我们的网址 http://xiguadahui.com 欢迎惠存,每个月都会举办一次,已经举办三次,大多讨论的是社交挖掘的技术和应用,欢迎你们来和我讨论。 下次计划在10月24日。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: