昨天,我发布了微博寻人二代系统-微博寻人链
2012-09-16 10:33
155 查看
昨晚在新浪博客发了个博文,分享了些开发思考:http://blog.sina.com.cn/s/blog_593af2a701017jxn.html
这里就技术性问题,做一个分享,谈谈开发过程中最困难的问题。
微博寻人链,简单来说,就是你有一个话题,你想知道,什么人是讨论这个话题,最积极的人。你如“小米”,这个概念,谁是最爱讨论的人。就解决这个问题。
第一版索引上去以后,效果很不好,原因是很多小号(营销账号),虽然大量转发和讨论,但是不客观,不权威,因此按照讨论数排序,是不合理的。
第二版索引追加了粉丝数,如果两个人粉丝数多,说明有价值,这样也会出现一个问题,前排基本被李开复,薛蛮子,雷军等大号垄断,即便这个话题并不是和他们有关,例如一些专业学科类问题。
第三版索引追加了领域权威性,这样效果才可接受了。但因为要想出现一个<人,人,关键词>的三元组,而且是在微博这么关键词很少,文章很短的情况下,所以三元组出现的概率极低。因此如果需要效果,就需要大量数据,未来还需要持续扩充。
如果朋友们对社交挖掘感兴趣,可以参加我组织的西瓜大会,在线下进行充分的交流,我们的网址 http://xiguadahui.com 欢迎惠存,每个月都会举办一次,已经举办三次,大多讨论的是社交挖掘的技术和应用,欢迎你们来和我讨论。 下次计划在10月24日。
这里就技术性问题,做一个分享,谈谈开发过程中最困难的问题。
微博寻人链,简单来说,就是你有一个话题,你想知道,什么人是讨论这个话题,最积极的人。你如“小米”,这个概念,谁是最爱讨论的人。就解决这个问题。
第一版索引上去以后,效果很不好,原因是很多小号(营销账号),虽然大量转发和讨论,但是不客观,不权威,因此按照讨论数排序,是不合理的。
第二版索引追加了粉丝数,如果两个人粉丝数多,说明有价值,这样也会出现一个问题,前排基本被李开复,薛蛮子,雷军等大号垄断,即便这个话题并不是和他们有关,例如一些专业学科类问题。
第三版索引追加了领域权威性,这样效果才可接受了。但因为要想出现一个<人,人,关键词>的三元组,而且是在微博这么关键词很少,文章很短的情况下,所以三元组出现的概率极低。因此如果需要效果,就需要大量数据,未来还需要持续扩充。
如果朋友们对社交挖掘感兴趣,可以参加我组织的西瓜大会,在线下进行充分的交流,我们的网址 http://xiguadahui.com 欢迎惠存,每个月都会举办一次,已经举办三次,大多讨论的是社交挖掘的技术和应用,欢迎你们来和我讨论。 下次计划在10月24日。
相关文章推荐
- 二代旅游网站管理系统V1.0正式发布啦
- 索引1200万人的微博寻人系统
- 不想升级,iOS系统自动更新可彻底关闭! 2016-05-23 16:38 更新/自动/on 昨天笔者发布了一篇关于iOS系统总提醒更新,到底要不要升级的文章,不少读者在微信上留言给笔者, iPhon
- 二代旅游网站程序管理系统V1.0正式发布
- 我推出了微博寻人在线系统
- 华为发布全球首款智能ODN(iODN)系统
- 二代旅游CMS网站管理系统使用手册(二)--目的地管理
- Spring Data Redis实现一个订阅/发布系统
- Intel发布Android模拟器的x86系统映像
- vs2012 文件系统 发布失败,目标文件没有内容
- 【牛腩新闻发布系统之handler】
- 华为发布新一代融合3G网真系统
- 新手向——关于Python3.5在Windows 10 系统下发布模块的终极讲解
- 神似 Win10!Linux LXQt 16.03 系统正式发布下载
- 新浪微博用户兴趣建模系统架构
- 公开课发布《微博话题高性能降级设计》
- 发布网站的时候系统找不到指定文件的解决办法!
- 泛微协同OA工作微博重磅发布
- 【牛腩新闻发布系统】WebForms UnobtrusiveValidationMode 需要“jquery”ScriptResourceMapping。
- oracle简单的新闻发布管理系统之数据建立