Google有意思的一个小工具Google Sets
2009-09-24 22:56
399 查看
这两天在看python的新闻时,无意中发现google有这么一个有意思的工具Google Sets,你输入几个关键词,他可以根据这些词的相关度,匹配出一组类似的关键词出来,比如,我输入nokia,eircssion,motorola.
可以匹配出相关度很高的一些关键词出来。
我想对于Google要实现这个工具来说应该是小Case了,毕竟google关键词搜素中一个关键的技术就是相关度分析,这个工具只不过也是采用了相关度分析得出来的,将相关度最高的一些关键词列出来了。
至于什么是相关度,我们可以举个最简单的例子来打比方。
比如我们在google中搜索nokia,我们可以搜索到275,000,000个网页,搜索motorola可以搜索到大概137,000,000个网页,如果以nokia AND motorola为关键字搜索,我们可以搜索到大概76,400,000个网页,那么可以计算出nokia和motorola两个关键词的相关度: 76,400,000/(275,000,000 + 137,000,000 - 76,400,000) = 0.22765196662693682.我们可以认为这两个关键词的相关度为22.8%.通俗一点说,关键词相关度就是两个关键词之间的亲密程度,二者双双出现的概率。相关度越高,说明二者越亲密。现在很多网站的SEO们研究的一个主要课题就是相关度了。
这个工具从国外的一些文章来看,似乎还是大有文章可做的,比如这一篇《DNS Name Prediction With Google》,就提到采用这个相关度方法进行DNS预测,我倒是想到一个有趣的用处,很多老外公司喜欢出那种智力、逻辑测试题,从一组词中选择最合适的匹配项,好像也是变相的从相关度上进行设计的。
Google Sets这个工具使用起来很简单,参数传递也是通过URL传递的,我们需要使用时,完全可以模拟出来,还真有一个老外用python实现出来了,可参考《Python Library for Google Sets》一文,简单的看了一下代码,也就是模拟网页请求,然后采用了一个BeautifulSoup库,将返回的结果HTML网页解析成DOM树,提取其中的结果出来,试用了一下,还不错。如果大家想用这个功能,可以考虑一下这个库。我看了一下这个库,还可以分析google的搜索结果功能,以后可以考虑借过来用。
可以匹配出相关度很高的一些关键词出来。
我想对于Google要实现这个工具来说应该是小Case了,毕竟google关键词搜素中一个关键的技术就是相关度分析,这个工具只不过也是采用了相关度分析得出来的,将相关度最高的一些关键词列出来了。
至于什么是相关度,我们可以举个最简单的例子来打比方。
比如我们在google中搜索nokia,我们可以搜索到275,000,000个网页,搜索motorola可以搜索到大概137,000,000个网页,如果以nokia AND motorola为关键字搜索,我们可以搜索到大概76,400,000个网页,那么可以计算出nokia和motorola两个关键词的相关度: 76,400,000/(275,000,000 + 137,000,000 - 76,400,000) = 0.22765196662693682.我们可以认为这两个关键词的相关度为22.8%.通俗一点说,关键词相关度就是两个关键词之间的亲密程度,二者双双出现的概率。相关度越高,说明二者越亲密。现在很多网站的SEO们研究的一个主要课题就是相关度了。
这个工具从国外的一些文章来看,似乎还是大有文章可做的,比如这一篇《DNS Name Prediction With Google》,就提到采用这个相关度方法进行DNS预测,我倒是想到一个有趣的用处,很多老外公司喜欢出那种智力、逻辑测试题,从一组词中选择最合适的匹配项,好像也是变相的从相关度上进行设计的。
Google Sets这个工具使用起来很简单,参数传递也是通过URL传递的,我们需要使用时,完全可以模拟出来,还真有一个老外用python实现出来了,可参考《Python Library for Google Sets》一文,简单的看了一下代码,也就是模拟网页请求,然后采用了一个BeautifulSoup库,将返回的结果HTML网页解析成DOM树,提取其中的结果出来,试用了一下,还不错。如果大家想用这个功能,可以考虑一下这个库。我看了一下这个库,还可以分析google的搜索结果功能,以后可以考虑借过来用。
相关文章推荐
- Google Protocol Buffers (一个客户端与服务器协议生成工具)
- 又发布一个google小工具哦,汉字转拼音小工具
- 自己开发的一个轻量级的记录工具,欢迎拍砖,觉得有意思的可以一起来开发。
- Google国际化语言下拉列表的一个有意思的错误
- 一个非常有意思的在线工具网站(绝对不是广告)
- goagent -- 进行测试开发前必须配置完的一个工具,能正常使用搜索引擎google
- Hadoop是Apache提出的一个软件框架(即:开放源码并行运算编程工具和分布式文件系统,与MapReduce和Google档案系统的概念类似)
- GooglePK,一个无聊又有趣的小工具
- 转一个Google js编译工具
- 哈哈,一个牛人与淘宝很有意思的对话!
- 时间都去哪儿了?开源一个统计iPhone上App运行时间和打开次数的小工具
- TED演讲:给你一个机器替身,会发生哪些有意思的事?
- 使用 XMPP 构建一个基于 web 的通知工具
- C#使用TcpListener及TcpClient开发一个简单的Chat工具实例
- 刚发布了一个“IE脚本辅助”工具。
- 用WPF写了一个QQ空间相册下载工具
- 一个google的面试题 计算两个整数相除
- [python]一个简单的听写练习工具
- gitignore.io ------ 一个根据语言,工具或者平台来智能自动生成gitignore文件的在线工具