【读图】Google 搜索背后的数据
2012-06-17 11:45
393 查看
对于互联网用户来说,搜索是一件非常简单的事情。在搜索框输入关键词,回车(或点击搜索框),等待。而对于搜索公司来说,这是一个复杂的技术问题。从你开始搜索到获得结果的短暂时间里,究竟发生了什么?从Google发给Mashable网站的这幅信息图里,我们可以了解到一些相关的数据。
搜索之前
在你进行搜索之前,Google的搜索爬虫已经走遍了整个网络,它们从一个链接跳到另一个链接,将数据带回Google的服务器。网络就像是一本书,Google的工作就是为图书建立目录。
Google建立的目录,其容量已经超过1亿GB。目前为止,Google已经花费了100万个机器小时来构建目录。
搜索之时
从查询开始到获得结果,搜索查询的平均旅行路程是1500公里。在此过程中,它可能经过全球不同的数据中心。根据Google的说法,1500是一个平均数字,具体到每次搜索产生的路程不会这么长,因为Google总是会寻找最近的数据中心。在用户键入搜索查询的时候,Google就开始提供对查询的预测,以减少键入时间,这就是GoogleInstant。
排名
Google的排序算法会根据200多个信号来决定相关结果。每年,Google对排序算法有500多项改进。这些信号包括:
网页内容的新鲜程度;网站内容的质量;网页的地址和标题;其它网站对某特定站点的链接,以及这些链接的权威性;最好的搜索结果是什么,网页、图片、视频、新闻、个人结果等;网页上的单词;拼写检查;个性化(与你关联的人推荐的结果)。
搜索结果
搜索结果根据相关性排序,同时,Google还提供了网页预览功能。
每天在Google上产生的搜索超过亿次;网页预览的平均加载时间是1/10秒;从2003年以来,Google已经回答了4500亿个新查询;每天都有16%的新查询出现。
文章来源:爱范儿
搜索之前
在你进行搜索之前,Google的搜索爬虫已经走遍了整个网络,它们从一个链接跳到另一个链接,将数据带回Google的服务器。网络就像是一本书,Google的工作就是为图书建立目录。
Google建立的目录,其容量已经超过1亿GB。目前为止,Google已经花费了100万个机器小时来构建目录。
搜索之时
从查询开始到获得结果,搜索查询的平均旅行路程是1500公里。在此过程中,它可能经过全球不同的数据中心。根据Google的说法,1500是一个平均数字,具体到每次搜索产生的路程不会这么长,因为Google总是会寻找最近的数据中心。在用户键入搜索查询的时候,Google就开始提供对查询的预测,以减少键入时间,这就是GoogleInstant。
排名
Google的排序算法会根据200多个信号来决定相关结果。每年,Google对排序算法有500多项改进。这些信号包括:
网页内容的新鲜程度;网站内容的质量;网页的地址和标题;其它网站对某特定站点的链接,以及这些链接的权威性;最好的搜索结果是什么,网页、图片、视频、新闻、个人结果等;网页上的单词;拼写检查;个性化(与你关联的人推荐的结果)。
搜索结果
搜索结果根据相关性排序,同时,Google还提供了网页预览功能。
每天在Google上产生的搜索超过亿次;网页预览的平均加载时间是1/10秒;从2003年以来,Google已经回答了4500亿个新查询;每天都有16%的新查询出现。
文章来源:爱范儿
相关文章推荐
- 透过Google 2012年搜索热词榜看网络关注点的背后!
- 揭秘Google人才选拔机制 大量数据调查背后
- 看图说话,图解 Google 搜索背后的工作原理
- 揭秘Microsoft Bing与Google搜索背后的故事
- Google 搜索背后的工作原理
- Google 搜索背后的工作原理
- 揭秘Microsoft Bing与Google搜索背后的故事
- Google搜索南京大屠杀的谣言背后
- Google搜索南京大屠杀的谣言背后
- Google将通过Gmail、Calendar和Google+数据为用户提供个性化搜索结果
- Google悄悄推行“链接 + 数据" 富内容摘要的搜索结果
- Google要改进OpenOffice 并公布其搜索计算数据中心细节(zz)
- 【读图】Google搜索那些你不知道的事
- [ZZ]世界银行的公开数据已经出现在 Google 搜索结果中
- Google 搜索结果改为每页7条 来自同一域名的结果更多
- Google中文搜索的三大软肋
- Google搜索从入门到精通
- google搜索避免跳转到google hk
- 数据结构与基本算法的学习笔记-顺序搜索-2
- Google揭秘:高流量背后的零宽带费