[IT动态]谷歌爬虫可理解JS代码:更好解析富媒体
2010-06-29 09:20
423 查看
Google 数以亿计的爬虫们每天都在以光速索引着互联网上的信息,以便我们能通过Google搜索到最新的内容。最近Google的发言人告诉福布斯说他们的爬虫现在可以跟JavaScript做深入互动了,它们甚至可以理解JavaScript代码,这将使Google可以索引到更丰富的内容。
让一个程序理解JavaScript并不是一件简单的事,没有哪种算法可以应用到任何程序上,在任何点,告诉你这个程序是否可以继续无限循环下去,然而如果Google的爬虫可以处理JavaScript,他们就必须解决这种困难。
Google爬虫变得越来越快越来越聪明还要感谢新的Caffeine(咖啡因)系统,正是这个新系统使得Google爬虫具备了理解甚至处理代码的能力,以更好的解析富媒体。
让一个程序理解JavaScript并不是一件简单的事,没有哪种算法可以应用到任何程序上,在任何点,告诉你这个程序是否可以继续无限循环下去,然而如果Google的爬虫可以处理JavaScript,他们就必须解决这种困难。
Google爬虫变得越来越快越来越聪明还要感谢新的Caffeine(咖啡因)系统,正是这个新系统使得Google爬虫具备了理解甚至处理代码的能力,以更好的解析富媒体。
相关文章推荐
- [IT动态]谷歌爬虫可理解JS代码:更好解析富媒体
- 深入彻底理解原生js的作用域、作用域链(以及浏览器是怎样解析js代码的)
- 如何更好的理解js中的this,分享2段有意思的代码
- 通过代码组织,让你更好的理解和使用JDK动态代理
- JS 动态添加列表框项效果代码
- JS动态修改页面EasyUI datebox不生效、EasyUI动态添加Class、EasyUI动态渲染解析解决方案
- jQuery解析XML文件同时动态增加js文件
- JS动态的把左边列表添加到右边的实现代码(可上下移动)
- JS动态添加与删除select中的Option对象(示例代码)
- 动态控制Table的js代码
- JS动态添加option和删除option(附实例代码)
- js深入研究之无法理解的js类代码,extend扩展
- JS提交并解析后台返回的XML的代码
- 分析一段JS 动态织入代码
- Native JsBridge源码解析 深入理解JsBridge
- JS解析XML的实现代码
- 理解Node.js的事件循环(代码是异步单线程,内部实现用的还是进程和线程,基于池化的线程实现异步)
- JS动态修改页面EasyUI datebox不生效、EasyUI动态添加Class、EasyUI动态渲染解析解决方案
- JS通过ajax方式从数据库动态获取数据的代码
- JS代码将GPRS坐标/谷歌坐标转换为百度坐标