一个【nodejs】结合【electron】或【nwjs】的爬虫的新思路
2016-10-19 10:23
691 查看
无意浏览到网上的一个问答,受到启发,记录下来。
***************************************************************************************************************
传统的爬虫是利用一些库模拟http请求,获取响应后,把接收到的“页面”用正则之类的技术,抽取有用信息。
***************************************************************************************************************
问题是我们直接用浏览器多好!!可是普通的浏览器没有强大的系统api支持,归根到底就是没有强大的js本地调用能力。什么技术有呢?对!是nodejs!!
有个集成nodejs环境的浏览器多好!
有吗?
******************************************
当然有!而且有两个Electron和NWJS
******************************************
集成浏览器有什么好处??
前端开发用“选择器”来操作dom,这样你就可以用jQuery之类的东东来抽取dom,然后利用nodejs分析处理或交给其他异构系统处理。
以上说法都是思路,可行性还不知道。
***************************************************************************************************************
传统的爬虫是利用一些库模拟http请求,获取响应后,把接收到的“页面”用正则之类的技术,抽取有用信息。
***************************************************************************************************************
问题是我们直接用浏览器多好!!可是普通的浏览器没有强大的系统api支持,归根到底就是没有强大的js本地调用能力。什么技术有呢?对!是nodejs!!
有个集成nodejs环境的浏览器多好!
有吗?
******************************************
当然有!而且有两个Electron和NWJS
******************************************
集成浏览器有什么好处??
前端开发用“选择器”来操作dom,这样你就可以用jQuery之类的东东来抽取dom,然后利用nodejs分析处理或交给其他异构系统处理。
以上说法都是思路,可行性还不知道。
相关文章推荐
- [Nodejs入门]第四篇,用nodejs实现一个爬虫的功能
- 用nodejs写一个简易小爬虫
- [Nodejs入门]第四篇,用nodejs实现一个爬虫的功能(二)
- 结合nodejs,grunt,seajs及实际产品需要,设计一个简单的前端自动化构建框架
- [分享] 用NodeJs做一个小爬虫,附源码!
- [分享] 用NodeJs做一个小爬虫,附源码!
- 用NodeJs做一个小爬虫
- 基于NodeJs写一个爬虫
- 一个前端攻城狮的全栈之路第一弹:nodejs实现一个简易的爬虫
- 使用nodejs写一个简易的爬虫
- nodejs实现一个简单的爬虫
- Python爬虫从入门到放弃(十一)之 Scrapy框架整体的一个了解
- django学习笔记---结合cookie,onchange事件写出一个分页
- 【转载】【nodeJS爬虫】前端爬虫系列 -- 小爬「博客园」
- nodejs爬虫
- NodeJS基础-9 HTTP小爬虫
- python学习笔记:"爬虫+有道词典"实现一个简单的英译汉程序
- 详解Node.js API系列 Http模块(2) CNodejs爬虫实现
- 简单的Java网络爬虫(获取一个网页中的邮箱)