node.js用get方式获取网页中的链接
2016-03-15 21:13
686 查看
get方式获取网页中的链接
转载自:http://www.9958.pw/post/nodejs_get_html_a
var http = require('http'); //定义函数 var getAHref = function(htmlstr){ var reg = /<a.+?href=('|")?([^'"]+)('|")?(?:\s+|>)/gim; var arr = []; while(tem=reg.exec(htmlstr)){ arr.push(tem[2]); } return arr; } var qHref = "http://xxx";//设置被查询的目标网址 var req = http.get(qHref, function(res) { var pageData = ""; res.setEncoding('utf8'); res.on('error', function (errget) { //出错处理 }); res.on('data', function (chunk) { pageData += chunk; }); res.on('end', function(){ //console.dir(pageData); var content = pageData;//获取到网页内容 var hrefs=getAHref(content);//获取链接 }); });
转载自:http://www.9958.pw/post/nodejs_get_html_a
相关文章推荐
- node.js实现多图片上传
- PostgresXC:从源码编译、安装、配置数据库集群以及用pg_basebackup配置Datanode的热备份
- nodejs 大致学习二 普通的脚本 类似python
- nodejs大致学习
- Nodejs学习笔记(四)与MySQL交互(felixge/node-mysql)
- A1115. Counting Nodes in a BST (30)
- VS轻松开发Node.js应用
- nodejs一些比较实用的命令
- Nodejs Q promise设计思路
- Nodejs "=="与“===”的区别
- 19. Remove Nth Node From End of List
- nodejs中package.json文件模块依赖的版本格式
- Node.js的线程和进程*2014年4月的文章
- Node.js简介和安装
- lintcode: Insert Node in a Binary Search Tree
- LightOJ1094 - Farthest Nodes in a Tree(树的直径)
- GDataXMLNode应用
- nodejs中npm工具自身升级
- Nodejs v4.4.0API文档学习(2)Assert断言测试模块
- 使用rosserial把Arduino作为ROS一个Node遇到的一个问题