wget 网页爬虫,网页抓取工具
2017-11-08 21:33
288 查看
前言
如何在linux上或者是mac上简单使用爬虫或者是网页下载工具呢,常规的我们肯定是要去下载一个软件下来使用啦,可怜的这两个系统总是找不到相应的工具,这时wget出来帮助你啦!!!wget本身是拿来下载东西的,但远不止那么强大,是一把强大利器。
使用指南
快速上手(整个bootstrap网页全被你抓取下来了~_~)wget -c -r -npH -k http://v4.bootcss.com[/code]1
参数说明
-c:断点续传
-r:递归下载
-np:递归下载时不搜索上层目录
-nd:递归下载时不创建一层一层的目录,把所有文件下载当前文件夹中
-p:下载网页所需要的所有文件(图片,样式,js文件等)
-H:当递归时是转到外部主机下载图片或链接
-k:将绝对链接转换为相对链接,这样就可以在本地脱机浏览网页了
相关文章推荐
- wget 网页爬虫,网页抓取工具
- 使用wget工具抓取网页和图片
- 用wget命令的爬虫功能抓取网页到本地文件,然后用grep命令分析文件。
- 使用wget工具抓取网页和图片 成功尝试
- 使用wget工具抓取网页和图片
- 使用wget工具抓取网页和图片 及 相关工具几个
- 爬虫尝试抓取动态网页
- 爬虫技术(2)--抓取网页java代码实现
- Java爬虫——phantomjs抓取ajax动态加载网页
- python爬虫实践之网页抓取
- 爬虫 Http请求,urllib2获取数据,第三方库requests获取数据,BeautifulSoup处理数据,使用Chrome浏览器开发者工具显示检查网页源代码,json模块的dumps,loads,dump,load方法介绍
- JAVA使用爬虫抓取网站网页内容
- C# 使用 Abot 实现 爬虫 抓取网页信息 源码下载
- 浅谈屏蔽搜索引擎爬虫(蜘蛛)抓取/索引/收录网页的几种思路
- python爬虫抓取目标网页链接
- 发布一个抓取链接到的网页上图片的小工具
- 【Java Utility】Jsoup网页爬虫工具-使用选择器查找元素【八】
- Linux 抓取网页方式(curl+wget) .
- java 抓取网页内容小工具