用Wget下载整个网站
2015-09-27 19:01
651 查看
原文地址:
http://www.linuxjournal.com/content/downloading-entire-web-site-wget
也许你曾需要下载整个站点,比如是想离线浏览其内容,wget可以完成这项工作。比如:
这条命令将把站点www.website.org/tutorials/html全部下载下来。
命令解释:
--recursive 递归下载整个站点
--no-clobber 不要覆盖已有文件(以防下载被中断而重新开始)
--domains website.org 不要下载website.org以外的链接地址
--no-parent 不要下载tutorials/html目录之外的内容
--page-requisites 下载所有页面需要的元素(图像、CSS等等)
--html-extention 只下载html相关的文件
--convert-links 转换链接地址,从而本地离线可以正常访问
--restrict-file-names=windows 修改文件名以使文件也可以在windows下访问(某些情况文件名在Linux下合法而在windows下非法)。
http://www.linuxjournal.com/content/downloading-entire-web-site-wget
也许你曾需要下载整个站点,比如是想离线浏览其内容,wget可以完成这项工作。比如:
$ wget \ --recursive \ --no-clobber \ --page-requisites \ --html-extension \ --convert-links \ --restrict-file-names=windows \ --domains website.org \ --no-parent \ www.website.org/tutorials/html/
这条命令将把站点www.website.org/tutorials/html全部下载下来。
命令解释:
--recursive 递归下载整个站点
--no-clobber 不要覆盖已有文件(以防下载被中断而重新开始)
--domains website.org 不要下载website.org以外的链接地址
--no-parent 不要下载tutorials/html目录之外的内容
--page-requisites 下载所有页面需要的元素(图像、CSS等等)
--html-extention 只下载html相关的文件
--convert-links 转换链接地址,从而本地离线可以正常访问
--restrict-file-names=windows 修改文件名以使文件也可以在windows下访问(某些情况文件名在Linux下合法而在windows下非法)。
相关文章推荐
- 一个分布式服务器集群架构方案
- 网站智能客服--图灵机器人接入方式
- 浩杰兄给的好网站链接,收藏收藏
- 实战MHA部署、高可用测试
- Openstack 概念架构详解
- 取经之路------浅谈C/S与B/S架构模型
- JS+CSS实现的日本门户网站经典选项卡导航效果
- WEB网站常见的攻击方法总结与原理分析
- datasheet下载网站 tps65951中文版手册
- Microservice架构模式简介
- 网站目录文件权限的简单安全设置
- Ubuntu搭建网站环境
- JS+CSS实现的日本门户网站经典选项卡导航效果
- 软件架构设计系列总结
- 【转】电子商务网站测试经验总结
- 各大音乐网站接口
- 非英文[字符]在网站上不能正常显示
- 用php代码限制国内IP访问我们网站
- 单服务器发布多网站的问题
- 从DRP架构进行简单工厂代替抽象工厂的SWOT分析