Python保存一个网页的全部内容(包含链接内的图片等等)
2013-01-01 16:34
696 查看
编程过程中遇到一个问题,urllib.urlretrieve()获取的网页是htm格式,不包含网页中链接的图片。
Google了一下,找到了解决办法。
采用mht格式可以解决问题,或者调用IE来保存
ChilkatPython 官网地址 http://www.chilkatsoft.com/python.asp
搞了半天没找到官方文档,只有上网了,http://www.example-code.com/python/default.asp
这个包的功能真是强大,不过只有30天试用期,然而高手已破
请看下篇文章
下载一个chilkatPython 模块
直接下载保存为文件格式为 MHT格式就好了 真个网页直接保存了 非常好用
Windows下用win32com调用IE保存为 .mht
这两种方法应该都可以 不过用 chilkatPython更简单吧 示例代码都有
Google了一下,找到了解决办法。
采用mht格式可以解决问题,或者调用IE来保存
ChilkatPython 官网地址 http://www.chilkatsoft.com/python.asp
搞了半天没找到官方文档,只有上网了,http://www.example-code.com/python/default.asp
这个包的功能真是强大,不过只有30天试用期,然而高手已破
请看下篇文章
下载一个chilkatPython 模块
直接下载保存为文件格式为 MHT格式就好了 真个网页直接保存了 非常好用
Windows下用win32com调用IE保存为 .mht
这两种方法应该都可以 不过用 chilkatPython更简单吧 示例代码都有
相关文章推荐
- 自动保存某页面包含的每个链接页面的全部内容
- selenium,phantomJS,python整合的一个小示例,把某个网页画面整体保存成图片格式。
- python学习 二 02 爬一个图片网站,获得主链接网址,并保存
- python下载文件(图片)源码,包含爬网内容(爬url),可保存cookie
- 网络爬虫,用C#做一个网络爬虫demo,功能有保存网页、图片、js文件、等等其他的文件。有界面显示,有代码注释。
- 谷歌浏览器怎样把网页全部内容保存为一个文件
- python下载文件(图片)源码,包含爬网内容(爬url),可保存cookie
- Python 网络爬虫 009 (编程) 通过正则表达式来获取一个网页中的所有的URL链接,并下载这些URL链接的源代码
- python连续爬取多个网页的图片分别保存到不同的文件夹
- python3 保存一个网页为html文件
- Python 保存 网页上的图片
- PHP抓取网页内容,获取链接绝对路径和图片绝对路径
- Python---对html文件内容进行搜索取出特定URL地址字符串,保存成列表,并使用每个url下载图片,并保存到硬盘上,使用正则re
- python 解析网页,将抓取到的图片保存到本地
- ASP获取网页全部图片地址并保存为数组的正则
- 一个WinForm记事本程序(包含主/下拉/弹出菜单/打开文件/保存文件/打印/页面设置/字体/颜色对话框/剪切版操作等等控件用法以及记事本菜单事件/按键事件的具体代码)
- 用Python写一个网络爬虫爬取网页中的图片
- python连续爬取多个网页的图片分别保存到不同的文件夹
- python 网页抓取并保存图片
- 将Memo中的文字内容生成一个Jpeg图片进行保存!