python成长日记1:使用python访问网站,下载图片
2013-07-23 00:06
721 查看
用最简单的语句,实现最实用的功能
一起学习PYTHON@小脸龙
工作了三个月,终于收拾了一下自己的懒劲,甩掉一大堆的理由,再次分享自己的学习心得,开个专题,和大家一起学python,收罗最简单的命令,实现最实用的功能,本人初学者,如有谬误望多多指正。
介绍一下开发环境:Ubuntu 11.04 , Sublime2 , Python2.7
涉及到的库: os , urllib
当然,os库还有很多,具体可以参看Python Docs 上述是可能需要的几个API
目标:找个动漫网站去下一本漫画书
实现:
1 首先,找一个漫画网站,确定可以找到图片的链接,并不容易,现在很多都没有将图片地址写在代码里。通过谷歌图片着,还是被我找到一个:_Vol_1/1.jpg]http://www.acmoe.com/comicdata/2943/%E6%9C%AA%E5%A9%9A%E5%85%B3%E7%B3%BB[%E9%9D%92%E5%87%BA%E4%BA%8E%E8%93%9D]_Vol_1/1.jpg
也就是说,到时候就把第一卷全部下下来。
2 还有就是要考虑404错误,一卷的数量是有限的,超过会报404,因此要加入错误处理
3 上代码:
4 测试
python downloadCartoon.py http://www.acmoe.com/comicdata/2943/%E6%9C%AA%E5%A9%9A%E5%85%B3%E7%B3%BB[%E9%9D%92%E5%87%BA%E4%BA%8E%E8%93%9D]_Vol_1/ ./ vol1
![](http://img.blog.csdn.net/20130723000215968?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvQ0FaSUNBUVVX/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
好啦,福利拿好 ,收工睡觉,明天有时间再尝试下载在线小说,为宅男创造福利啦
一起学习PYTHON@小脸龙
工作了三个月,终于收拾了一下自己的懒劲,甩掉一大堆的理由,再次分享自己的学习心得,开个专题,和大家一起学python,收罗最简单的命令,实现最实用的功能,本人初学者,如有谬误望多多指正。
介绍一下开发环境:Ubuntu 11.04 , Sublime2 , Python2.7
涉及到的库: os , urllib
import os os.listdir('./') #显示'./'当前路径下的文件与文件夹 os.chdir('/home') #切换路径至home目录 os.getcwd() #获取当前路径
当然,os库还有很多,具体可以参看Python Docs 上述是可能需要的几个API
import urlib ufile = urllib.urlopen(url) # 获取一个网络连接对象 info = ufile.info() # url 内容相关的meta-info if info.gettype() == 'text/html': #获取网站相应类型内容 urlhandler= urllib.URLopener() #创建一个urlopen实例 urlhandler.retrieve(url,filename); #获取url并保存为filename返回
目标:找个动漫网站去下一本漫画书
实现:
1 首先,找一个漫画网站,确定可以找到图片的链接,并不容易,现在很多都没有将图片地址写在代码里。通过谷歌图片着,还是被我找到一个:_Vol_1/1.jpg]http://www.acmoe.com/comicdata/2943/%E6%9C%AA%E5%A9%9A%E5%85%B3%E7%B3%BB[%E9%9D%92%E5%87%BA%E4%BA%8E%E8%93%9D]_Vol_1/1.jpg
也就是说,到时候就把第一卷全部下下来。
2 还有就是要考虑404错误,一卷的数量是有限的,超过会报404,因此要加入错误处理
3 上代码:
import sys import os import urllib def downloadCatoon(url,dir,vol,catoontype='jpg'): VolMax = 200 #最大页数 catoonnum = 1 os.chdir(dir)#移至dir目录下 os.mkdir(vol)#创建vol1 ,2 ,... os.chdir(os.path.join(dir, vol)) #进入该目录 for i in range(VolMax): image = urllib.URLopener() catoonname = str(catoonnum + i) + '.' + catoontype try: image.retrieve(url + catoonname, catoonname) pass except IOError: #当遇到错误。 print 'job done' break def main(): args = sys.argv[1:] downloadCatoon(args[0], args[1], args[2]) if __name__ == '__main__': main()
4 测试
python downloadCartoon.py http://www.acmoe.com/comicdata/2943/%E6%9C%AA%E5%A9%9A%E5%85%B3%E7%B3%BB[%E9%9D%92%E5%87%BA%E4%BA%8E%E8%93%9D]_Vol_1/ ./ vol1
好啦,福利拿好 ,收工睡觉,明天有时间再尝试下载在线小说,为宅男创造福利啦
相关文章推荐
- python中使用urllib下载网站图片
- 使用python进行爬虫下载指定网站的图片
- 使用http协议访问遍历访问下载网站的所有图片
- python抓取网站的图片并下载到本地
- 使用python来批量抓取网站图片
- selenium之python自动化测试系列:使用chrome或firefox的已存在的cookie访问网站
- 使用python抓取网站代码,并下载里面的url
- 用python下载xxxx网站封面作品的所有图片
- Node.js 使用http客户端得到网站的图片下载到本地
- Python使用代理抓取网站图片(多线程)
- 使用Python获取网站的图片(2.7和3版本)
- Python---对html文件内容进行搜索取出特定URL地址字符串,保存成列表,并使用每个url下载图片,并保存到硬盘上,使用正则re
- python3使用多代理访问网站
- 使用python下载图片
- 使用python爬下了某网站的图片
- python中使用网络爬虫下载图片
- Web Scraping with Python: 使用 Python 下载 CSDN 博客图片
- Python爬虫下载网站上的图片到本地
- Python轻松入门-38 从网站上下载图片
- Python+selenium实现图片网站搜索后下载搜索结果的全部照片