Python 网络爬虫-下载图片
2015-01-19 13:22
295 查看
#!/usr/bin/python #-*- coidng:UTF-8-*- ''' Created on 2015-1-19 @author: huangpeng03 ''' #coding=utf-8 import urllib import re def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): reg = r'src="(.+?\.jpg)" pic_ext' imgre = re.compile(reg) imglist = re.findall(imgre,html) x = 0 for imgurl in imglist: urllib.urlretrieve(imgurl,'%s.jpg' % x) x+=1 html = getHtml("http://tieba.baidu.com/p/2460150866") print getImg(html)
默认下载路径是工程目录
.+? 是懒惰模式匹配 .+的意思是.至少含有一个,加个问号表示匹配成功一次后就不往后走了
相关文章推荐
- Python网络爬虫 - 下载图片
- Python 实现的下载op海贼王网的图片(网络爬虫)
- Python 实现的下载op海贼王网的图片(网络爬虫)
- Python 爬某个网站下载图片
- python下载文件(图片)源码,包含爬网内容(爬url),可保存cookie
- python下载图片(2)
- python 通过google搜索图片并下载
- python下载图片并查看图片宽度和高度
- python网络爬虫抓取图片
- python 下载图片
- python下载文件(图片)源码,包含爬网内容(爬url),可保存cookie
- 随便写的一个python小程序,从网页中下载图片
- python下载图片
- python下载图片(3)
- python 从姐脱吧下载妹子图片
- python成长日记1:使用python访问网站,下载图片
- python多线程下载图片
- python下载图片(3)
- python下载图片(3)
- python-urllib模块【下载图片】