您的位置：首页 > 编程语言 > Python开发

python爬虫——图片下载

2016-11-15 10:03 363 查看

转载自http://www.cnblogs.com/voidsky/p/5490800.html

原文是在win系统下实现的，在此我在ubuntu14.04中实现了一下：
主要定义了一个脚本picdown.py，并采用re与requests模块实现
picdown.py

#-*- coding:utf-8 -*-
import re
import requests

def picdown():

word = raw_input('Please input keyword:')
url = 'https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word='+word+'&ct=201326592&v=flip'
html = requests.get(url).text

#查找所有以objURL开始的字段，re.S表示让”.”可以匹配换行符，
#不然有些标签头和尾是分几行的，就会匹配失败
pic_url = re.findall('"objURL":"(.*?)",',html,re.S)
i = 0
for each in pic_url:
print each
try:
pic= requests.get(each, timeout=10)#请求超时
except requests.exceptions.ConnectionError:
print '[错误]当前图片无法下载'
continue
string = './picture/'+str(i) + '.jpg'#保存文件在当前目录下的picture文件夹中
fp = open(string,'wb')
fp.write(pic.content)
fp.close()
i += 1

if __name__=='__main__':
picdown()

结果如下：
执行脚本文件，输入刘亦菲；

查看下载的文件

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： python 爬虫 Ubuntu14.04

相关文章推荐

新的分享

章节导航