您的位置:首页 > 编程语言 > Python开发

使用python将豆瓣妹子的图片批量搬运到百度网盘

2014-12-11 14:42 507 查看
首先到这里按照百度pcs服务的要求获取一个access_token,使用文件上传接口时需要使用。
接下来就可以一步一步写代码了。
首先是conf.py文件,主要是配置一些会用到的参数

api_url=u'https://pcs.baidu.com/rest/2.0/pcs/file'
method=u'upload'
path=u'/apps/pcstest_oauth/pic2'
access_token=u'23.1c19e723c137c6f137ff1f625fa0aaa4.2592000.1414472077.328831-238347'
api_url是百度接口地址,method是需要接口执行的操作方法,path是自己网盘的一个目录,图片将会被传到这个目录下。access_token就是之前你获得的授权值

#encoding:utf-8
import urllib,re,time
from conf import api_url,method,access_token,path
import requests#该模块用来完成上传文件
num=0
def getURL(n):#解析页面所有妹子图片地址链接,返回包含链接的一个列表
url=urllib.urlopen('http://www.dbmeizi.com/category/2?p=%d'%n)
data=url.read()
r=re.compile(r'http://pic.dbmeizi.com/npics/[a-z0-9-]{3}/[a-z0-9-]{3}/s_p[0-9]{8}.jpg')#用于匹配的正则表达式
pic=r.findall(data)
return pic
def upload(data):#模拟一个post请求完成图片上传
files = {'file': data2}
print path+'/meizhi%d.jpg'%num
params={
'method':method,
'path':path+'/meizhi%d.jpg'%num,
'access_token':access_token,
}
url='%s?%s' % (api_url, urllib.urlencode(params))
print url
response=requests.post(url,files=files)
print response.text

for page in range(1,300):
girl=getURL(page)#
print girl
for g in girl:
url2=urllib.urlopen(g)
data2=url2.read()#将图片下载到内存
upload(data2)#upload to pcs
print num
num=num+1
time.sleep(0.1) #每100ms搬运一张
print 'end'
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息