采集练习(四) python 获得hao123导航图片分类下的美女图片
2013-03-08 22:49
477 查看
python实现前几天用php 实现的下载图片功能。
python 版本 2.73
部分代码来自 http://www.php10086.com/2013/01/1278.html
遇到的问题 :
1、采集执行到30页就出错,程序中断 (问题没解决) 我只好采30页;
2、 open 函数打开文件时候 'w' 模式 保存到本地的图片无法打开, 后来 使用 'wb'模式 问题得到解决;
3、 没有后缀的图片,默认加上 .jpg 后缀;
4、获得 json 数据必须 带上 User_Agent Referer 否则无法获得。
以下是代码 :
python 版本 2.73
部分代码来自 http://www.php10086.com/2013/01/1278.html
遇到的问题 :
1、采集执行到30页就出错,程序中断 (问题没解决) 我只好采30页;
2、 open 函数打开文件时候 'w' 模式 保存到本地的图片无法打开, 后来 使用 'wb'模式 问题得到解决;
3、 没有后缀的图片,默认加上 .jpg 后缀;
4、获得 json 数据必须 带上 User_Agent Referer 否则无法获得。
以下是代码 :
# -*- coding: utf-8 -*- import os,json, urllib2, time,socket socket.setdefaulttimeout(10) startTime = time.time() dir = 'D:\python\hao123pic\pic\\' if not os.path.isdir(dir): os.mkdir(dir) j = 1 i = 1 while i < 3: nums = int(time.time()) * 1000 url = 'http://pic.hao123.com/screen/meinv_meinv/'+str(i)+'?v=' + str(nums) + '&act=type' request = urllib2.Request(url) request.add_header('User-Agent', 'Mozilla/5.0') request.add_header('Referer', 'http://pic.hao123.com/meinv_meinv?style=xl') opener = urllib2.build_opener() data = opener.open(request).read() jsonData = json.loads(data) for n in jsonData: if n['picurl_orig']: req = urllib2.Request(n['picurl_orig']) imgData = urllib2.urlopen(req).read() imageName = dir + os.path.basename(n['picurl_orig']) ext = imageName.split('.') if len(ext)<2: imageName = imageName+'.jpg' file_object = open(imageName, 'wb') file_object.write(imgData) file_object.close() print('img %s_%s is ok' % (i, j)) j += 1 else: endTime = time.time() print(endTime - startTime) i += 1 endTime = time.time() print(endTime - startTime)
相关文章推荐
- 采集练习(二) php 获得hao123导航图片分类下的美女图片
- 采集练习(五) php 获得chrome扩展 微度新标签页 下的云壁纸(主要是美女壁纸)
- 使用locals()获得类,进行分发 分类: python 小练习 divide into python python基础学习 2014-02-21 14:51 217人阅读 评论(0) 收藏
- 采集练习(六) python获得chrome扩展 微度新标签页 下的云壁纸
- #小练习 类与继承 分类: python 小练习 2013-04-26 15:27 175人阅读 评论(0) 收藏
- Caffe——python接口学习(6):用训练好的模型来分类新的图片
- caffe的python接口学习(6):用训练好的模型(caffemodel)来分类新的图片
- [练习] 用PYTHON来优化网站中的图片
- python爬取美女图片
- HTMLParser解析网页,提取链接地址、标题名称,并插入数据库 分类: python 小练习 HTMLParser 2014-02-19 09:57 519人阅读 评论(0) 收藏
- Python 简单爬虫--获得网上的图片
- winform采集网站美女图片程序---多线程篇
- Python爬淘宝美女图片
- magento 获得子分类的链接,名称和图片
- Python爬虫学习之爬美女图片
- Python3爬虫爬取某网站美女图片
- #小练习 使用正则抓取oschina博客专区首页数据 分类: python 小练习 正则表达式 2013-11-11 17:22 604人阅读 评论(0) 收藏
- Python小练习-采集天气预报
- python爬取网易美女图片
- #小练习 HTMLParser 分类: python 小练习 python 2013-06-03 15:54 162人阅读 评论(0) 收藏