python学习心得(4)— 并发小米应用商城APK爬取
2017-05-14 14:44
417 查看
前言
上一节中python学习心得(3)— 小米应用商店APK爬取介绍了如何进行爬取APK对应源码为
https://github.com/QyMars/APKSpider/blob/master/XiaomiCrawler.py
并发
单线程的进行下载,效率太低,为了实现并发,使用了Python中的Celery异步任务队列来实现并发源代码
Github:https://github.com/QyMars/APKSpider/blob/master/XiaomiCrawlerWithCelery.py添加Celery
app = Celery('XiaomiCrawlerWithCelery', broker='amqp://localhost')
添加并发方法
@app.task def download(url):
打开RabbitMQ作为消息队列
具体下载和安装请自行百度启动Celery
具体下载和安装请自行百度运行程序
运行程序之后,由于我的电脑是4核,所以当前默认的线程数目为4。开启了4个线程进行下载操作
查看打印信息,可以看到同一时间开启了4个线程执行下载操作
总结
这两个文章主要是熟悉一下Celery框架的实现,想了这么一个点子来实践一下,真正从大量角度而言去爬取的话,完全可以使用Python的scrapy框架来实现。那下一篇就来使用scrapy框架实现小米应用商店的爬虫吧。
相关文章推荐
- python学习心得(3)— 小米应用商店APK爬取
- unix并发技术的学习及在扫描器上的应用二
- 今天开始在这里写学习Python、应用Python的学习笔记
- [Python学习]Unicode及编码处理心得
- 最近在研究enigma2的代码,那叫个庞大,C/C++写中间件,上层应用全部用python实现,可以学习一下plugin的实现机制了.
- python学习的一点心得
- unix并发技术的学习及在扫描器上的应用一
- 总结一下最近 Python 学习心得
- 【学习心得】-括号“()”在输出语句中的应用-1
- 酷易商城开发心得二、缓存应用及个人心得
- 学习python一点心得
- Python学习心得
- ANT应用:copy操作学习心得
- 开始学习PYTHON,希望能在短期内掌握应用
- Python学习笔记【三】Pyhton的HTML应用
- unix并发技术的学习及在扫描器上的应用二
- Spring与Hibernate整合的HibernateDaoSupport应用中的“内存泄露”问题(学习心得)
- 重新学习python线程应用使用thread类,改写程序
- Python学习心得(一)类型
- python 学习心得2011-9-23