python实现的入门级别死爬虫
2017-07-20 16:22
309 查看
学习使我快乐。
这几天学了python基本语法,网易云+慕课网,总之就是挑着不要钱的上2333
渣渣做了一个死爬虫,下载某网页上的图片。
炮姐曾经说过:
所以就去了百度贴吧搞点事情,至少不用担心以后头像不够换了不是吗?
这几天学了python基本语法,网易云+慕课网,总之就是挑着不要钱的上2333
渣渣做了一个死爬虫,下载某网页上的图片。
炮姐曾经说过:
所以就去了百度贴吧搞点事情,至少不用担心以后头像不够换了不是吗?
import re import urllib import urllib.request def gethtml(url): #获取网页源代码 web = urllib.request.urlopen(url) html = web.read() return html def getpng(html): reg = r'src="(https://imgsa.baidu.com/forum/w%3D580/.*?\.jpg)' #正则表达式 re1 = re.compile(reg,re.I) x = 1 imglist = re1.findall(html) for imgurl in imglist: urllib.request.urlretrieve(imgurl,'%s.png' %x) #默认保存路径在程序所在位置 x += 1 return imglist website = 'https://tieba.baidu.com/p/4595130275?pn=5' #这是第5页的图片 html = str(gethtml(str(website))) getpng(html)
相关文章推荐
- 入门级别的Python爬虫代码 爬取百度上的图片
- Python入门简单的静态网页爬虫2.0 (实现各模块的具体方法)
- python爬虫入门(博客搬家的实现)
- Python Scrapy爬虫入门 - 使用Crontab实现Scrapy爬虫的定时执行
- Python:入门到实现网络爬虫 Day4 --正则表达式
- Python爬虫从入门到放弃(二十三)之 Scrapy的中间件Downloader Middleware实现User-Agent随机切换
- Python:入门到实现网络爬虫 Day1
- [爬虫入门]Python中使用scrapy框架实现图片爬取
- python3爬虫之入门基础和正则表达式
- Python实现简单的网络爬虫
- python 爬虫入门(5) url异常处理 ; cookie使用 ;cookielib
- python爬虫入门学习
- [置顶] python爬虫实践——零基础快速入门(一)
- Python爬虫入门一之综述
- [Python]网络爬虫(12):爬虫框架Scrapy的第一个爬虫示例入门教程
- Python爬虫实战三之实现山东大学无线网络掉线自动重连
- Python爬虫入门三之Urllib库的基本使用
- 第三百五十节,Python分布式爬虫打造搜索引擎Scrapy精讲—selenium模块是一个python操作浏览器软件的一个模块,可以实现js动态网页请求
- Python爬虫大杀器之Requests快速入门
- Python爬虫框架Scrapy入门