您的位置:首页 > 编程语言 > Python开发

python爬虫——BeautifulSoup 抓取图片

2017-08-22 11:25 459 查看
python 利用BeautifulSoup 抓取图片

# -*- coding: utf-8 -*-
"""

"""
import urllib
from bs4 import BeautifulSoup
#beautifulsoup方法,第三方库的方法,爬找网页
## 下载网页
def get_content(url):
'''
@url:需要下载的网址
下载网址
'''
html = urllib.request.urlopen(url)
content = html.read().decode('utf-8')#转码
html.close()#记得要将打开的网页关闭,否则会出现意想不到的问题
#    print (type(content))
return content

def get_image(info):
'''
利用Soup第三方库实现抓取
'''
soup = BeautifulSoup(info,'html.parser')#设置解析器为“lxml”
all_image = soup.find_all('img',class_ = "BDE_Image")
x=1
for image in all_image:
print(all_image)
urllib.request.urlretrieve(image['src'],"E:\\WORK\\py\\TensorFlow\\爬取树叶图片\\BS-Soup\\%s.jpg"%(x))
x+=1

url = "https://tieba.baidu.com/p/5114003992"
info = get_content(url)
#print (info)
get_image(info)


内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  python