Python3.X Windows平台 安装BeautifulSoup4
2017-07-03 10:40
232 查看
1、安装BeautifulSoup4
打开cmd,运行pip install BeautifulSoup4
2、安装lxml
在Windows下,安装lxml费了一点劲儿,不能直接通过命令成功安装。首先,查看我们的平台依赖的工具版本:
然后,去官网下载对应的.whl文件。官网地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml
Ctrl + F,输入lxml,找到下面这段:
Lxml, a binding for the libxml2 and libxslt libraries.
lxml‑3.7.3‑cp27‑cp27m‑win32.whl
lxml‑3.7.3‑cp27‑cp27m‑win_amd64.whl
lxml‑3.7.3‑cp34‑cp34m‑win32.whl
lxml‑3.7.3‑cp34‑cp34m‑win_amd64.whl
lxml‑3.7.3‑cp35‑cp35m‑win32.whl
lxml‑3.7.3‑cp35‑cp35m‑win_amd64.whl
lxml‑3.7.3‑cp36‑cp36m‑win32.whl
lxml‑3.7.3‑cp36‑cp36m‑win_amd64.whl
cp后面是Python的版本号,36表示3.6,根据你的Python版本选择下载。
最后进行安装,打开cmd,先运行pip install wheel 安装wheel工具,做好准备工作。
接着运行pip install *.whl文件,我的对应版本为lxml-3.7.3-cp36-cp36m-win_amd64.whl即可成功安装lxml解析器。
3、使用BeautifulSoup4
下面的https://movie.douban.com/网址为豆瓣电影地址所实现的功能是爬取页面所有电影的名字。
#!/usr/bin/python # -*- coding: UTF-8 -*- from urllib.request import urlopen from bs4 importBeautifulSoup html= urlopen("https://movie.douban.com/") # 将html对象转化为BeautifulSoup对象 bsObj= BeautifulSoup(html,"lxml") # 找到所有符合此class属性的li标签 liList= bsObj.findAll("li",{"class":"title"}) for li inliList: #获取标签<a>中文字 name= li.a.get_text() print(name)
运行结果:
相关文章推荐
- android平台安装python步骤
- 基于eclipse的python开发平台的安装配置和代码编写环境主题设置
- Windows平台 python 常用包的安装
- 【Python】学习selenium自动化测试:安装selenium+启动浏览器(windows平台、Linux Centos平台)
- AIX平台安装python
- centos64位,apache2,python2.5,django,mod_python平台安装配置。
- 在Window平台下安装xgboost的Python版本
- Python windows 平台下安装BeautifulSoup
- Windows平台Python的一些外部模块的安装
- 在Window平台下安装xgboost的Python版本
- 如何在64位的windows平台上安装需要c编译的python扩展库
- python tornado window 平台安装
- python-安装-linux平台安装方法
- Linux平台下Python的安装及IDE开发环境搭建
- windows平台下安装python的setuptools工具
- Android平台安装python步骤
- python tornado window 平台安装
- windows平台下安装python的setuptools工具
- windows平台如何安装Python和pip
- 在 windows 平台安装 opencv 和 python 联调