【Python】beautifusoup解析HTML并将数据写入文件
2017-09-27 21:59
639 查看
Python版本:3.6
IDE:PyCharm
1.解析HTML(这里以www.baidu.com为例)
如果我们使用w打开文件,那么soup.text是可以写入的,但是会出现乱码现象,这是因为soup无编码!!!
3.w方式写入文件
问题
如果你出现了如下问题,
这是文件的编码问题,解决方法如下
好了,解决了上述问题后,文件就正常写入了,之后我们打开文件
![](https://img-blog.csdn.net/20170927224148047?watermar<br/>4000<br/>k/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvTG9saXRhUQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
文件写入成功!!!
IDE:PyCharm
1.解析HTML(这里以www.baidu.com为例)
headers = { 'Connection': 'Keep-Alive', 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.101 Safari/537.36' } soup = BeautifulSoup(requests.get("https://www.baidu.com/",headers=headers).content,'lxml')2.wb方式写入文件
# saveFile:将数据保存为文件 # @param data def saveFile(data): save_path = 'E:\PythonProject/reptile.html' f_obj = open(save_path, 'wb') # wb 表示打开方式,也可用w f_obj.write(data) f_obj.close() saveFile(soup.encode('utf-8')) # 对soup进行了编码处理!!!这里对soup进行了编码处理,因为我们当前是用wb进行打开的,所以不进行编码处理通不过编译;
如果我们使用w打开文件,那么soup.text是可以写入的,但是会出现乱码现象,这是因为soup无编码!!!
3.w方式写入文件
# saveFile:将数据保存为文件 # @param data def saveFile(data): save_path = 'E:\PythonProject/reptile.html' f_obj = open(save_path, 'w') # w 表示打开方式,也可用wb f_obj.write(data) f_obj.close() saveFile(soup.text) # 无编码处理
问题
如果你出现了如下问题,
UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 21475: illegal multibyte sequence
这是文件的编码问题,解决方法如下
f_obj = open(save_path, 'w', encoding="utf-8") # 打开文件时将文件编码设置为utf-8(或者其他...)
好了,解决了上述问题后,文件就正常写入了,之后我们打开文件
文件写入成功!!!
相关文章推荐
- Python 获取接口数据,解析JSON,写入文件
- Python 获取接口数据,解析JSON,写入文件
- 为什么可以把未提交的数据写入数据文件?——通过DML操作举例解析
- Python 解析 html 文件
- 如何用idapython脚本获取字符串窗口的数据并写入文件
- python解析html提取数据,并生成word文档
- python 在excel文件中写入date日期数据,以及读取excel日期数据,如何在python中正确显示date日期。
- python抓取某汽车网数据解析html存入excel示例
- Python中,添加写入数据到已经存在的Excel的xls文件,即打开excel文件,写入新数据
- python 文件处理模块的使用,给一个文件写入数据
- python 小实例5 创建文件,并写入数据:要求不能与现存系统文件重名
- 读取网页上的Html源码中指定的数据写入文件
- 转:Python网页解析:BeautifulSoup vs lxml.html
- Python写入数据到MP3文件中的方法
- python从oracle读取数据写入到文件里
- Head First Python 学习笔记-Chapter4:持久化--将数据写入文件
- python 解析html 时lxml跟beautifulSoup对比
- Python写入数据到MP3文件中的方法
- 【整理】Python中,添加写入数据到已经存在的Excel的xls文件,即打开excel文件,写入新数据
- python 解析html之BeautifulSoup