您的位置:首页 > 编程语言 > Python开发

python基础===获取知乎标题时候,文件编码失败的总结

2017-10-26 16:37 501 查看

总结一下,关于获取到的信息编码失败。

刚才在执行代码的时候,发现一个问题:

 

然后修改代码如下:

'''
爬取知乎界面的标题
'''

import requests import re import sys import io sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030') #改变标准输出的默认编码 headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36' } r = requests.get("https://www.zhihu.com/explore",headers = headers) print(r.text) #正则表达式找标题 pattern = re.compile('data-za-element-name="Title">(.*?)</a>', re.S) titles = re.findall(pattern, r.text) print(titles)

 执行成功:

 

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐