python 多网站采集,解决编码问题
2017-05-22 14:13
393 查看
import chardet def get_charset(str): return chardet.detect(str)['encoding'] html = '' # bytes 字节串 charset = get_charset(html) decoded_html = html.decode(charset, 'ignore') print(decoded_html)
相关文章推荐
- python utf编码(\u5029\u5973\u5e7d\u9b42)的奇怪问题与解决
- python与sqlite处理中文字符时出现的编码错误问题解决
- 关于python3里gbk编码的问题解决
- 简单解决Python文件中文编码问题
- python操作Mysql入库,编码(乱码问题)解决
- python常见编码问题解决方法
- 多语言版本网站的语言编码问题的解决办法
- Python文件读取编码错误问题解决之(PyCharm开发工具默认设置的坑。。。)
- python编码与mysql中文乱码问题的解决
- 简单解决Python文件中文编码问题
- 使用ping机制解决原创文章被高权重采集网站优先收录问题
- Python2.7.6解决编码问题
- Python解决文件编码问题
- 解决Python代码编码问题 SyntaxError: Non-UTF-8 code starting with '\xc1'
- pycharm中python编码问题解决
- 转:解决Python中文编码问题
- paip.日志中文编码原理问题本质解决python
- Python连接mssql数据库编码问题解决方法
- 网站开发中常见的编码和乱码问题的解决
- Python2.x版本中基本的中文编码问题解决