您的位置：首页 > 编程语言 > Python开发

python 多网站采集，解决编码问题

2017-05-22 14:13 393 查看

import chardet

def get_charset(str):
return chardet.detect(str)['encoding']

html = '' # bytes 字节串
charset = get_charset(html)
decoded_html = html.decode(charset, 'ignore')
print(decoded_html)

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

python utf编码(\u5029\u5973\u5e7d\u9b42)的奇怪问题与解决
python与sqlite处理中文字符时出现的编码错误问题解决
关于python3里gbk编码的问题解决
简单解决Python文件中文编码问题
python操作Mysql入库,编码(乱码问题)解决
python常见编码问题解决方法
多语言版本网站的语言编码问题的解决办法
Python文件读取编码错误问题解决之（PyCharm开发工具默认设置的坑。。。）
python编码与mysql中文乱码问题的解决
简单解决Python文件中文编码问题
使用ping机制解决原创文章被高权重采集网站优先收录问题
Python2.7.6解决编码问题
Python解决文件编码问题
解决Python代码编码问题 SyntaxError: Non-UTF-8 code starting with '\xc1'
pycharm中python编码问题解决
转：解决Python中文编码问题
paip.日志中文编码原理问题本质解决python
Python连接mssql数据库编码问题解决方法
网站开发中常见的编码和乱码问题的解决
Python2.x版本中基本的中文编码问题解决

新的分享

#新闻拍一拍# 微软推出 Pylance，改善 VS Code 中的 Python 体验
跟我学Python图像处理丨5种图像阈值化处理及算法对比
基于Python设计一个具有基本功能的通讯录
liunx上升级python2至python3
es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
python常用标准库（时间模块time和datetime）
python之logging日志
python之configparser类的使用
Python常用标准库（pickle序列化和JSON序列化）
MySQL（12） - Python+MySQL读取写入图片
MySQL（11） - Python+MySQL开发新闻管理系统
Python 什么是flask框架？快速入门(flask安装，登录，新手三件套，登录认证装饰器，配置文件，路由系统，CBV)

章节导航