您的位置:首页 > 其它

文件处理-智能检测编码的工具(chardet)

2018-02-08 15:39 218 查看

一.chardet使用方法

问:假如你不知道你要处理的文件是什么编码可怎么办呢?

import chardet

f = open('通讯录.txt',mode='rb')
data = f.read()
f.close()

result = chardet.detect(data)
print(result)


输出:

{'encoding': 'GB2312', 'confidence': 0.99, 'language': 'Chinese'}


上述代表此文件是用GB2312编码的,并且是中文,正确的概率是0.99

二.chardet的安装

Linux和Windows下都可以使用pip3来安装(Windows在cmd命令行下)

pip3 install chardet
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: