文件处理-智能检测编码的工具(chardet)
2018-02-08 15:39
218 查看
一.chardet使用方法
问:假如你不知道你要处理的文件是什么编码可怎么办呢?import chardet f = open('通讯录.txt',mode='rb') data = f.read() f.close() result = chardet.detect(data) print(result)
输出:
{'encoding': 'GB2312', 'confidence': 0.99, 'language': 'Chinese'}
上述代表此文件是用GB2312编码的,并且是中文,正确的概率是0.99
二.chardet的安装
Linux和Windows下都可以使用pip3来安装(Windows在cmd命令行下)pip3 install chardet
相关文章推荐
- 检测视频文件编码方式的工具和一些基本常识
- enca工具,检测文件编码
- chardet 用来实现字符串/文件编码检测模板
- juniversalchardet 文本编码检测工具
- python2.7:文件编码检测chardet 详解
- python3----智能检测编码的工具
- 文件编码自动检测转换工具file-convert,解决乱码问题
- 文件编码自动检测转换工具file-convert,解决乱码问题
- 批量编码转化工具(实现文件编码的自动检测)
- python文件处理,b模式的读写,rb, wb,编码的两种方式
- 文件(XML)解析处理工具类
- Python基础 检测多种语言编码 chardet
- 自动检测TXT文件编码
- WebP 文件及其编码解码工具(WebPconv)
- UNIX 处理目标文件的工具
- python 检测文件编码等
- 处理日志小工具:GetFromFile快速从日志大文件中找到想要的报错信息
- Linux工具开发[02]---编程实现对输入字符序列变换(编码/加密/散列)方式的智能判定
- 文件/目录部分处理工具类 DealDir.java
- 正确处理浏览器在下载文件时HTTP头的编码问题(Content-Disposition)