判断一个标准文本文件的编码方式
2011-10-26 19:32
381 查看
当一个软件打开一个文本时,它要做的第一件事是决定这个文本究竟是使用哪种字符集的哪种编码保存的。
软件一般采用三种方式来决定文本的字符集和编码:
检测文件头标识,提示用户选择,根据一定的规则猜测
最标准的途径是检测文本最开头的几个字节,开头字节 Charset/encoding,如下表:
EF BB BF | UTF-8 |
FE FF | UTF-16/UCS-2, little endian |
FF FE | UTF-16/UCS-2, big endian |
FF FE 00 00 | UTF-32/UCS-4, little endian. |
00 00 FE FF | UTF-32/UCS-4, big-endian. |
如果开头两个字节是0xFFFE,那么就是Unicode,否则是ANSI。
相关文章推荐
- [转]在C#中判断一个文本文件的编码方式
- NET中判断一个文本文件的编码方式
- 判断一个文本文件的编码方式
- 文本文件的编码方式判断
- 一个判断文本文件编码的类.txt
- 判断一个文本文件的编码格式
- 判断一个文本文件的编码格式(转)
- 判断一个文本文件的编码格式
- [No000040]取得一个文本文件的编码方式
- 判断一个文本文件的编码格式
- 判断一个文本文件的编码格式
- 判断一个文本文件的编码格式
- C# 用于取得一个文本文件的编码方式
- VBA 判断一个TXT编码方式,再创建一个新的文件,复制数据进去
- 如何判断文本文件的编码方式?
- 文本文件编码方式判断
- 取得一个文本文件流的编码方式
- 笔试面试7 如何判断一个系统的存储方式是大端还是小端
- Android--判断文本文件编码
- python ucs-2与ucs-4编码方式判断