JAVA从UTF-8编码文件读取字符串时,前边有问号的问题
2017-07-31 13:19
344 查看
最近做Java读取一个xml文件模板的时候,发生了一个诡异的问题。就是读出来的字符串,调试的时候显示是正常的,但是真正用的时候或者打印出来的时候,前边有一个问号。?<xml>...</xml>,类似这样。
后来在网上搜了一下,找到这个:http://bugs.java.com/bugdatabase/view_bug.do?bug_id=4508058 对于有BOM的UTF-8编码文件时,从jdk1.4开始就会在读取的时候出现这个?了。而且官方明确表示won't fix,所以现在用jdk6的时候仍然存在。
解决办法其实就是改变文件的编码,改成无BOM的UTF-8就OK了。
BOM(byte order mark)是为 UTF-16 和 UTF-32 准备的,用于标记字节序(byte order)。微软在 UTF-8 中使用 BOM 是因为这样可以把 UTF-8 和 ASCII 等编码明确区分开,但这样的文件在 Windows 之外的操作系统里会带来问题。「UTF-8」和「带
BOM 的 UTF-8」的区别就是有没有 BOM。即文件开头有没有 U+FEFF。
比如在editplus里可以选这个:
![](https://img-blog.csdn.net/20170807093417280?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbGxsbGxsbGxsbDRlcjV0eQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
选择存为UTF-8即可,UTF-8即为无BOM
后来在网上搜了一下,找到这个:http://bugs.java.com/bugdatabase/view_bug.do?bug_id=4508058 对于有BOM的UTF-8编码文件时,从jdk1.4开始就会在读取的时候出现这个?了。而且官方明确表示won't fix,所以现在用jdk6的时候仍然存在。
解决办法其实就是改变文件的编码,改成无BOM的UTF-8就OK了。
BOM(byte order mark)是为 UTF-16 和 UTF-32 准备的,用于标记字节序(byte order)。微软在 UTF-8 中使用 BOM 是因为这样可以把 UTF-8 和 ASCII 等编码明确区分开,但这样的文件在 Windows 之外的操作系统里会带来问题。「UTF-8」和「带
BOM 的 UTF-8」的区别就是有没有 BOM。即文件开头有没有 U+FEFF。
比如在editplus里可以选这个:
选择存为UTF-8即可,UTF-8即为无BOM
相关文章推荐
- JAVA从UTF-8编码文件读取字符串时,前边有问号的问题
- java读取ANSI编码或者UTF-8编码文件乱码问题解决
- java使用gbk编码读取utf-8的js文件吃掉回车问题
- Java读取UTF-8格式txt文件第一行出现乱码——问号“?”及解决;Java读带有BOM的UTF-8文件乱码原因及解决方法
- java中读取excel文件中字符串乱码问题解决方法
- java读取UTF-8的txt文件发现开头的一个字符问题
- Java读取UTF-8格式txt文件第一行出现乱码——问号“?”及解决;Java读带有BOM的UTF-8文件乱码原因及解决方法
- java读取文件内容的编码问题
- BOM与读取UTF-8编码格式文件首行乱码问题
- [Python爬虫] 中文编码问题:raw_input输入、文件读取、变量比较等str、unicode、utf-8转换问题
- java处理字符编码的常见问题(最近在弄字符串设置编码写入文件)
- Java 读写文件的编码问题——读取是重点
- Java读取UTF-8格式文件第一行出现乱码——问号“?”及解决 And Java读带有BOM的UTF-8文件乱码原因及解决方法
- [经验总结]解决Perl读取utf-8编码文件的问题
- android读取文件时乱码的问题,以及eclipse中java编码查看方式
- Java读取UTF-8格式txt文件第一行出现乱码——问号“?”的解决方案
- windows java读取utf-8编码文件时出现第一个字符为未知字符"?" 的解决方案
- java中读取UTF-8文件时有时会出现第一行乱码问题
- Java读取UTF-8格式txt文件第一行出现乱码——问号“?”及解决;Java读带有BOM的UTF-8文件乱码原因及解决方法
- Java读取UTF-8格式txt文件第一行出现乱码——问号“?”及解决