您的位置:首页 > 其它

文字编码(文件IO流 )

2015-08-29 19:20 211 查看
String s="中文ABC";

byte[] bytes1=s.getBytes();//这是把字符串转换成字符数组,转换成的字节序列用的是项目默认的编码

for(byte b: bytes1)

System.out.println(Integer.toHexString(b & 0xff)+" ");// & 0xff是为了把前面的24个0去掉只留下后八位

//toHexString这个函数是把字节(转换成了Int)以16进制的方式显示

byte[] bytes1=s.getBytes("gbk");//也可以转换成指定的编码

gbk编码: 中文占用两个字节,英文占用一个字节

utf-8编码:中文占用三个字节,英文占用一个字节

java是双字节编码,是utf-16be编码

utf-16be编码:中文占用两个字节,英文占用两个字节

当你的字节序列是某种编码时,这个时候想把字节序列变成字符串,也需要用这种编码方式,否则会出现乱码

String str1=new String(bytes4);//这时会使用项目默认的编码来转换,可能出现乱码

要使用字节序列的编码来进行转换

String str2=new String(bytes4,"utf-16be");

文本文件就是字节序列,可以是任意编码的字节序列

如果我们在中文机器上直接创建文本文件,那么该文件只认识ANSI编码(例如直接在电脑中创建文本文件)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: