java中含有中文字符的编码和解码
2017-08-19 23:11
1096 查看
最近做项目的时候,上传字符串给服务器,遇到了乱码问题,给自己做个总结
1,在java开发中经常被文字乱码的问题困扰
如String str = “中国”
编码:byte[ ] by = str.getBytes(“编码方式”)
常用的编码方式有gbk,utf-8,gb2312,iso-8859-1等等
解码:String s = new String(by,“解码方式”)
2,正常解码后的字符串对象可以用任意方式编码。(对于中文要保证正常显示必须采用中文编码/解码方式)
如 String str = “中国”;//这个就是正常显示的字符串
以下任意方式(中文)编码/解码———–
String b1 = new String(str.getBytes(“gbk”),”gbk”);
String b2 = new String(str.getBytes(“utf-8”),”utf-8”);
String b3 = new String(str.getBytes(“gb2312”),”gb2312”);
以上三种方式的字符串对象都是采用中文方式编码/解码,所以都会是正常并无乱码。
3,当没采用对应方式解码时(也就是乱码)怎么转成正常显示
如 String str = “中国”;
String b1 = new String(str.getBytes(“gbk”),”gbk”);//这里的b1就是采用的gbk的方式解码的 ::::b1不会乱码的
String b2 = new String(b1.getBytes(),”utf-8”);//这里对b1编码后的字节数组重新用utf-8而没有用对应的gbk方式解码。:::::b2将会是乱码的
以下开始将乱码转成正常显示
String b3 = new String(b2.getBytes(“utf-8”),”gbk”)//这里编码方式(utf-8)必须用上述b2的解码方式,而解码方式(gbk)必须用b1的解码方式。因为是b2把正常显示的b1解码成乱码。:::::::b3不会是乱码的。
4常见应用举例。
在web开发中,tomcat对于传输的字符串都是采用iso-8859-1编码/解码方式。而客户端(浏览器端对于中文都是用gbk或utf-8中文编码/解码方式),所以传到后台都会是乱码的。容器一般都是有处理的,所以中文能正常显示和存储。但有些情况也是会出现乱码的,解决方式如下
String b = new String(str.getBytes(“iso-8859-1”,”客户端的编码/解码方式”)//中文解码方式一般用的是utf-8或者gbk。
如:
String b1 = new String(str.getBytes(“iso-8859-1”,”utf-8”);
文章来源:http://blog.csdn.net/jianrenxuan/article/details/48208501
1,在java开发中经常被文字乱码的问题困扰
如String str = “中国”
编码:byte[ ] by = str.getBytes(“编码方式”)
常用的编码方式有gbk,utf-8,gb2312,iso-8859-1等等
解码:String s = new String(by,“解码方式”)
2,正常解码后的字符串对象可以用任意方式编码。(对于中文要保证正常显示必须采用中文编码/解码方式)
如 String str = “中国”;//这个就是正常显示的字符串
以下任意方式(中文)编码/解码———–
String b1 = new String(str.getBytes(“gbk”),”gbk”);
String b2 = new String(str.getBytes(“utf-8”),”utf-8”);
String b3 = new String(str.getBytes(“gb2312”),”gb2312”);
以上三种方式的字符串对象都是采用中文方式编码/解码,所以都会是正常并无乱码。
3,当没采用对应方式解码时(也就是乱码)怎么转成正常显示
如 String str = “中国”;
String b1 = new String(str.getBytes(“gbk”),”gbk”);//这里的b1就是采用的gbk的方式解码的 ::::b1不会乱码的
String b2 = new String(b1.getBytes(),”utf-8”);//这里对b1编码后的字节数组重新用utf-8而没有用对应的gbk方式解码。:::::b2将会是乱码的
以下开始将乱码转成正常显示
String b3 = new String(b2.getBytes(“utf-8”),”gbk”)//这里编码方式(utf-8)必须用上述b2的解码方式,而解码方式(gbk)必须用b1的解码方式。因为是b2把正常显示的b1解码成乱码。:::::::b3不会是乱码的。
4常见应用举例。
在web开发中,tomcat对于传输的字符串都是采用iso-8859-1编码/解码方式。而客户端(浏览器端对于中文都是用gbk或utf-8中文编码/解码方式),所以传到后台都会是乱码的。容器一般都是有处理的,所以中文能正常显示和存储。但有些情况也是会出现乱码的,解决方式如下
String b = new String(str.getBytes(“iso-8859-1”,”客户端的编码/解码方式”)//中文解码方式一般用的是utf-8或者gbk。
如:
String b1 = new String(str.getBytes(“iso-8859-1”,”utf-8”);
文章来源:http://blog.csdn.net/jianrenxuan/article/details/48208501
相关文章推荐
- Java中正确解码用Javascript:escape()编码的中文字符
- 在Java中正确解码用Javascript:escape()编码的中文字符
- 在Java中正确解码用Javascript:escape()编码的中文字符
- 在Java中正确解码用Javascript:escape()编码的中文字符
- 在Java中正确解码用Javascript:escape()编码的中文字符
- 在Java中正确解码用Javascript:escape()编码的中文字符
- 在Java中正确解码用Javascript:escape()编码的中文字符
- 在Java中正确解码用Javascript:escape()编码的中文字符
- 中文操作系统默认编码与Java中文编码字符丢失问题
- java中的字节、字符、编码以及中文乱码问题
- 黑马程序员:字符的编码和解码(输入中文查看他的Unicode码)
- All About JAVA 关于英文服务器下输出含有中文字符文件乱码的问题
- Java字符的编码解码与乱码问题
- PHP解码unicode编码的中文字符代码分享
- 使用Java将中文字符转换成Unicode编码
- java中如何从字符串中删选中文字符(GBK编码和UTF-8编码)
- JAVA中文字符编码
- JAVA读取中文文件,判断string中含有中文字符,判断某一个字符是否为中文字符
- Java代码中转码 中文字符转UTF-8编码
- [完]PHP文件下载 下载GET值中含有中文字符的文件,保存中文文件名,文件不能打开,遇到的编码问题