java中文和unicode相互转换
2007-12-12 14:06
501 查看
网上大多都只支持纯中文字符串转换,我修改了一下,支持中英文字符串的转换,代码如下:
/**
* @author lifm
*
*/
public class StringUtil {
public static String gbk2Unicode(String str) {
StringBuffer ret = new StringBuffer();
String tmp = null;
try {
byte[] bb = str.getBytes("UTF-16");
for (int i = 3; i < bb.length; i+=2) {
//i++;
if (bb[i - 1] != 0)
tmp = toHEXString(bb[i - 1]) + toHEXString(bb[i]);
else
tmp = "00" + toHEXString(bb[i]);
ret.append("//u").append(tmp);
}
return ret.toString();
} catch (Exception e) {
// TODO: handle exception
return str;
}
}
public static String unicode2GBK(String str) {
String[] s = str.split("////u");
StringBuffer ret = new StringBuffer();
for(int i = 1 ; i < s.length; i++ ) {
ret.append((char)Integer.parseInt(s[i], 16));
}
return ret.toString();
}
private static String toHEXString(byte b) {
return ("" + "0123456789ABCDEF".charAt(0xf & b >> 4) + "0123456789ABCDEF"
.charAt(b & 0xF));
}
}
/**
* @author lifm
*
*/
public class StringUtil {
public static String gbk2Unicode(String str) {
StringBuffer ret = new StringBuffer();
String tmp = null;
try {
byte[] bb = str.getBytes("UTF-16");
for (int i = 3; i < bb.length; i+=2) {
//i++;
if (bb[i - 1] != 0)
tmp = toHEXString(bb[i - 1]) + toHEXString(bb[i]);
else
tmp = "00" + toHEXString(bb[i]);
ret.append("//u").append(tmp);
}
return ret.toString();
} catch (Exception e) {
// TODO: handle exception
return str;
}
}
public static String unicode2GBK(String str) {
String[] s = str.split("////u");
StringBuffer ret = new StringBuffer();
for(int i = 1 ; i < s.length; i++ ) {
ret.append((char)Integer.parseInt(s[i], 16));
}
return ret.toString();
}
private static String toHEXString(byte b) {
return ("" + "0123456789ABCDEF".charAt(0xf & b >> 4) + "0123456789ABCDEF"
.charAt(b & 0xF));
}
}
相关文章推荐
- java中unicode和中文相互转换的简单实现
- java_unicode和中文相互转换的工具方法
- java中文和unicode编码相互转换(转)
- java中unicode和中文相互转换
- java中unicode和中文相互转换
- java中unicode和中文相互转换
- UnicodeToWord(Java将Unicode码转换成中文)
- JAVA 中文与ASICLL码的相互转换
- java Unicode 与中文字符的转换
- JAVA方法 字符串与unicode的相互转换
- 【JAVA编码】 JAVA字符编码系列二:Unicode,ISO-8859,GBK,UTF-8编码及相互转换
- 关于JAVA字符编码:Unicode,ISO-8859-1,GBK,UTF-8编码及相互转换
- JAVA方法 字符串与unicode的相互转换
- JAVA unicode转换成中文
- 16进制、10进制、字符串、中文、byte[]相互转换--->java版
- java实现中文,unicode互相转换
- Java String字符串和Unicode字符相互转换代码(包括混有普通字符的Unicode)
- JAVA字符编码系列二:Unicode,ISO-8859,GBK,UTF-8编码及相互转换
- java国际化,资源文件内的中文再也不必转换为丑陋的unicode
- Unicode与中文的转换-java