您的位置:首页 > 编程语言 > Java开发

Java 汉字转拼音的具体实现及汉字声调处理

2014-10-21 16:19 375 查看
之前在技术群里有群友问,java可以输出汉子的拼音么,可以带声调么,对于这个问题,java当然是可以的。之后就网上查询了一些方法,自己写了几个方法,下面就把我写的方法跟大家一起分享,欢迎各位技术牛批评指正。

下面是代码部分,主要实现了java对汉字的判别,并且转换为拼音:
package com.zimu;

import net.sourceforge.pinyin4j.PinyinHelper;

import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;

import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

public class GetPinyin {

/**
* 得到 全拼
*
* @param src
* @return
*/
public static String getPinYin(String src) {
char[] t1 = null;
t1 = src.toCharArray();
String[] t2 = new String[t1.length];
//t3是全部的拼音,不带声调
HanyuPinyinOutputFormat t3 = new HanyuPinyinOutputFormat();
t3.setCaseType(HanyuPinyinCaseType.LOWERCASE);
t3.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
t3.setVCharType(HanyuPinyinVCharType.WITH_V);

//format是全部的拼音并且带声调
HanyuPinyinOutputFormat format= new HanyuPinyinOutputFormat();
format.setToneType(HanyuPinyinToneType.WITH_TONE_MARK);
format.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);

String t4 = "";
int t0 = t1.length;
try {
for (int i = 0; i < t0; i++) {
// 判断是否为汉字字符
if (java.lang.Character.toString(t1[i]).matches(
"[\\u4E00-\\u9FA5]+")) {
//					t2 = PinyinHelper.toHanyuPinyinStringArray(t1[i], t3);
t2 = PinyinHelper.toHanyuPinyinStringArray(t1[i], format);
t4 += t2[0]+" ";
} else {
t4 += java.lang.Character.toString(t1[i]);
}
}
return t4;
} catch (BadHanyuPinyinOutputFormatCombination e1) {
e1.printStackTrace();
}
return t4;
}

/**
* 得到中文首字母
*
* @param str
* @return
* @throws BadHanyuPinyinOutputFormatCombination
*/
public static String getPinYinHeadChar(String str) throws BadHanyuPinyinOutputFormatCombination {

String convert = "";
for (int j = 0; j < str.length(); j++) {
char word = str.charAt(j);
String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(word);
if (pinyinArray != null) {
convert += pinyinArray[0].charAt(0);
} else {
convert += word;
}
}
return convert;
}

/**
* 将字符串转移为ASCII码
*
* @param cnStr
* @return
*/
public static String getCnASCII(String cnStr) {
StringBuffer strBuf = new StringBuffer();
byte[] bGBK = cnStr.getBytes();
for (int i = 0; i < bGBK.length; i++) {
// System.out.println(Integer.toHexString(bGBK[i]&0xff));
strBuf.append(Integer.toHexString(bGBK[i] & 0xff));
}
return strBuf.toString();
}

public static void main(String[] args) throws Exception {
String cnStr = "我爱Ryan Albert"; //Ryan Albert是我的英文名,这里就不写我的中文名字了。
System.out.println(getPinYin(cnStr));
System.out.println(getPinYinHeadChar(cnStr));
}

}
程序使用了pinyin4j-2.5.0.jar的这个jar包。点击下载pinyin4j-2.5.0.jar
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: