漢字轉成拼音如果自己實現起來有點麻煩,主要是怕有些漢字轉不了,所以就準備使用一個開源的工具Pinyin4j.
pinyin4j是一個支持將中文轉換到拼音的Java開源類庫,pinyin4j能夠根據中文字符獲取其對應的拼音,而且拼音的格式可以定制。pinyin4j的主頁:http://pinyin4j.sourceforge.net/
1. 支持簡體中文和繁體中文字符;
2. 支持轉換到漢語拼音,通用拼音, 威妥瑪拼音(威瑪拼法), 注音符號第二式, 耶魯拼法和國語羅馬字;
3. 支持多音字,即可以獲取一個中文字符的多種發音;
4. 支持多種字符串輸出格式,比如支持Unicode格式的字符ü和聲調符號(陰平 "ˉ",陽平"ˊ",上聲"ˇ",去聲"ˋ")的輸出。
為了方便大家使用,我將源文件和jar包一并放上來了,歡迎大家下載。
廢話少說,下面是我建立的一個通用類,有什么不足的地方希望大家指正。
package com.xyj.com.tool.util;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

/**
* @className:PinyingUtil.java
* @classDescription:拼音操作工具類
* @author:xiayingjie
* @createTime:2010-10-21
*/

public class PinyingUtil {

/**
* 將字符串轉換成拼音數組
*
* @param src
* @return
*/
public static String[] stringToPinyin(String src) {
return stringToPinyin(src, false, null);
}
/**
* 將字符串轉換成拼音數組
*
* @param src
* @return
*/
public static String[] stringToPinyin(String src,String separator) {
return stringToPinyin(src, true, separator);
}

/**
* 將字符串轉換成拼音數組
*
* @param src
* @param isPolyphone
* 是否查出多音字的所有拼音
* @param separator
* 多音字拼音之間的分隔符
* @return
*/
public static String[] stringToPinyin(String src, boolean isPolyphone,
String separator) {
// 判斷字符串是否為空
if ("".equals(src) || null == src) {
return null;
}
char[] srcChar = src.toCharArray();
int srcCount = srcChar.length;
String[] srcStr = new String[srcCount];

for (int i = 0; i < srcCount; i++) {
srcStr[i] = charToPinyin(srcChar[i], isPolyphone, separator);
}
return srcStr;
}

/**
* 將單個字符轉換成拼音
*
* @param src
* @return
*/
public static String charToPinyin(char src, boolean isPolyphone,
String separator) {
// 創建漢語拼音處理類
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
// 輸出設置,大小寫,音標方式
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);

StringBuffer tempPinying = new StringBuffer();

// 如果是中文
if (src > 128) {
try {
// 轉換得出結果
String[] strs = PinyinHelper.toHanyuPinyinStringArray(src,
defaultFormat);
// 是否查出多音字,默認是查出多音字的第一個字符
if (isPolyphone && null != separator) {
for (int i = 0; i < strs.length; i++) {
tempPinying.append(strs[i]);
if (strs.length != (i + 1)) {
// 多音字之間用特殊符號間隔起來
tempPinying.append(separator);
}
}
} else {
tempPinying.append(strs[0]);
}

} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
} else {
tempPinying.append(src);
}

return tempPinying.toString();

}

public static String hanziToPinyin(String hanzi){
return hanziToPinyin(hanzi," ");
}
/**
* 將漢字轉換成拼音
* @param hanzi
* @param separator
* @return
*/
public static String hanziToPinyin(String hanzi,String separator){
// 創建漢語拼音處理類
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
// 輸出設置,大小寫,音標方式
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
String pinyingStr="";
try {
pinyingStr=PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat, separator);
} catch (BadHanyuPinyinOutputFormatCombination e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return pinyingStr;
}
/**
* 將字符串數組轉換成字符串
* @param str
* @param separator 各個字符串之間的分隔符
* @return
*/
public static String stringArrayToString(String[] str, String separator) {
StringBuffer sb = new StringBuffer();
for (int i = 0; i < str.length; i++) {
sb.append(str[i]);
if (str.length != (i + 1)) {
sb.append(separator);
}
}
return sb.toString();
}
/**
* 簡單的將各個字符數組之間連接起來
* @param str
* @return
*/
public static String stringArrayToString(String[] str){
return stringArrayToString(str,"");
}
/**
* 將字符數組轉換成字符串
* @param str
* @param separator 各個字符串之間的分隔符
* @return
*/
public static String charArrayToString(char[] ch, String separator) {
StringBuffer sb = new StringBuffer();
for (int i = 0; i < ch.length; i++) {
sb.append(ch[i]);
if (ch.length != (i + 1)) {
sb.append(separator);
}
}
return sb.toString();
}
/**
* 將字符數組轉換成字符串
* @param str
* @return
*/
public static String charArrayToString(char[] ch) {
return charArrayToString(ch," ");
}

/**
* 取漢字的首字母
* @param src
* @param isCapital 是否是大寫
* @return
*/
public static char[] getHeadByChar(char src,boolean isCapital){
//如果不是漢字直接返回
if (src <= 128) {
return new char[]{src};
}
//獲取所有的拼音
String []pinyingStr=PinyinHelper.toHanyuPinyinStringArray(src);
//創建返回對象
int polyphoneSize=pinyingStr.length;
char [] headChars=new char[polyphoneSize];
int i=0;
//截取首字符
for(String s:pinyingStr){
char headChar=s.charAt(0);
//首字母是否大寫,默認是小寫
if(isCapital){
headChars[i]=Character.toUpperCase(headChar);
}else{
headChars[i]=headChar;
}
i++;
}
return headChars;
}
/**
* 取漢字的首字母(默認是大寫)
* @param src
* @return
*/
public static char[] getHeadByChar(char src){
return getHeadByChar(src,true);
}
/**
* 查找字符串首字母
* @param src
* @return
*/
public static String[] getHeadByString(String src){
return getHeadByString( src, true);
}
/**
* 查找字符串首字母
* @param src
* @param isCapital 是否大寫
* @return
*/
public static String[] getHeadByString(String src,boolean isCapital){
return getHeadByString( src, isCapital,null);
}
/**
* 查找字符串首字母
* @param src
* @param isCapital 是否大寫
* @param separator 分隔符
* @return
*/
public static String[] getHeadByString(String src,boolean isCapital,String separator){
char[]chars=src.toCharArray();
String[] headString=new String[chars.length];
int i=0;
for(char ch:chars){
char[]chs=getHeadByChar(ch,isCapital);
StringBuffer sb=new StringBuffer();
if(null!=separator){
int j=1;
for(char ch1:chs){
sb.append(ch1);
if(j!=chs.length){
sb.append(separator);
}
j++;
}
}else{
sb.append(chs[0]);
}
headString[i]=sb.toString();
i++;
}
return headString;
}
public static void main(String[] args) {
System.out.println(stringArrayToString(getHeadByString("我se 心")));
}

}
pinyin4j是一個支持將中文轉換到拼音的Java開源類庫,pinyin4j能夠根據中文字符獲取其對應的拼音,而且拼音的格式可以定制。pinyin4j的主頁:http://pinyin4j.sourceforge.net/
1. 支持簡體中文和繁體中文字符;
2. 支持轉換到漢語拼音,通用拼音, 威妥瑪拼音(威瑪拼法), 注音符號第二式, 耶魯拼法和國語羅馬字;
3. 支持多音字,即可以獲取一個中文字符的多種發音;
4. 支持多種字符串輸出格式,比如支持Unicode格式的字符ü和聲調符號(陰平 "ˉ",陽平"ˊ",上聲"ˇ",去聲"ˋ")的輸出。
為了方便大家使用,我將源文件和jar包一并放上來了,歡迎大家下載。
廢話少說,下面是我建立的一個通用類,有什么不足的地方希望大家指正。

























































































































































































































































































