首先是将汉字转换为拼音:
导入依赖:
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>4.1.2</version>
</dependency>
创建转拼音的静态方法toPinyin,也可以封装成工具类,使用工具类进行调用:
public static String toPinyin(String chinese){
String pinyinStr = "";
char[] newChar = chinese.toCharArray();
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
for (int i = 0; i < newChar.length; i++) {
if (newChar[i] > 128) {
try {
pinyinStr += PinyinHelper.toHanyuPinyinStringArray(newChar[i], defaultFormat)[0];
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
}else{
pinyinStr += newChar[i];
}
}
return pinyinStr;
}
在方法中调用成功,这里我需要大写并且每个汉字之间保持空格,操作如下:
String name="西青果颗粒藏青果颗";
String[] split = name.split("");
String finalPy="";
for (String s : split) {
String s1 = toPinyin(s).toUpperCase(Locale.ROOT);
finalPy= finalPy+" "+s1;
}
System.out.println(finalPy.trim());
这里一切都没有问题,但是如果当字符串中包含非英文的特殊符号,会报错如下:
这里需要进行替换,将中文下的各种符号替换为英文状态下的:
使用String的replaceAll方法进行替换,如图:
后来出现了罗马符号各种,这种方式就太麻烦了,可以判断每个字符是否是汉字,是汉字就调用toPinyin方法进行转换,不是汉字则不转,实现的方法有很多,这里使用一种:通过unicode编码范围进行判断:
Pattern p2 = Pattern.compile("[\u4e00-\u9fa5]");
Matcher m2 = p2.matcher(s);
可以看到,不管什么符号,都会原样输出,
这里附上其他编码范围:
类型 | 范围 |
---|---|
汉字 | [0x4e00,0x9fa5] |
数字 | [0x30,0x39] |
小写字母 | [0x61,0x7a] |
大写字母 | [0x41,0x5a] |
参考链接:java中判断字符串是否是中文的方法