继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

拼音工具类PinyinUtils

chaychan
关注TA
已关注
手记 54
粉丝 61
获赞 486

介绍

  最近在做好友列表的时候,仿照微信的好友列表,A-Z索引,需要用到好友名字的拼音,之前已经有封装好拼音的工具类,但是最近发现对于一些多音字,姓氏的处理没有做到位,比如姓氏单(shan),由于对于多音字没有做一些处理,仅仅只是取多音字列表的第一个,所以取到的拼音是dan,所以利用空闲的时间对这个拼音的工具类进行了处理。

常见姓氏拼音

SimpleArrayMap<Character, String> surnames = new SimpleArrayMap<>(35);
		surnames.put('乐', "yue");
		surnames.put('乘', "sheng");
		surnames.put('乜', "nie");
		surnames.put('仇', "qiu");
		surnames.put('会', "gui");
		surnames.put('便', "pian");
		surnames.put('区', "ou");
		surnames.put('单', "shan");
		surnames.put('参', "shen");
		surnames.put('句', "gou");
		surnames.put('召', "shao");
		surnames.put('员', "yun");
		surnames.put('宓', "fu");
		surnames.put('弗', "fei");
		surnames.put('折', "she");
		surnames.put('曾', "zeng");
		surnames.put('朴', "piao");
		surnames.put('查', "zha");
		surnames.put('洗', "xian");
		surnames.put('盖', "ge");
		surnames.put('祭', "zhai");
		surnames.put('种', "chong");
		surnames.put('秘', "bi");
		surnames.put('繁', "po");
		surnames.put('缪', "miao");
		surnames.put('能', "nai");
		surnames.put('蕃', "pi");
		surnames.put('覃', "qin");
		surnames.put('解', "xie");
		surnames.put('谌', "shan");
		surnames.put('适', "kuo");
		surnames.put('都', "du");
		surnames.put('阿', "e");
		surnames.put('难', "ning");
		surnames.put('黑', "he");
		

效果图

image

拼音的获取

上图获取的拼音内容如下:


pinyin: QINTANG

pinyin: QIULAN

pinyin: SHANDAN

pinyin: ZENGER

pinyin: #

可以看到姓氏的拼音是正确的,最后一个由于不是以汉字开头,所以其拼音的内容是#

获取拼音的方法

public static String getPinyin(String str) {
		// 设置拼音结果的格式
		HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();
		format.setCaseType(HanyuPinyinCaseType.UPPERCASE);// 设置为大写形式
		format.setToneType(HanyuPinyinToneType.WITHOUT_TONE);// 不用加入声调

		StringBuilder sb = new StringBuilder();

		char[] charArray = str.toCharArray();

		for (int i = 0; i < charArray.length; i++) {
			char c = charArray[i];

			if (Character.isWhitespace(c)) {// 如果是空格则跳过
				continue;
			}

			if (isHanZi(c)) {// 如果是汉字
				String s = "";
				try {
					if (i == 0){
						//如果是第一个,则使用获取姓氏
						s = getSurnamePinyin(String.valueOf(c));
					}else{
						// toHanyuPinyinStringArray 返回一个字符串数组是因为该汉字可能是多音字,此处只取第一个结果
						s = PinyinHelper.toHanyuPinyinStringArray(c, format)[0];
					}
					sb.append(s);
				} catch (BadHanyuPinyinOutputFormatCombination e) {
					e.printStackTrace();
					sb.append(s);
				}

			} else {
				// 不是汉字
				if (i == 0) {
					if (isEnglish(c)) {// 第一个属于字母,则返回该字母
						return String.valueOf(c).toUpperCase(Locale.ENGLISH);
					}
					return "#"; // 不是的话返回#号
				}
			}
		}

		return sb.toString();
	}
	

主要的逻辑是,将字符串拆解成字符数组,遍历每个字符:

  1. 如果第一个是汉字,则获取调用getSurnamePinyin()方法,获取其对应的拼音,这个方法主要是对姓氏的处理;
  2. 如果第一个字符是英文,则直接返回该字符的大写;
  3. 如果第一个字符不是汉字也不是英文,则直接返回"#"号;

如何判断是否是汉字

	public static boolean isHanZi(char c) {
		Pattern pattern = Pattern.compile("[\\u4e00-\\u9fa5]+");
		Matcher matcher = pattern.matcher(String.valueOf(c));
		return matcher.matches();
	}

通过如上方法,使用正则表达式匹配,如果满足,则说明是汉字,返回true。

如何判断是否是英文

 public static boolean isEnglish(char c) {
	return String.valueOf(c).matches("^[a-zA-Z]*");
 }

获取姓氏的拼音

	public static String getSurnamePinyin(CharSequence name) {
		if (name == null || name.length() == 0) return null;
		char ch = name.charAt(0);
		if (surnames.containsKey(ch)) {
			String s = surnames.get(ch);
			return s.toUpperCase(Locale.ENGLISH);
		}
		if (ch >= 0x4E00 && ch <= 0x9FA5) {
			int sp = (ch - 0x4E00) * 6;
			return pinyinTable.substring(sp, sp + 6).trim().toUpperCase(Locale.ENGLISH);
		} else {
			return String.valueOf(ch).toUpperCase(Locale.ENGLISH);
		}
	}

通过查找已经存储在map中对应姓氏的拼音

相关代码

PinyinUtils代码:

依赖到的jar包,pinyin4j-2.5.0.jar下载:

打开App,阅读手记
0人推荐
发表评论
随时随地看视频慕课网APP