Java汉字转拼音pinyin4j用法详解

 更新时间:2020年02月20日 15:27:08   作者:七弦桐  
这篇文章主要介绍了Java汉字转拼音pinyin4j用法详解,需要的朋友可以参考下

一、工具介绍

pinyin4j 是一个支持将简体和繁体中文转换到成拼音的Java开源类库;

1. 功能

  • 支持同一汉字有多个发音
  • 还支持拼音的格式化输出,比如第几声之类的,
  • 同时支持简体中文、繁体中文转换为拼音…使用起来也非常简单。下面是其官方网址,其中提供了下载:
  • pinyin4j的官方下载地址

2. 目录结构及说明

  • doc : pinyin4j的api文档
  • lib : pinyin4j的jar包
  • src: pinyin4j的源代码
  • CHANGELOG.txt : pinyin4j的版本更新日志
  • COPYING.txt : LICENSE说明
  • README.txt : pinyin4j的概要介绍

3. 原理

pinyin4j使用了一个.txt的文本文件(uicode_to_hanyu_pinyin.txt)用来存储汉字unicode编码与拼音的对应关系,通过读取该配置文件达到转换的目的。

该属性文件存储信息的基本格式如下:89E3 (jie3,jie4,xie4) //(对应汉字”解”)89E3 是汉字对应的unicode编码的16进制数,(jie3,jie4,xie4)是该汉字对应的三种读音(在汉语里有多音字)

说明pinyin4j支持多音字的处理pinyin4j的处理过程是这样的:

根据String的toCharArray方法得到每个字符(得到”解”字的unicode编码,实际上是35299,由于java中char和String都是unicode编码的可以直接转为int型的编码数据35299),然后利用Integer.toHexString(c1).toUpperCase()将其转换成16进制数[也就是89E3],通过读取配置文件得到“解”字的拼音(jie3,jie4,xie4),那么这里有三个拼音,pinyin4j的默认取值为第一个,也就是jie3[表示读jie,声调是三声]

二、pinyin4J 使用

pinyin4j 提供的工具类为PinyinHelper,里边提供了静态方法

- toHanyuPinyinString()(过时)

- toHanyuPinyinStringArray()

pinyin4j 中有四个辅助类分别是:

- HanyuPinyinCaseType

- HanyuPinyinToneType

- HanyuPinyinVCharType

- HanyuPinyinOutputFormat

具体功能和用法见一下代码:

HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
// 控制大小写
// UPPERCASE:大写 (ZHONG)
// LOWERCASE:小写 (zhong)
defaultFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE);
// WITHOUT_TONE:无音标 (zhong)
// WITH_TONE_NUMBER:1-4数字表示英标 (zhong4)
// WITH_TONE_MARK:直接用音标符(必须WITH_U_UNICODE否则异常) (zhòng)
defaultFormat.setToneType(HanyuPinyinToneType.WITH_TONE_NUMBER);
// WITH_V:用v表示ü (nv)
// WITH_U_AND_COLON:用"u:"表示ü (nu:)
// WITH_U_UNICODE:直接用ü (nü)
defaultFormat.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);
// oHanyuPinyinStringArray如果传入的字符不是汉字不能转换成拼音,那么会直接返回null。
String[] pinyin = PinyinHelper.toHanyuPinyinStringArray('重', defaultFormat);
for(String str: pinyin){
  System.out.println(str);
}

结果:

ZHONG4

CHONG2

其他工具类

获取获得汉语拼音首字母

将字符串中的中文转化为拼音,英文字符不变

/**
 * 获得汉语拼音首字母
 *
 * @param chines
 *      汉字
 * @return
 */
public static String getAlpha(String chines) {
  String pinyinName = "";
  char[] nameChar = chines.toCharArray();
  HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
  defaultFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE);
  defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
  for (int i = 0; i < nameChar.length; i++) {
    if (nameChar[i] > 128) {
      try {
        pinyinName += PinyinHelper.toHanyuPinyinStringArray(
            nameChar[i], defaultFormat)[0].charAt(0);
      } catch (BadHanyuPinyinOutputFormatCombination e) {
        e.printStackTrace();
      }
    } else {
      pinyinName += nameChar[i];
    }
  }
  return pinyinName;
}

/**
 * 将字符串中的中文转化为拼音,英文字符不变
 *
 * @param inputString
 *      汉字
 * @return
 */
public static String getPingYin(String inputString) {
  HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();
  format.setCaseType(HanyuPinyinCaseType.LOWERCASE);
  format.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
  format.setVCharType(HanyuPinyinVCharType.WITH_V);
  String output = "";
  if (inputString != null && inputString.length() > 0
      && !"null".equals(inputString)) {
    char[] input = inputString.trim().toCharArray();
    try {
      for (int i = 0; i < input.length; i++) {
        if (java.lang.Character.toString(input[i]).matches(
            "[\\u4E00-\\u9FA5]+")) {
          String[] temp = PinyinHelper.toHanyuPinyinStringArray(
              input[i], format);
          output += temp[0];
        } else
          output += java.lang.Character.toString(input[i]);
      }
    } catch (BadHanyuPinyinOutputFormatCombination e) {
      e.printStackTrace();
    }
  } else {
    return "*";
  }
  return output;
}

/**
 * 汉字转换为汉语拼音首字母,英文字符不变
 *
 * @param chines
 *      汉字
 * @return 拼音
 */
public static String converterToFirstSpell(String chines) {
  String pinyinName = "";
  char[] nameChar = chines.toCharArray();
  HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
  defaultFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE);
  defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
  for (int i = 0; i < nameChar.length; i++) {
    if (nameChar[i] > 128) {
      try {
        pinyinName += PinyinHelper.toHanyuPinyinStringArray(
            nameChar[i], defaultFormat)[0].charAt(0);
      } catch (BadHanyuPinyinOutputFormatCombination e) {
        e.printStackTrace();
      }
    } else {
      pinyinName += nameChar[i];
    }
  }
  return pinyinName;
}

更多关于Java汉字转拼音pinyin4j用法请查看下面的相碰链接

相关文章

  • java通过ssh连接服务器执行shell命令详解及实例

    java通过ssh连接服务器执行shell命令详解及实例

    这篇文章主要介绍了java通过ssh连接服务器执行shell命令详解及实例方法的相关资料
    2017-02-02
  • 启动springboot应用因未配置数据库报错的解决方案

    启动springboot应用因未配置数据库报错的解决方案

    这篇文章主要介绍了启动springboot应用因未配置数据库报错的解决方案,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-11-11
  • 浅谈java项目与javaweb项目导入jar包的区别

    浅谈java项目与javaweb项目导入jar包的区别

    下面小编就为大家分享一篇浅谈java项目与javaweb项目导入jar包的区别,具有很好的参考价值。希望对大家有所帮助。一起跟随小编过来看看吧
    2017-11-11
  • 基于Java Socket实现一个简易在线聊天功能(一)

    基于Java Socket实现一个简易在线聊天功能(一)

    这篇文章主要给大家介绍基于Java Socket实现一个简易在线聊天功能(一),分为客户端和服务端两段代码,非常具有参考价值,感兴趣的朋友一起学习吧
    2016-05-05
  • Java基础-Java变量的声明和作用域

    Java基础-Java变量的声明和作用域

    这篇文章主要介绍了Java变量的声明和作用域,变量其实就是内存中的一个存储空间,用来存储数据,具体的相关内容,需要的小伙伴可以参考下面文章内容
    2022-01-01
  • Spring Security基本原理详解

    Spring Security基本原理详解

    这篇文章主要介绍了Spring Security基本原理详解,springsecurity底层实现为一条过滤器链,就是用户请求进来,判断有没有请求的权限,抛出异常,重定向跳转,需要的朋友可以参考下
    2023-05-05
  • Java实现屏幕截图及剪裁

    Java实现屏幕截图及剪裁

    这是一篇入门级文章,高手请略过。在这篇文章中我们将学习如何用 Java 对图像进行剪裁并将剪裁出来的部分单独保存到文件中。
    2014-09-09
  • Java中方法的使用、重载与递归的详细介绍

    Java中方法的使用、重载与递归的详细介绍

    前面我们提到了方法需要参数类型,但是如果我们需要用一个函数同时兼容多种参数的情况应该怎么办呢? 这里就可以使用到方法重载,对Java中方法的使用、重载与递归相关知识感兴趣的朋友一起看看吧
    2021-11-11
  • 通过实例解析java8中的parallelStream

    通过实例解析java8中的parallelStream

    这篇文章主要介绍了通过实例解析java8中的parallelStream,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-11-11
  • mybatis-plus 关于savebatch,saveorupdatebatch遇到的坑及解决办法

    mybatis-plus 关于savebatch,saveorupdatebatch遇到的坑及解决办法

    本文主要介绍了mybatis-plus 关于savebatch,saveorupdatebatch遇到的坑及解决办法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-01-01

最新评论