java开源好用的简繁转换类库推荐

 更新时间:2022年08月12日 15:45:06   作者:一灰灰  
这篇文章主要为大家介绍了java开源好用的简繁转换类库推荐,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

引言

今天给大家介绍一个非常有意思类库,基于java实现的简繁体转换,适用于后端、android等开发领域

源码地址:* liuyueyi/quick-chinese-transfer: 简繁转换,支持香港繁体,台湾繁体与简体互转

1. 实例体验

以maven做项目管理,可以直接从中央仓库下载,再pom文件中添加以下依赖即可

<!-- https://mvnrepository.com/artifact/com.github.liuyueyi/quick-transfer-core -->
<dependency>
    <groupId>com.github.liuyueyi</groupId>
    <artifactId>quick-transfer-core</artifactId>
    <version>0.2.6</version>
</dependency>

说明:0.2.6版本于2022-08-11上传,若在mvn仓库搜索不到,不要慌,可以先使用0.2.5

如果是gradle做项目管理,依赖同样很简单

// https://mvnrepository.com/artifact/com.github.liuyueyi/quick-transfer-core
implementation 'com.github.liuyueyi:quick-transfer-core:0.2.6'

此外,针对网络不好的小伙伴,也可以通过jitpack的方式导入依赖,具体姿势如下

maven依赖

<repositories>
    <repository>
        <id>jitpack.io</id>
        <url>https://jitpack.io</url>
    </repository>
</repositories>
<dependency>
    <groupId>com.github.liuyueyi.quick-chinese-transfer</groupId>
    <artifactId>quick-transfer-core</artifactId>
    <version>0.2.6</version>
</dependency>

gradle依赖

allprojects {
	repositories {
		...
		maven { url 'https://jitpack.io' }
	}
}
dependencies {
    implementation 'com.github.liuyueyi.quick-chinese-transfer:quick-transfer-core:0.2.6'
}

环境准备完毕之后,可以直接进行使用了,使用姿势非常非常非常的简单

public void testTrans() {
    String text = "这斜月三星洞…… 长寿面,孙悟空,猪八戒,唐僧,沙和尚,白龙马,李靖,托塔天王, 戏说西游,许多人都这样说,收拾一下,拾金不昧;纔=才";
    // 简体转繁体
    String out = ChineseUtils.s2t(text);
    System.out.println("s2t -->" + out);
    // 简体转香港繁体
    String hkOut = ChineseUtils.s2hk(text);
    System.out.println("s2hk -->" + hkOut);
    // 简体转台湾繁体
    String twOut = ChineseUtils.s2tw(text);
    System.out.println("s2tw --> " + twOut);
    // 繁体转简体
    String origin = ChineseUtils.t2s(out);
    System.out.println("t2s -->" + origin);
    // 香港繁体转简体
    System.out.println("hk2s -->" + ChineseUtils.hk2s(hkOut));
    // 台湾繁体转简体
    System.out.println("tw2s -->" + ChineseUtils.tw2s(twOut));
}

入口类 ChineseUtils 支持简繁互转,这里区分了香港繁体 + 台湾繁体,两者的主要区别在于某些字、词的叫法不一样

通常来讲,使用最简单的简繁互即可

上面的case输出结果如下:

s2t -->這斜月三星洞…… 長壽麪,孫悟空,豬八戒,唐僧,沙和尚,白龍馬,李靖,托塔天王, 戲說西遊,許多人都這樣說,收拾一下,拾金不昧;纔=才
s2hk -->這斜月三星洞…… 長壽麪,孫悟空,豬八戒,唐僧,沙和尚,白龍馬,李靖,托塔天王, 戲説西遊,許多人都這樣説,收拾一下,拾金不昧;才=才
s2tw --> 這斜月三星洞…… 長壽麵,孫悟空,豬八戒,唐僧,沙和尚,白龍馬,李靖,托塔天王, 戲說西遊,許多人都這樣說,收拾一下,拾金不昧;才=才
t2s -->这斜月三星洞…… 长寿面,孙悟空,猪八戒,唐僧,沙和尚,白龙马,李靖,托塔天王, 戏说西游,许多人都这样说,收拾一下,拾金不昧;才=才
hk2s -->这斜月三星洞…… 长寿面,孙悟空,猪八戒,唐僧,沙和尚,白龙马,李靖,托塔天王, 戏说西游,许多人都这样说,收拾一下,拾金不昧;才=才
tw2s -->这斜月三星洞…… 长寿面,孙悟空,猪八戒,唐僧,沙和尚,白龙马,李靖,托塔天王, 戏说西游,许多人都这样说,收拾一下,拾金不昧;才=才

2. 进阶使用

简繁转换,核心在于词典的管理,改类库在首次实现转换的时候,会加载词典,并解析为内部的数据结构Dict;因此第一次调用时,会出现冷启动的耗时高问题

2.1 预热

基于此,可以再合适的地方先预热加载词典;官方提供了同步预热/异步预热两种方式,如

// 预热加载所有的词典
ChineseUtils.preLoad(true, TransType.values());
// 预加载简体转繁体词典
ChineseUtils.preLoad(true, TransType.SIMPLE_TO_TRADITIONAL);
// 预加载简繁互转词典
ChineseUtils.preLoad(true, TransType.SIMPLE_TO_TRADITIONAL, TransType.TRADITIONAL_TO_SIMPLE);

preLoad方法的第一个参数,就是用来控制同步还是异步的情况

后面的参数则为希望加载的词典

2.2 卸载

同样有了预热就有卸载,对于客户端的小伙伴来说可能更关注这一点的内存占用;对于不需要的词典,可以指定卸载

// 卸载所有词典
ChineseUtils.unLoad(TransType.values());
// 卸载简繁互转词典
ChineseUtils.unLoad(TransType.SIMPLE_TO_TRADITIONAL, TransType.TRADITIONAL_TO_SIMPLE);

2.3 通用方法

在第一节的使用实例中,提供了各种特有的方法来实现转换;同样也提供一个统一的方法,根据传参的词典类型来进行转换;适用于统一api接口的设计,根据传参来返回对应的结果场景

ChineseUtils.transfer("一灰灰blog", TransType.SIMPLE_TO_TRADITIONAL);

3. 小结

最后简单介绍下这个项目,没错这个项目目前是我再维护,核心实现主要来自 chinese-utils,那么为啥要独立搞一个呢? 原因如下

  • 这个项目不再维护了,最后一次提交在15年
  • 词典旧且,有问题的数据较多,所以我完全替换了它的默认词典,改用 HanLP 词典文件
  • 新特性增加(如港台繁体的区分支持,如预热加载)
  • 性能优化等(词典解析规则、匹配算法的改进等)

以上就是java开源好用的简繁转换类库推荐的详细内容,更多关于java开源简繁转换类库的资料请关注脚本之家其它相关文章!

相关文章

  • 关于Java中Comparable 和 Comparator的用法

    关于Java中Comparable 和 Comparator的用法

    这篇文章主要介绍了关于Java中Comparable 和 Comparator的用法,Comparable 和 Comparator 是关于排序的两个接口,用来实现 Java 集合中的的排序功能,需要的朋友可以参考下
    2023-04-04
  • java使用CountDownLatch实现多线程协作

    java使用CountDownLatch实现多线程协作

    在多线程编程中,经常需要实现一种机制来协调多个线程的执行,以确保某些操作在所有线程完成后再进行,CountDownLatch 就是 Java 并发包中提供的一种同步工具,下面我们就来看看如何使用CountDownLatch实现多线程协作吧
    2023-11-11
  • 简单谈谈Spring Ioc原理解析

    简单谈谈Spring Ioc原理解析

    学习过Spring框架的人一定都会听过Spring的IoC(控制反转) 、DI(依赖注入)这两个概念,对于初学Spring的人来说,总觉得IoC 、DI这两个概念是模糊不清的,是很难理解的,今天和大家分享网上的一些技术大牛们对Spring框架的IOC的理解以及谈谈我对Spring Ioc的理解。
    2018-09-09
  • 详解Spring Boot读取配置文件与配置文件优先级

    详解Spring Boot读取配置文件与配置文件优先级

    这篇文章主要介绍了详解Spring Boot读取配置文件与配置文件优先级,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-08-08
  • SpringMVC使用JsonView针对统一实体返回不同信息

    SpringMVC使用JsonView针对统一实体返回不同信息

    这篇文章主要为大家介绍了SpringMVC使用JsonView针对统一实体返回不同信息,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-03-03
  • Java开发完整短信验证码功能的全过程

    Java开发完整短信验证码功能的全过程

    利用短信验证码进行身份验证是目前互联网众多产品常用的一种方式,那么这种短信验证功能是如何实现的呢,下面这篇文章主要给大家介绍了关于Java开发完整短信验证码功能的相关资料,需要的朋友可以参考下
    2021-10-10
  • Eclipse配置python开发环境过程图解

    Eclipse配置python开发环境过程图解

    这篇文章主要介绍了Eclipse配置python开发环境过程图解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-03-03
  • Mybatis图文并茂讲解分页插件

    Mybatis图文并茂讲解分页插件

    使用过mybatis的人都知道,mybatis本身就很小且简单,sql写在xml里,统一管理和优化。缺点当然也有,比如我们使用过程中,要使用到分页,如果用最原始的方式的话,1.查询分页数据,2.获取分页长度,也就是说要使用到两个方法才能完成分页
    2022-07-07
  • Java的Semaphore信号量使用及原理解读

    Java的Semaphore信号量使用及原理解读

    这篇文章主要介绍了Java的Semaphore信号量使用及原理解读,Semaphore(信号量)是Java中一个并发控制工具,用于控制对共享资源的访问,它基于计数器的原理,可以限制同时访问某个资源的线程数量,需要的朋友可以参考下
    2023-12-12
  • 全面解析Java中的GC与幽灵引用

    全面解析Java中的GC与幽灵引用

    一般的应用程序不会涉及到 Reference 编程, 但是了解这些知识会对理解 GC 的工作原理以及性能调优有一定帮助,在实现一些基础性设施比如缓存时也可能会用到,希望本文能有所帮助
    2013-09-09

最新评论