Java计算两个汉字相似度的实现方法
更新时间:2023年11月01日 11:10:22 作者:老马啸西风
有时候我们希望计算两个汉字的相似度,比如文本的 OCR 等场景,用于识别纠正,本文给大家详细介绍了Java计算两个汉字相似度的实现方法,文中有详细的实现代码,需要的朋友可以参考下
计算汉字相似度
情景
有时候我们希望计算两个汉字的相似度,比如文本的 OCR 等场景。用于识别纠正。
实现
引入 maven
<dependency>
<groupId>com.github.houbb</groupId>
<artifactId>nlp-hanzi-similar</artifactId>
<version>1.3.0</version>
</dependency>
java 实现
double rate1 = HanziSimilarHelper.similar('末', '未');
返回对应的相似度:
0.9629629629629629
返回一个汉字的相似列表
情景
找到相似的汉字,有很多有趣的场景。
实现
List<String> list = HanziSimilarHelper.similarList('爱');
Assert.assertEquals("[爰, 爯, 受, 爭, 妥, 憂, 李, 爳, 叐, 雙]", list.toString());
开源地址
为了便于大家学习,上述代码已开源
https://github.com/houbb/nlp-hanzi-similar
在线体验
到此这篇关于Java计算两个汉字相似度的实现方法的文章就介绍到这了,更多相关Java计算两个汉字相似度内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
相关文章
解决mybatis-plus-boot-starter与mybatis-spring-boot-starter的错误问题
本文主要讲述了在使用MyBatis和MyBatis-Plus时遇到的绑定异常问题,通过排查和总结,作者发现使用MyBatis-Plus Boot Starter可以解决这个问题,文章详细对比了MyBatis-Plus Boot Starter和MyBatis Spring Boot Starter的功能和使用场景2025-01-01
Java8中List转Map(Collectors.toMap) 的技巧分享
在最近的工作开发之中,慢慢习惯了很多Java8中的Stream的用法,很方便而且也可以并行的去执行这个流,这篇文章主要给大家介绍了关于Java8中List转Map(Collectors.toMap) 的相关资料,需要的朋友可以参考下2021-07-07
mybatis 中 foreach collection的用法小结(三种)
这篇文章主要介绍了mybatis 中 foreach collection的用法小结(三种),需要的朋友可以参考下2017-10-10


最新评论