SpringBoot+Tess4j实现牛的OCR识别工具的示例代码

 更新时间:2021年01月14日 10:41:42   作者:小隐乐乐  
这篇文章主要介绍了SpringBoot+Tess4j实现牛的OCR识别工具的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

前言

“ 等不到风中你的脸颊

眼泪都美到很融洽

等不到掩饰的雨落下

我的眼泪被你察觉 ”

听着循环的歌曲,写着久违的bug。好吧,还是一天。正好一个小伙伴说,要不要做个工具站玩一下。我就随意的找了个工具站,看了下,发现很多都有文字的OCR识别功能。因此,我想起来之前了解的非常流行的开源的OCR大神级别的项目,Tesseract OCR。

简单介绍

官网如下所示

tesseract-ocr.github.io/

简洁明了,挂在github上的网站。

详细的不再介绍,感兴趣的,可以进入网站:https://github.com/tesseract-ocr/tesseract ,观摩学习。

实操准备

要想在开发中使用,还是需要接入对应的API。

对于开发者来说,提供了众多的Wrapper,来实现Api调用。

对于Java一名小开发,来讲,还是使用tess4j,作为Api来使用。官网如下:

tess4j.sourceforge.net/

可以直接下载jar包,或者采用Maven依赖下载。

<!-- https://mvnrepository.com/artifact/net.sourceforge.tess4j/tess4j -->
<dependency>
  <groupId>net.sourceforge.tess4j</groupId>
  <artifactId>tess4j</artifactId>
  <version>4.5.3</version>
</dependency>

开发实现

First 创建工程

Second 添加依赖

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
  <modelVersion>4.0.0</modelVersion>

  <groupId>org.example</groupId>
  <artifactId>test-textocr</artifactId>
  <version>1.0-SNAPSHOT</version>
  <dependencies>
    <!-- https://mvnrepository.com/artifact/net.sourceforge.tess4j/tess4j -->
    <dependency>
      <groupId>net.sourceforge.tess4j</groupId>
      <artifactId>tess4j</artifactId>
      <version>4.5.3</version>
    </dependency>

  </dependencies>

</project>

Third 填写类文件

package ocr;

import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;


/**
* ocr测试.
*
* @author huc_逆天
* @since 2021/1/12 17:42
*/
public class TestTextOcr {

  public static void main(String[] args) throws IOException {
    // 创建实例
    ITesseract instance = new Tesseract();

    // 设置识别语言

    instance.setLanguage("chi_sim");

    // 设置识别引擎

    instance.setOcrEngineMode(1);

    // 读取文件

    BufferedImage image = ImageIO.read(TestTextOcr.class.getResourceAsStream("/2.jpg"));
    try {

      // 识别

      String result = instance.doOCR(image);
      System.out.println(result);
   } catch (TesseractException e) {
      System.err.println(e.getMessage());
   }


 }
}

Fifth 添加训练语言环境配置

TESSDATA_PREFIX=F:\tessdata ,变量名,固定,值为官网下载文件 https://github.com/tesseract-ocr/tessdata

Sixth 运行

结果如下:

可能识别模式,不是很合适,切换下

instance.setOcrEngineMode(0);

是不是舒服多了,哈哈。识别率瞬间上涨。

大家可以自行测试。

总结

好了,今天就到这了。技术在于折腾。多学习,让自己武装起来,变强大。

到此这篇关于SpringBoot+Tess4j实现牛的OCR识别工具的示例代码的文章就介绍到这了,更多相关SpringBoot Tess4j OCR识别内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Springboot项目引入druid安装部署使用教程

    Springboot项目引入druid安装部署使用教程

    这篇文章主要介绍了Springboot项目引入druid安装部署使用,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-01-01
  • MyBatis使用标签动态操作数据库详解

    MyBatis使用标签动态操作数据库详解

    这篇文章主要介绍了MyBatis中使用标签动态操作数据库的方法,动态SQL是指在运行PL/SQL块时动态输入SQL语句,是Mybatis的强大特性之⼀,能够完成不同条件下不同的sql拼接,需要的朋友可以参考下
    2024-05-05
  • 深入讲解基于JDK的动态代理机制

    深入讲解基于JDK的动态代理机制

    众所周知相比于静态代理,动态代理避免了开发人员编写各个繁锁的静态代理类,下面这篇文章主要给大家介绍了关于基于JDK的动态代理机制的相关资料,文中通过图文以及示例代码介绍的非常详细,需要的朋友可以参考下
    2018-07-07
  • java常用工具类之Excel操作类及依赖包下载

    java常用工具类之Excel操作类及依赖包下载

    这篇文章主要介绍了java常用工具类Excel操作类及依赖包下载,需要的朋友可以参考下
    2014-07-07
  • Java的函数方法详解(含汉诺塔问题)

    Java的函数方法详解(含汉诺塔问题)

    汉诺塔问题是一个经典的递归问题,下面这篇文章主要给大家介绍了关于Java函数方法(含汉诺塔问题)的相关资料,文中通过图文以及代码示例介绍的非常详细,需要的朋友可以参考下
    2023-11-11
  • Kotlin内存陷阱inline使用技巧示例详解

    Kotlin内存陷阱inline使用技巧示例详解

    这篇文章主要为大家介绍了Kotlin内存陷阱inline使用技巧示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-10-10
  • Nacos配置中心的配置文件的匹配规则及说明

    Nacos配置中心的配置文件的匹配规则及说明

    这篇文章主要介绍了Nacos配置中心的配置文件的匹配规则及说明,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-11-11
  • java中动态代理如何实现详解

    java中动态代理如何实现详解

    动态代理是基于接口实现的代理,mybatis就是用这个技术实现的,下面这篇文章主要给大家介绍了关于java中动态代理如何实现的相关资料,需要的朋友可以参考下
    2024-01-01
  • 浅谈JVM之使用JFR解决内存泄露

    浅谈JVM之使用JFR解决内存泄露

    内存泄露的主要原因就是java中的对象生命周期有长有短。如果长生命周期的对象引用了短生命周期的对象,就有可能造成事实上的内存泄露。本文将介绍JVM之使用JFR解决内存泄露。
    2021-06-06
  • 教你创建springcloud微服务的基础子服务的超详细过程

    教你创建springcloud微服务的基础子服务的超详细过程

    这篇文章主要介绍了创建springcloud微服务的基础子服务,主要是创建两个springboot服务,在教程中增加springcloud相关组件,本文分步骤给大家介绍的非常详细,需要的朋友可以参考下
    2022-04-04

最新评论