Python使用Tesseract实现从图像中读取文本

 更新时间:2023年11月03日 08:18:30   作者:迹忆客  
Tesseract 是一个基于计算机的系统,用于光学字符识别 (OCR) 和其他图像到文本处理,本文将介绍如何使用 Python 中的 Tesseract 创建一个可以从图像中读取文本的程序,需要的可以参考下

我们将介绍如何使用 Python 中的 Tesseract 创建一个可以从图像中读取文本的程序。

Python 中的超正方体

当我们使用需要从图像中读取文本的功能的系统时,我们会使用 Python 中的 Tesseract。 它提供了强大的功能,帮助我们更准确、更高效地从图像中读取文本。

本文还将介绍使用流行的 OpenCV 库从图像中提取文本。

Tesseract 是一个基于计算机的系统,用于光学字符识别 (OCR) 和其他图像到文本处理。 它主要用于不使用拉丁字母的语言的文本识别。

该系统可用于多种用途,包括文本和数据挖掘、教育、翻译和机器翻译。

Tesseract 也是该软件开源版本的名称。 它通常用于自然语言处理和机器学习中的文本分类和其他与文本相关的任务。

首先,让我们使用以下代码行在 Python 中安装 Tesseract 工具。

# python
pip install pytesseract

安装 Tesseract 工具后,我们将安装其他重要的库,我们将在示例中使用它们从图像中读取文本。 首先,我们将使用以下命令安装 OpenCV。

# python
pip install opencv-python

现在我们将安装 ArgParse 库,我们将使用它来创建用户友好的命令行界面。 我们可以使用以下命令轻松安装它。

# python
pip install argparse

我们现在将安装 Pillow 库,一个 Python 成像库。 该库将为我们的 python 解释器添加图像处理功能。

我们可以使用下面所示的命令安装这个库。

# python
pip install Pillow

在 Python 中使用 Tesseract 从图像中读取文本

现在,让我们使用 Tesseract 在 Python 中从图像中读取文本。 我们需要按照以下步骤使其发挥作用。

首先,我们将从图库中导入或加载要从中读取文本的图像,如果没有,我们可以从 Chrome 下载它,然后加载它。

导入图像后,我们会将加载的图像转换为二进制文件。 在最后一步中,我们将二进制文件发送到 Tesseract,Tesseract 将查找其中的文本并从图像中返回文本。

我们将导入之前安装的所有库。

# python
import cv2
import os,argparse
import pytesseract
from PIL import Image

我们将使用 ArgParse 函数 ArgumentParser() 构造参数解析器,如下所示。

# python
imgArg = argparse.ArgumentParser()
imgArg.add_argument("-i","--image",
                required=True,
                help="Enter path of image folder")
imgArg.add_argument("-p","--pre_processor",
                default="thresh",
                help="the preprocessor usage")
arguments = vars(imgArg.parse_args())

现在,我们将使用 OpenCV 库通过以下代码读取带有文本的图像。

# python
imageRead = cv2.imread(arguments["image"])

现在,我们将使用 OpenCV 库将图像转换为灰度,如下所示。

#python
imgGray=cv2.cvtColor(imageRead, cv2.COLOR_BGR2GRAY)

然后,我们将使用 if-else 语句来检查图像是否被脱粒或模糊。 如果是,我们可以更改阈值和模糊,如下所示。

# python
if arguments["pre_processor"]=="thresh":
    cv2.threshold(gray, 0,255,cv2.THRESH_BINARY| cv2.THRESH_OTSU)[1]
if arguments["pre_processor"]=="blur":
    cv2.medianBlur(gray, 3)

如下所示,我们将使用 OpenCV 和 Tesseract 库将图像添加到内存中。

# python
nameImg = "{}.jpg".format(os.getpid())
cv2.imwrite(nameImg, gray)
imgText = pytesseract.image_to_string(Image.open(nameImg))
os.remove(nameImg)
print(imgText)

现在,我们将使用以下代码显示图像输出。

# python
cv2.imshow("Images Uploaded", imageRead)
cv2.imshow("Images Converted In Grayscale", imgGray)
cv2.waitKey(0)

现在,让我们使用以下代码运行上面的代码,并检查它是如何工作的以及它从图像中读取文本的效果如何。

# python
python main.py --image img/read.jpg

我们发送的图片如下所示:

图像处理完成后,将以灰度形式保存,如下所示:

我们将在命令提示符中得到以下输出:

正如您在上面的示例中看到的,我们可以轻松使用图像并阅读其文本。 如果需要,我们可以存储它们或将它们显示在控制台中。

以上就是Python使用Tesseract实现从图像中读取文本的详细内容,更多关于python Tesseract图像读取文本的资料请关注脚本之家其它相关文章!

相关文章

  • python多线程同步之文件读写控制

    python多线程同步之文件读写控制

    这篇文章主要为大家详细介绍了python多线程同步之文件读写控制,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-08-08
  • Python中asyncio与aiohttp入门教程

    Python中asyncio与aiohttp入门教程

    今天小编就为大家分享一篇关于Python中asyncio与aiohttp入门教程,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2018-10-10
  • python itchat实现微信自动回复的示例代码

    python itchat实现微信自动回复的示例代码

    本篇文章主要介绍了python itchat实现微信自动回复的示例代码,可以实现微信自动回复,有兴趣的可以了解一下
    2017-08-08
  • mac 上配置Pycharm连接远程服务器并实现使用远程服务器Python解释器的方法

    mac 上配置Pycharm连接远程服务器并实现使用远程服务器Python解释器的方法

    这篇文章主要介绍了mac 上如何配置Pycharm连接远程服务器并实现使用远程服务器Python解释器,本文通过图文并茂的形式给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-03-03
  • python字典快速保存于读取的方法

    python字典快速保存于读取的方法

    下面小编就为大家分享一篇python字典快速保存于读取的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-03-03
  • 利用Python实现绘制3D爱心的代码分享

    利用Python实现绘制3D爱心的代码分享

    最近你是否也被李峋的爱心跳动代码所感动,心动不如行动,相同的代码很多,我们今天换一个玩法!构建一个三维的跳动爱心!嗯!这篇博客本着开源的思想!不是说谁对浪漫过敏的
    2022-11-11
  • pandas中df.rename()的具体使用

    pandas中df.rename()的具体使用

    本文主要介绍了pandas中df.rename()的具体使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-08-08
  • Python处理PPT文件的实用知识点总结

    Python处理PPT文件的实用知识点总结

    python是一门很强大的语言,因为有着丰富的第三方库,所以可以说Python是无所不能的,下面这篇文章主要给大家介绍了关于用Python提取PPT中图片的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2023-01-01
  • python给微信好友定时推送消息的示例

    python给微信好友定时推送消息的示例

    今天小编就为大家分享一篇python给微信好友定时推送消息的示例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-02-02
  • Python入门Anaconda和Pycharm的安装和配置详解

    Python入门Anaconda和Pycharm的安装和配置详解

    这篇文章主要介绍了Python入门Anaconda和Pycharm的安装和配置详解,文章通过图文介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-07-07

最新评论