python使用tesseract实现字符识别功能

 更新时间:2024年10月24日 11:52:19   作者:for(::)  
Tesseract 是一个开源的光学字符识别(OCR)引擎,它能够识别多种语言的文本,可将扫描文档、图像中的文字提取并转换为计算机可编辑的文本格式,本文给大家介绍了python使用tesseract实现字符识别功能,需要的朋友可以参考下

介绍

Tesseract 是一个开源的光学字符识别(OCR)引擎,它能够识别多种语言的文本,可将扫描文档、图像中的文字提取并转换为计算机可编辑的文本格式。

1. 安装tesseract

首先到下列地址处,下载tesseract安装程序,并安装。

tesseract下载地址(第三方非官网)

https://digi.bib.uni-mannheim.de/tesseract/

安装完成后,进入安装目录找到tesseract.exe,并且拷贝路径,然后到编译器编写python代码。

2. 编写python代码

import cv2
import pytesseract

# 指定 Tesseract-OCR 可执行文件的路径
pytesseract.pytesseract.tesseract_cmd = "D:\\computer_vision_lib\\tesseract-ocr5.3\\tesseract.exe"

# 选择一张要识别的字符图片
img = cv2.imread("test.png")
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

# 使用 Tesseract-OCR 进行文字识别,并返回识别到的字符
print(pytesseract.image_to_string(img))
print('--'*10)

# 获取每个字符的边界框的坐标
print(pytesseract.image_to_boxes(img))

hImg, wImg, _ = img.shape
boxes = pytesseract.image_to_boxes(img)
for b in boxes.splitlines():
    b = b.split(' ')
    x, y, w, h = int(b[1]), int(b[2]), int(b[3]), int(b[4])
    cv2.rectangle(img, (x, hImg - y), (w, hImg - h), (0, 0, 255), 3)
    cv2.putText(img, b[0], (x, hImg - y + 25), cv2.FONT_HERSHEY_COMPLEX, 1, (50, 50, 255), 2)

cv2.imshow("Image", img)
cv2.waitKey(0)

执行截图如下:

到此这篇关于python使用tesseract实现字符识别功能的文章就介绍到这了,更多相关python tesseract字符识别内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python通过future处理并发问题

    Python通过future处理并发问题

    这篇文章主要介绍了Python通过future处理并发问题,非常不错,具有参考借鉴价值,需要的朋友可以参考下
    2017-10-10
  • Python+Selenium自动化环境搭建与操作基础详解

    Python+Selenium自动化环境搭建与操作基础详解

    Selenium是如今最常用的自动化测试工具之一,支持快速开发自动化测试框架,且支持在多种浏览器上执行测试。本文将介绍关于Selenium Python自动化脚本环境搭建的相关资料,需要的朋友可以参考下
    2022-03-03
  • flask 框架操作MySQL数据库简单示例

    flask 框架操作MySQL数据库简单示例

    这篇文章主要介绍了flask 框架操作MySQL数据库,结合实例形式详细分析了flask框架操作MySQL数据库的连接、表格创建、数据增删改查等相关使用技巧,需要的朋友可以参考下
    2020-02-02
  • Tensorflow自定义模型与训练超详细讲解

    Tensorflow自定义模型与训练超详细讲解

    TensorFlow是基于数据流编程的符号数学系统,广泛用于机器学习算法的编程实现,前身是谷歌的神经网络算法库DistBelief,Tensorflow拥有多层级结构,可部署于各类服务器、PC终端和网页并支持GPU和TPU高性能数值计算,被广泛应用于谷歌内部的产品开发和各领域的科学研究
    2022-11-11
  • Python自动化实现批量重命名文件

    Python自动化实现批量重命名文件

    我们在工作中经常遇到需要批量处理文件的场景,如果手动一个个改太浪费时间了,下面我们就来看看如何使用Python 几行代码搞定批量重命名,从此告别重复劳动吧
    2026-03-03
  • 使用python提升图片清晰度的常见方法

    使用python提升图片清晰度的常见方法

    在Python中,提升图片清晰度可以通过多种方法实现,其中一些常见的方法包括使用图像处理库如OpenCV和Pillow,下面小编就来和大家介绍一下具体实现方法吧
    2025-04-04
  • Python使用Selenium将网页保存为图片或PDF

    Python使用Selenium将网页保存为图片或PDF

    这篇文章主要为大家详细介绍了Python如何使用Selenium配合Pillow实现将网页保存为图片或PDF,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下
    2026-02-02
  • 基于Python实现银行卡识别的示例代码

    基于Python实现银行卡识别的示例代码

    银行卡识别是一个在金融、安全等领域具有重要应用的问题,本文主要为大家介绍了如何使用Python和深度学习技术来实现银行卡识别功能,需要的可以参考下
    2024-03-03
  • pycharm创建scrapy项目教程及遇到的坑解析

    pycharm创建scrapy项目教程及遇到的坑解析

    这篇文章主要介绍了pycharm创建scrapy项目教程及遇到的坑解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-08-08
  • 高效访问Pandas DataFrame中满足特定条件的行

    高效访问Pandas DataFrame中满足特定条件的行

    在使用 Pandas DataFrame 时,我们经常需要对其中的数据进行过滤,只选择满足特定条件的行,本文主要介绍了高效访问Pandas DataFrame中满足特定条件的行,具有一定的参考价值,感兴趣的可以了解一下
    2025-04-04

最新评论