python利用 pytesseract快速识别提取图片中的文字((图片识别)

 更新时间:2022年11月10日 10:07:22   作者:广龙宇  
本文介绍了tesseract的python调用,也就是pytesseract库,其中还有一些其他的内容并没有涉及,仅涉及到了图片提取文字,如果你对其感兴趣,可以深入探索一下,也希望能和我探讨一下

提示:本文多图,请手机端注意流量。

前言

利用python做图片识别,识别提取图片中的文字会有很多方法,但是想要简单一点怎么办,那就可以使用tesseract识别引擎来实现,一行代码就可以做到提取图片文本。

一、配置环境

1. 安装python依赖

本程序用到了两个python库,pytesseract和PIL,所以先来安装。

运行以下命令

pip install Pillow
pip install pytesseract 

如果在python中没有报错,说明程序安装成功,

2. 安装识别引擎

安装完以上两个依赖还需要对应的识别引擎。点击去下载

咱们直接使用5月10号构建的最新版本。

安装tesseract识别引擎(可跳过)

下载完成后打开程序进行安装,先选择语言,这里选择英语English就行,然后点ok

接下来就是next,完了点击I Agree同意协议,

为所有用户安装,然后点next,如图,

接下来安装中文的语言包用来识别中文,需要滑到下面,选择中文,我这里横排简体中文和竖排简体中文都选择了,完成后点击next,

选择安装路径,建议安装到C盘以外,然后点击next

这里点击安装install

等待安装完成

安装完成后,点击next,再点击finish完成安装,

验证是否安装成功

添加环境变量,就是你安装到的那个文件夹路径,直接加到path里面,

然后在命令行运行tesseract -v,如果和下图一样,说明你已经安装成功了,

二、使用步骤

1.引入库

from PIL import Image
import pytesseract

2.提取图片文字

将读取图片的一行代码封装为一个函数,

def read_image(name):
    print(pytesseract.image_to_string(Image.open(name), lang='chi_sim'))

main函数中直接调用即可,

def main():
    read_image('1657158527412.jpg')

3.运行效果

以以下图片为例,

运行效果如下,

总结

本文介绍了tesseract的python调用,也就是pytesseract库,其中还有一些其他的内容并没有涉及,仅涉及到了图片提取文字,如果你对其感兴趣,可以深入探索一下,也希望能和我探讨一下。

完整代码

from PIL import Image
import pytesseract
def read_image(name):
    print(pytesseract.image_to_string(Image.open(name), lang='chi_sim'))
def main():
    read_image('img.png')
if __name__ == '__main__':
    main()

到此这篇关于python利用 pytesseract快速识别提取图片中的文字( 图片识别)的文章就介绍到这了,更多相关python pytesseract识别图片文字内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python中利用sorted()函数排序的简单教程

    Python中利用sorted()函数排序的简单教程

    这篇文章主要介绍了Python中利用sorted()函数排序的简单教程,sorted()函数有返回值,在Python的排序实现中发挥着相当重要的作用,需要的朋友可以参考下
    2015-04-04
  • Python中BeautifuSoup库的用法使用详解

    Python中BeautifuSoup库的用法使用详解

    这篇文章主要介绍了Python中BeautifuSoup库的用法使用详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-11-11
  • python实现 获取b站主播直播间 粉丝牌信息的方法

    python实现 获取b站主播直播间 粉丝牌信息的方法

    这篇文章主要介绍了python实现 获取b站主播直播间粉丝牌信息 ,用于实现通过牌子逆向查主播信息这个功能,本文结合实例代码给大家介绍的非常详细,需要的朋友可以参考下
    2023-02-02
  • 利用Python实现获取照片位置信息

    利用Python实现获取照片位置信息

    Python中的exifread库,不仅仅是 GPS 信息,几乎能获得图片的所有信息。本文就将利用这个库实现获取照片位置信息,感兴趣的可以了解一下
    2022-08-08
  • 如何解决import torchvision报错问题 DLL:找不到模块

    如何解决import torchvision报错问题 DLL:找不到模块

    这篇文章主要介绍了如何解决import torchvision报错问题 DLL:找不到模块,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-01-01
  • Python split()函数使用方法详解

    Python split()函数使用方法详解

    这篇文章主要给大家详细介绍一下Python split()函数的使用方法,文中有详细的代码示例供大家参考,具有一定的参考价值,需要的朋友可以参考下
    2023-07-07
  • 解析Anaconda创建python虚拟环境的问题

    解析Anaconda创建python虚拟环境的问题

    这篇文章主要介绍了Anaconda创建python虚拟环境,包括虚拟环境管理、虚拟环境中python包管理,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-03-03
  • python matplotlib绘图,修改坐标轴刻度为文字的实例

    python matplotlib绘图,修改坐标轴刻度为文字的实例

    今天小编就为大家分享一篇python matplotlib绘图,修改坐标轴刻度为文字的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-05-05
  • Python+Redis实现布隆过滤器

    Python+Redis实现布隆过滤器

    布隆过滤器(Bloom Filter)是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。这篇文章主要介绍了Python+Redis实现布隆过滤器,需要的朋友可以参考下
    2019-12-12
  • Python曲线拟合多项式深入详解

    Python曲线拟合多项式深入详解

    这篇文章主要给大家介绍了关于Python使用scipy进行曲线拟合的相关资料,Scipy优化和拟合采用的是optimize模块,该模块提供了函数最小值(标量或多维)、曲线拟合和寻找等式的根的有用算法,需要的朋友可以参考下
    2022-11-11

最新评论