python+Tesseract OCR实现截屏识别文字

 更新时间:2023年11月06日 10:46:17   作者:秃了也弱了。  
pytesseract Python常用pytesseract进行图片上的文字识别,本文主要介绍了python+Tesseract OCR实现截屏识别文字,具有一定的参考价值,感兴趣的可以了解一下

一、tesseract-ocr下载安装

1、下载

以下是关于Tesseract的常用网址
下载地址:https://digi.bib.uni-mannheim.de/tesseract/
官方网站:https://github.com/tesseract-ocr/tesseract
官方文档:https://github.com/tesseract-ocr/tessdoc
语言包地址:https://github.com/tesseract-ocr/tessdata

2、安装tesseract-ocr

(1)选择语言

(2)开始安装

(3)同意许可

(4)选择安装的用户

(5)选择附带要安装的语言包

此后会在安装过程中会自动从服务器下载该语言包。(这里不太建议勾选下载语言包,因为下载速度实在太慢。本教程后续会介绍如何拓展语言包,但如果已经翻墙的话,可以忽略这个建议。)

默认即可。

(6)安装位置

(7)开始安装

(8)安装完成

3、安装语言包

(1)下载安装

https://github.com/tesseract-ocr/tessdata

项目较大,可以按需下载简体中文:

将下载的文件存放到该目录:D:\Program Files\Tesseract-OCR\tessdata

注:若小伙伴无法科学上网,可以从这里下载简体中文语言包:https://www.jb51.net/softs/538925.html

(2)测试

进入到Tesseract OCR安装目录:

# 查看版本
PS D:\Program Files\Tesseract-OCR> .\tesseract.exe -v
tesseract v5.3.0.20221214
 leptonica-1.78.0
  libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.3) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0
 Found AVX2
 Found AVX
 Found FMA
 Found SSE4.1
 Found libarchive 3.5.0 zlib/1.2.11 liblzma/5.2.3 bz2lib/1.0.6 liblz4/1.7.5 libzstd/1.4.5
 Found libcurl/7.77.0-DEV Schannel zlib/1.2.11 zstd/1.4.5 libidn2/2.0.4 nghttp2/1.31.0
# 查看安装的语言包
PS D:\Program Files\Tesseract-OCR> .\tesseract.exe --list-langs
List of available languages in "D:\Program Files\Tesseract-OCR/tessdata/" (4):
chi_sim
chi_sim_vert
eng
osd

二、python截屏识别文字

1、安装必须的包

pip install pyautogui
pip install pytesseract

2、截屏识别文字

import pyautogui
import pytesseract

# 设置Tesseract的安装路径(如果它不在默认的系统路径中)
pytesseract.pytesseract.tesseract_cmd = 'D:/Program Files/Tesseract-OCR/tesseract.exe'

# 截取屏幕截图
screenshot = pyautogui.screenshot()

# 定义区域范围(左上角x坐标,左上角y坐标,右下角x坐标,右下角y坐标)
region = (100, 100, 300, 200)

# 从屏幕截图中使用指定区域创建一个新的图像对象
custom_screenshot = screenshot.crop(region)

# 将图像对象转换为灰度图像,以帮助提高文本识别的准确性
custom_screenshot = custom_screenshot.convert('L')

# 使用pytesseract进行文字识别
text = pytesseract.image_to_string(custom_screenshot)

# 打印识别的文本
print(text)

3、准确度

英文准确度还行,中文准确度。。。一言难尽。应该是可以通过训练提高准确度的。

参考资料

https://blog.csdn.net/weixin_51571728/article/details/120384909

到此这篇关于python+Tesseract OCR实现截屏识别文字的文章就介绍到这了,更多相关python Tesseract OCR 识别文字内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • tensorflow+k-means聚类简单实现猫狗图像分类的方法

    tensorflow+k-means聚类简单实现猫狗图像分类的方法

    这篇文章主要介绍了tensorflow+k-means聚类简单实现猫狗图像分类,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-04-04
  • Python+Pygame实现简单的射击小游戏

    Python+Pygame实现简单的射击小游戏

    要说什么游戏能够获得大家的喜爱,唯射击游戏莫属!本文将利用Python和Pygame库制作一个简单的射击小游戏,感兴趣的小伙伴可以了解一下
    2022-04-04
  • Python创建文件和追加文件内容实例

    Python创建文件和追加文件内容实例

    这篇文章主要介绍了Python创建文件和追加文件内容实例,本文同时给出了把标准输出定向到文件实例,需要的朋友可以参考下
    2014-10-10
  • 详解python日期时间处理

    详解python日期时间处理

    这篇文章主要为大家介绍了python日期时间处理,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2021-12-12
  • Python字典,函数,全局变量代码解析

    Python字典,函数,全局变量代码解析

    这篇文章主要介绍了Python字典,函数,全局变量代码解析,具有一定借鉴价值,需要的朋友可以参考下。
    2017-12-12
  • Python类方法总结讲解

    Python类方法总结讲解

    这篇文章主要介绍了Python类方法总结讲解,本篇文章通过简要的案例,讲解了该项技术的了解与使用,以下就是详细内容,需要的朋友可以参考下
    2021-07-07
  • python简单实现刷新智联简历

    python简单实现刷新智联简历

    本文给大家分享的是个人弄的一个使用Python简单实现刷新智联招聘简历的小工具的代码,非常的简单,给大家参考下吧。
    2016-03-03
  • Python wheel文件详细介绍

    Python wheel文件详细介绍

    wheel是新的Python的disribution,用于替代Python传统的egg文件。目前有超过一半的库文件有对应的wheel文件,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习吧
    2022-09-09
  • Python连接MySQL数据库并查找表信息

    Python连接MySQL数据库并查找表信息

    本文主要介绍了Python连接MySQL数据库并查找表信息,通过使用Python中的MySQL Connector模块,连接到MySQL服务器并执行SQL查询语句,可以获取表的结构、列信息、行数据等,感兴趣的可以了解一下
    2023-08-08
  • python使用multiprocessing的详细方法

    python使用multiprocessing的详细方法

    multiprocessing是Python标准库中的一个模块,用于实现多进程编程,它提供了一种简单而高效的方式来利用多核处理器的能力,通过在多个进程中同时执行任务,加快程序的执行速度和提高系统的吞吐量,这篇文章主要介绍了python使用multiprocessing,需要的朋友可以参考下
    2024-03-03

最新评论