Python pytesseract验证码识别库用法解析

 更新时间:2020年06月29日 08:37:26   作者:Alpiny’ Blog  
这篇文章主要介绍了Python pytesseract验证码识别库用法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

环境 centos7 python3

pytesseract只是tesseract-ocr的一种实现接口。所以要先安装tesseract-ocr(大名鼎鼎的开源的OCR识别引擎)。

依赖安装

yum install-y automake autoconf libtool gcc gcc-c++
yum install-y libpng-devel libjpeg-devel libtiff-devel giflib-devel

安装依赖的leptonica库

wget http://www.leptonica.com/source/leptonica-1.72.tar.gz
tar -xzvf leptonica-1.72.tar.gz
cd leptonica-1.72
./configure
make && make install

安装tesseract-ocr

wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
mv 3.04.00 Tesseract3.04.00.tar.gz
tar -xvf Tesseract3.04.00.tar.gz
cd tesseract-3.04.00/
./configure
make && make install

安装语言包:

wget https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata #英文默认包
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata #中文繁体
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata #中文简体

cp/mv *.traineddata /usr/local/share/tessdata/ #移动下载的包到/usr/local/share/tessdata/ 这个路径下,也可以手动移动

安装pytesseract:

pip install Pillow
pip install pytesseract

至此安装完成,附上使用方法:

import pytesseract 
from PIL import Imag

image = Image.open("port_img.jpg")
text = pytesseract.image_to_string(image)
print(text)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • Python提取PDF指定内容并生成新文件

    Python提取PDF指定内容并生成新文件

    本文为你展示,如何用Python把许多PDF文件的文本内容批量提取出来,并且整理存储到数据框中,以便于后续的数据分析。感兴趣的可以了解一下
    2021-06-06
  • Flask中Cookie和Session理解与作用介绍

    Flask中Cookie和Session理解与作用介绍

    Flask是一个使用 Python 编写的轻量级 Web 应用框架。其 WSGI 工具箱采用 Werkzeug ,模板引擎则使用 Jinja2 。Flask使用 BSD 授权。Flask也被称为 “microframework” ,因为它使用简单的核心,用 extension 增加其他功能,Flask中Cookie和Session有什么区别呢
    2022-10-10
  • Python Matplotlib实现三维数据的散点图绘制

    Python Matplotlib实现三维数据的散点图绘制

    这篇文章主要为大家详细介绍了Python Matplotlib实现三维数据的散点图绘制,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-03-03
  • python 中不同包 类 方法 之间的调用详解

    python 中不同包 类 方法 之间的调用详解

    这篇文章主要介绍了python 中不同包 类 方法 之间的调用详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • Python实现去除Excel重复数据并统计重复次数

    Python实现去除Excel重复数据并统计重复次数

    这篇文章主要为大家详细介绍了如何利用Python语言实现文本数据去重,创建包含唯一值的新列,并统计文本数据出现的次数,需要的可以参考下
    2023-08-08
  • python实现TCP服务器端与客户端的方法详解

    python实现TCP服务器端与客户端的方法详解

    这篇文章主要介绍了python实现TCP服务器端与客户端的方法,以实例形式详解分析了Python实现服务器端与客户端的技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-04-04
  • 使用Python和大模型进行数据分析和文本生成

    使用Python和大模型进行数据分析和文本生成

    Python语言以其简洁和强大的特性,成为了数据科学、机器学习和人工智能开发的首选语言之一,在这篇文章中,我将介绍如何用Python连接和使用大模型,并通过示例展示如何在实际项目中应用这些技术,需要的朋友可以参考下
    2024-05-05
  • python爬取数据中的headers和代理IP问题分析

    python爬取数据中的headers和代理IP问题分析

    这篇文章主要为大家介绍了python爬取数据中的headers和代理IP问题分析,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-06-06
  • python实现超时退出的三种方式总结

    python实现超时退出的三种方式总结

    这篇文章主要介绍了python实现超时退出的三种方式总结,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-11-11
  • python爬取招聘要求等信息实例

    python爬取招聘要求等信息实例

    在本篇文章里小编给大家整理了关于python爬取招聘要求等信息实例内容,有兴趣的朋友们可以学习下。
    2020-11-11

最新评论