Python3实现获取图片文字里中文的方法分析

 更新时间:2018年12月13日 11:11:32   作者:huxiangen  
这篇文章主要介绍了Python3实现获取图片文字里中文的方法,结合实例形式分析了Python基于文字识别引擎tesseract-ocr针对图片里中文识别的相关操作技巧与操作注意事项,需要的朋友可以参考下

本文实例讲述了Python3实现获取图片文字里中文的方法。分享给大家供大家参考,具体如下:

一、运行环境

(1) win10

(2) pycharm

(3) python 3.5

(4) pillow与pytesseract库安装:

pip3 install pillow
pip3 install pytesseract

(5)  识别引擎tesseract-ocr ,下载之后解压安装,下载地址:https://www.jb51.net/softs/538925.html

二、 运行代码

# -*- coding: utf-8 -*-
from PIL import Image
import pytesseract
#上面都是导包,只需要下面这一行就能实现图片文字识别
text=pytesseract.image_to_string(Image.open('show.jpg'),lang='chi_sim') #设置为中文文字的识别
#text=pytesseract.image_to_string(Image.open('test.png'),lang='eng')  #设置为英文或阿拉伯字母的识别
print(text)

三、报错解决

1.FileNotFoundError:[WinError 2]系统找不到指定文件。

解决办法:

打开文件pytesseract.py,找到如下代码,将tesseract_cmd的值修改为全路径,再次使用就不会报这个错了。

tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'

2.pytesseract.pytesseract.TesseractError:(1,'Error opening data file\\Progr

解决办法:

打开文件pytesseract.py,找到image_to_string,指定config的参数,如下:

tessdata_dir_config = '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'
def image_to_string(image, lang=None, boxes=False, config=tessdata_dir_config):

更多关于Python相关内容感兴趣的读者可查看本站专题:《Python数据结构与算法教程》、《Python编码操作技巧总结》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》及《Python入门与进阶经典教程

希望本文所述对大家Python程序设计有所帮助。

相关文章

  • 跟老齐学Python之有容乃大的list(3)

    跟老齐学Python之有容乃大的list(3)

    现在是讲lis的第三章了。俗话说,事不过三,不知道在开头,我也不知道这一讲是不是能够把基础的list知识讲完呢。哈哈。其实如果真正写文章,会在写完之后把这句话删掉的。而我则是完全像跟看官聊天一样,就不删除了。
    2014-09-09
  • python实现打开手机app并点击操作

    python实现打开手机app并点击操作

    这篇文章主要介绍了python实现打开手机app并点击操作,本文分为两部分一部分是打开应用,第二部分是调式手机连接电脑,需要的朋友可以参考下
    2022-04-04
  • Python实现自动签到脚本的示例代码

    Python实现自动签到脚本的示例代码

    这篇文章主要介绍了Python实现自动签到脚本的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-08-08
  • python操作xlsx格式文件并读取

    python操作xlsx格式文件并读取

    python操作xlsx格式文件是比较常见的一个问题,本文给大家介绍xlrd库读取,pandas库读取的实例代码,给大家讲解的很详细,需要的朋友跟随小编一起看看吧
    2021-06-06
  • Python 获取当前所在目录的方法详解

    Python 获取当前所在目录的方法详解

    本文给大家讲解的是使用python获取当前所在目录的方法以及相关示例,非常的清晰简单,有需要的小伙伴可以参考下
    2017-08-08
  • Python中关于面向对象中继承的详细讲解

    Python中关于面向对象中继承的详细讲解

    面向对象编程 (OOP) 语言的一个主要功能就是“继承”。继承是指这样一种能力:它可以使用现有类的所有功能,并在无需重新编写原来的类的情况下对这些功能进行扩展
    2021-10-10
  • Python随机验证码生成和join 字符串的问题解析

    Python随机验证码生成和join 字符串的问题解析

    Python中有join()和os.path.join()两个函数,join是将字符串、元组、列表中的元素以指定的字符(分隔符)连接生成一个新的字符串而os.path.join(): 将多个路径组合后返回,本文给大家介绍的非常详细,需要的朋友一起看看吧
    2022-04-04
  • Django使用HTTP协议向服务器传参方式小结

    Django使用HTTP协议向服务器传参方式小结

    本文主要介绍了Django使用HTTP协议向服务器传参方式小结,用户发送请求时携带的参数后端需要使用,而不同的发送参数的方式对应了不同的提取参数的方式,本文就详细的介绍一下
    2021-08-08
  • python自动获取微信公众号最新文章的实现代码

    python自动获取微信公众号最新文章的实现代码

    这篇文章主要介绍了python自动获取微信公众号最新文章,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-07-07
  • 解决tensorflow打印tensor有省略号的问题

    解决tensorflow打印tensor有省略号的问题

    今天小编就为大家分享一篇解决tensorflow打印tensor有省略号的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02

最新评论