python 获取图片中文字的四种办法

 更新时间:2023年11月13日 11:32:34   作者:忧伤的玩不起  
本文主要介绍了python 获取图片中文字的几种办法,主要使用光学字符识别(OCR)技术,本文主要介绍了4种第三方库,具有一定的参考价值,感兴趣的可以了解一下

在Python中,获取图片中的中文文本通常需要使用光学字符识别(OCR)技术.

1.使用http请求库获取,分别主流有2种以下库

  • 使用百度OCR API:百度提供了OCR API服务,可以通过API调用来识别图片中的文本,包括中文。你需要注册百度开发者账号,获取API密钥,然后使用Python中的HTTP请求库发送图片并接收识别结果
  • 使用微软Azure OCR服务:微软Azure也提供了OCR服务,可以用来提取中文文本。与百度API类似,你需要注册Azure账号,创建一个OCR服务,然后使用Python中的HTTP请求库发送请求并获取结果。

2.使用第三方库,下面推荐4种第三方库及源码

Tesseract OCR库:

pip install pytesseract 
from PIL import Image
import pytesseract

# 打开图像
image = Image.open('your_image.png')

# 使用Tesseract进行文本提取
text = pytesseract.image_to_string(image, lang='chi_sim')

# 输出提取的中文文本
print(text)

EasyOCR库:

pip install easyocr
import easyocr

# 创建EasyOCR Reader
reader = easyocr.Reader(['ch_sim'])

# 打开图像
image = 'your_image.png'

# 使用EasyOCR进行文本提取
results = reader.readtext(image)

# 输出提取的中文文本
for (bbox, text, prob) in results:
    print(text)

PyOCR库:

pip install pyocr 
import pyocr
import pyocr.builders
from PIL import Image

# 获取Tesseract OCR工具
tools = pyocr.get_available_tools()
tool = tools[0]

# 打开图像
image = Image.open('your_image.png')

# 使用PyOCR进行文本提取
text = tool.image_to_string(
    image,
    lang='chi_sim',
    builder=pyocr.builders.TextBuilder()
)

# 输出提取的中文文本
print(text)

Google Cloud Vision API库:

pip install google-cloud-vision
from google.cloud import vision_v1p3beta1 as vision
from google.oauth2 import service_account

# 设置认证凭据
credentials = service_account.Credentials.from_service_account_file(
    'your-service-account-key.json'
)

# 创建Vision API客户端
client = vision.ImageAnnotatorClient(credentials=credentials)

# 打开图像
with open('your_image.png', 'rb') as image_file:
    content = image_file.read()

# 创建图像对象
image = vision.Image(content=content)

# 使用Vision API进行文本提取
response = client.text_detection(image=image)

# 输出提取的中文文本
for text in response.text_annotations:
    print(text.description)

请注意,对于Google Cloud Vision API,你需要替换 'your-service-account-key.json' 为你自己的服务账户密钥文件路径。确保在使用这些示例代码之前,你已经正确配置了相应的库和服务。

到此这篇关于python 获取图片中文字的四种办法的文章就介绍到这了,更多相关python 获取图片文字内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python基础之输入与输出

    python基础之输入与输出

    这篇文章主要介绍了python的输入与输出,实例分析了Python中返回一个返回值与多个返回值的方法,需要的朋友可以参考下
    2021-10-10
  • Python聊天室带界面实现的示例代码(tkinter,Mysql,Treading,socket)

    Python聊天室带界面实现的示例代码(tkinter,Mysql,Treading,socket)

    这篇文章主要介绍了Python聊天室带界面实现的示例代码(tkinter,Mysql,Treading,socket),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-04-04
  • Python复制Excel表格中指定数据若干次的方法

    Python复制Excel表格中指定数据若干次的方法

    本文介绍基于Python语言,读取Excel表格文件数据,并基于其中某一列数据的值,将这一数据处于指定范围的那一行加以复制,并将所得结果保存为新的Excel表格文件的方法,需要的朋友可以参考下
    2024-02-02
  • python编程通过蒙特卡洛法计算定积分详解

    python编程通过蒙特卡洛法计算定积分详解

    这篇文章主要介绍了python编程通过蒙特卡洛法计算定积分详解,具有一定借鉴价值,需要的朋友可以参考下。
    2017-12-12
  • Python Pytorch深度学习之神经网络

    Python Pytorch深度学习之神经网络

    今天小编就为大家分享一篇关于Pytorch神经网络的文章,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-10-10
  • Django中ORM基本应用与原理解析

    Django中ORM基本应用与原理解析

    Django的ORM模块是框架特色功能之一,它把数据表与Python类对应、表字段与类属性对应、类实例与数据记录对应,并将对类实例的操作映射到数据库中,这篇文章主要介绍了Django ORM基本应用与原理剖析,需要的朋友可以参考下
    2022-10-10
  • python神经网络tfrecords文件的写入读取及内容解析

    python神经网络tfrecords文件的写入读取及内容解析

    这篇文章主要为大家介绍了python神经网络tfrecords文件的写入读取及内容解析,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05
  • pycharm 快速解决python代码冲突的问题

    pycharm 快速解决python代码冲突的问题

    这篇文章主要介绍了pycharm 快速解决python代码冲突的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-01-01
  • 解决Pycharm出现的部分快捷键无效问题

    解决Pycharm出现的部分快捷键无效问题

    今天小编就为大家分享一篇解决Pycharm出现的部分快捷键无效问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-10-10
  • Python实现http服务器(http.server模块传参 接收参数)实例

    Python实现http服务器(http.server模块传参 接收参数)实例

    这篇文章主要为大家介绍了Python实现http服务器(http.server模块传参 接收参数)实例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-11-11

最新评论