Python中图片与pdf识别文本的方法总结(OCR)

 更新时间:2025年06月12日 09:52:07   作者:幸福清风  
在Python编程语言中,我们可以利用各种库来实现OCR功能,以便从PDF文档中的图片部分提取文本信息,这篇文章主要介绍了Python中图片与pdf识别文本的相关资料,需要的朋友可以参考下

1、PaddleOCR:

基于百度飞桨框架开发,模型丰富,支持多语言识别,包括中文、英文等。性能强大,适合复杂场景的文字识别

安装 PaddleOCR 库:

pip install paddleocr

示例代码

from paddleocr import PaddleOCR, draw_ocr
from PIL import Image

# 初始化 PaddleOCR
# 参数解释:
# `lang`:指定语言模型,如 'en'(英文)、'ch'(中文)等。
# `use_angle_cls`:是否启用文字方向分类器。
ocr = PaddleOCR(use_angle_cls=True, lang='en')  # 也可以设置为 'ch' 用于中文[^28^]

# 指定图片路径
img_path = 'example.jpg'  # 替换为你的图片路径

# 执行 OCR 识别
result = ocr.ocr(img_path, cls=True)  # `cls=True` 表示启用方向分类器

# 打印识别结果
for line in result:
    print(line)

# 可选:绘制识别结果并保存
if result:
    image = Image.open(img_path).convert('RGB')
    boxes = [line[0] for line in result]  # 提取文字框
    txts = [line[1][0] for line in result]  # 提取文字内容
    scores = [line[1][1] for line in result]  # 提取置信度

    # 绘制结果
    im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/PaddleOCR/doc/fonts/simfang.ttf')
    im_show = Image.fromarray(im_show)
    im_show.save('result.jpg')  # 保存绘制后的图片[^28^]

2、RapidOCR

首先,确保安装了 RapidOCR 的 ONNXRuntime 版本,这是一个轻量级且高效的推理引擎:

pip install rapidocr_onnxruntime

示例代码:识别数字和字母

以下代码展示了如何使用 RapidOCR 识别图片中的数字和字母,并仅打印识别结果:

from rapidocr_onnxruntime import RapidOCR

# 初始化 OCR 引擎
ocr = RapidOCR()

# 指定图片路径
img_path = 'example.jpg'  # 替换为你的图片路径

# 执行识别
result, _ = ocr(img_path)

# 提取并打印识别结果(仅数字和字母)
if result:
    for line in result:
        text = line[1]  # 提取文字内容
        # 筛选只包含数字和字母的文本
        if text.isalnum():
            print(text)
else:
    print("未识别到文字")

注意事项

  • 图片路径:确保 img_path 指向的图片包含数字或字母。
  • 语言设置:默认情况下,RapidOCR 支持中英文混合识别。如果需要识别其他语言,可以参考文档进行配置。
  • 环境要求:确保 Python 版本为 3.6 或更高。

3、EasyOCR

  • 特点:易于使用,支持多种语言(包括中文、英文等),基于深度学习技术,适合初学者和快速集成。

  • 安装方法

    pip install easyocr
  • 使用示例

    import easyocr
    
    reader = easyocr.Reader(['en', 'ch_sim'])  # 支持多语言
    img_path = 'example.jpg'
    result = reader.readtext(img_path)
    for line in result:
        print(line[1])  # 打印识别结果

4、Pytesseract

  • 特点:Tesseract 的 Python 封装,支持多种语言,使用简单,适合传统 OCR 任务。

  • 安装方法

    pip install pytesseract

    需要先安装 Tesseract OCR,可以从 Tesseract 官网 下载。

  • 使用示例

    from PIL import Image
    import pytesseract
    
    img_path = 'example.jpg'
    text = pytesseract.image_to_string(Image.open(img_path), lang='eng')
    print(text)  # 打印识别结果

5、DocTR

  • 特点:专注于文档分析和表格识别,能够提取文档中的结构化信息,适合处理复杂布局的文档。

  • 安装方法

    pip install python-doctr
  • 使用示例

    from doctr.models import ocr_predictor
    from doctr.io import DocumentFile
    
    img_path = 'example.jpg'
    doc = DocumentFile.from_images(img_path)
    model = ocr_predictor(pretrained=True)
    result = model(doc)
    for block in result.pages[0].blocks:
        for line in block.lines:
            for word in line.words:
                print(word.value)  # 打印识别结果

6、PyOCR

  • 特点:封装了多个 OCR 引擎(如 Tesseract、Cuneiform 等),提供了统一的接口。

  • 安装方法

    pip install pyocr
  • 使用示例

    import pyocr
    from PIL import Image
    
    tools = pyocr.get_available_tools()
    ocr_tool = tools[0]
    img_path = 'example.jpg'
    text = ocr_tool.image_to_string(Image.open(img_path), lang='eng')
    print(text)  # 打印识别结果

选择建议:

  • 速度优先:推荐使用 RapidOCR 或 EasyOCR

  • 准确性优先:推荐使用 PaddleOCR

  • 易用性优先:推荐使用 EasyOCR

  • 文档分析优先:推荐使用 docTR

注意:根据你的具体需求(如语言支持、应用场景、性能要求等),可以选择最适合的 OCR 库。

总结

到此这篇关于Python中图片与pdf识别文本的文章就介绍到这了,更多相关Python图片与pdf识别文本内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python应用实现双指数函数及拟合代码实例

    Python应用实现双指数函数及拟合代码实例

    这篇文章主要介绍了Python应用实现双指数函数及拟合代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-06-06
  • pytorch tensor int型除法出现的问题

    pytorch tensor int型除法出现的问题

    这篇文章主要介绍了pytorch tensor int型除法出现的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-04-04
  • python用folium绘制地图并设置弹窗效果

    python用folium绘制地图并设置弹窗效果

    这篇文章主要介绍了python用folium绘制地图并设置弹窗,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-09-09
  • 利用Pycharm将python文件打包为exe文件的超详细教程(附带设置文件图标)

    利用Pycharm将python文件打包为exe文件的超详细教程(附带设置文件图标)

    在日常使用pycharm写好程序后,如何将程序打包为exe文件呢,下面这篇文章主要给大家介绍了关于利用Pycharm将python文件打包为exe文件的超详细教程,附带设置文件图标,需要的朋友可以参考下
    2022-08-08
  • 基于Python爬取素材网站音频文件

    基于Python爬取素材网站音频文件

    这篇文章主要介绍了基于Python爬取素材网站音频文件,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-10-10
  • Pandas数据合并的始终高效技巧与常见问题

    Pandas数据合并的始终高效技巧与常见问题

    在数据分析工作中,我们经常需要处理来自多个来源的数据集,当合并来自20个不同地区的销售数据时,可能会发现部分列意外丢失,如果您曾经因数据合并问题而感到困扰,本文将为您提供系统的解决方案,需要的朋友可以参考下
    2025-05-05
  • 一文带你了解Python中的字符串是什么

    一文带你了解Python中的字符串是什么

    通过本文带你了解Python中的字符串是什么,本文给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2018-11-11
  • Python实现PS图像调整之对比度调整功能示例

    Python实现PS图像调整之对比度调整功能示例

    这篇文章主要介绍了Python实现PS图像调整之对比度调整功能,结合实例形式分析了Python实现PS图像对比度调整的原理、实现方法及相关操作技巧,需要的朋友可以参考下
    2018-01-01
  • python如何变换环境

    python如何变换环境

    在本篇内容里小编给各位分享的是一篇关于python如何变换环境的相关基础文章,有需要的朋友们可以参考下。
    2020-07-07
  • Python-openCV读RGB通道图实例

    Python-openCV读RGB通道图实例

    今天小编就为大家分享一篇Python-openCV读RGB通道图实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-01-01

最新评论