Python快速实现从PDF中提取文本与图像坐标的终极指南

 更新时间:2026年01月19日 11:51:10   作者:秋天的落叶铺满小路  
在数据处理工作中,提取 PDF 文档中的文本和图像坐标是一个常见需求,本文将介绍如何使用 Spire.PDF for Python 库实现这一功能,通过简单的代码示例帮助你快速上手

Spire.PDF 简介

Spire.PDF for Python 是一个功能强大的 PDF 处理库,允许开发者以编程方式操作 PDF 文件。它支持提取文本、图像、元数据等。当我们需要获取特定文本或图像的坐标时,这个库显得尤为便捷。

安装命令:pip install spire-pdf

坐标系设定

在 Spire.PDF 中,坐标系设定非常重要:

  • 原点 (0, 0) 位于页面的左上角。
  • X 轴向右延伸,Y 轴向下延伸。

理解这一点有助于我们更好地定位 PDF 中的元素。

获取文本坐标

以下是使用 Spire.PDF 提取 PDF 中指定文本坐标的步骤:

  • 创建 PdfDocument 对象。
  • 加载 PDF 文档。
  • 获取特定页面。
  • 创建 PdfTextFinder 对象并设置查找选项。
  • 查找文本并获取其坐标。

下面是获取文本坐标的示例代码:

from spire.pdf.common import *
from spire.pdf import *
 
# 创建 PdfDocument 对象
doc = PdfDocument()
 
# 加载 PDF 文档
doc.LoadFromFile("Input.pdf")
 
# 获取特定页面
page = doc.Pages.get_Item(0)
 
# 创建 PdfTextFinder 对象
textFinder = PdfTextFinder(page)
 
# 指定查找选项
findOptions = PdfTextFindOptions()
findOptions.Parameter = TextFindParameter.WholeWord
textFinder.Options = findOptions
 
# 在页面中查找字符串 "隐私政策"
findResults = textFinder.Find("隐私政策")
 
# 获取查找结果中第一个实例
result = findResults[0]
 
# 获取找到文本的 X/Y 坐标
x = int(result.Positions[0].X)
y = int(result.Positions[0].Y)
print("The coordinates of the first instance of the found text are:", (x, y))
 
# 释放资源
doc.Dispose()

代码解析

PdfDocument 对象用于打开现有 PDF 文件。

通过 PdfTextFinder 可以轻松找到指定文本,设置的查找选项允许忽略大小写并确保匹配完整单词。

最后,通过 result.Positions 获取文本坐标,其中 (0, 0) 表示页面的左上角。

获取图片坐标

获取图像坐标的过程与文本提取类似,但使用 PdfImageHelper 处理图像信息。以下是示例代码:

from spire.pdf.common import *
from spire.pdf import *
 
# 创建 PdfDocument 对象
doc = PdfDocument()
 
# 加载 PDF 文档
doc.LoadFromFile("Input.pdf")
 
# 获取特定页面
page = doc.Pages.get_Item(0)
 
# 创建 PdfImageHelper 对象
imageHelper = PdfImageHelper()
 
# 获取页面中的图像信息
imageInformation = imageHelper.GetImagesInfo(page)
 
# 获取指定图像的 X/Y 坐标
x = int(imageInformation[0].Bounds.X)
y = int(imageInformation[0].Bounds.Y)
print("The coordinates of the specified image are:", (x, y))
 
# 释放资源
doc.Dispose()

代码解析

使用 PdfImageHelper 类来获取特定页面上的所有图像信息。

通过 imageInformation 对象获取图像的边界坐标(X, Y),便于后续处理。

总结

本文介绍了如何使用 Spire.PDF for Python 提取 PDF 中文本及图像的坐标,并提供了相关示例代码。无论是在信息提取、数据分析,还是文档处理方面,掌握这些技术都将极大提升你的工作效率。希望这篇博客能帮助你快速上手 PDF 坐标提取的相关操作!

到此这篇关于Python快速实现从PDF中提取文本与图像坐标的终极指南的文章就介绍到这了,更多相关Python提取PDF文本与图像坐标内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python多进程multiprocessing.Pool类详解

    Python多进程multiprocessing.Pool类详解

    这篇文章主要为大家详细介绍了Python多进程multiprocessing.Pool类,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-04-04
  • 详解Python中的Descriptor描述符类

    详解Python中的Descriptor描述符类

    这里我们将来详解Python中的Descriptor描述符类,包括定义描述符并展示如何调用描述符,需要的朋友可以参考下
    2016-06-06
  • Python基于滑动平均思想实现缺失数据填充的方法

    Python基于滑动平均思想实现缺失数据填充的方法

    今天小编就为大家分享一篇关于Python基于滑动平均思想实现缺失数据填充的方法,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-02-02
  • Python用for循环实现九九乘法表

    Python用for循环实现九九乘法表

    本文通过实例代码给大家介绍了Python用for循环实现九九乘法表的方法,代码简单易懂,非常不错,具有一定的参考借鉴价值,需要的朋友参考下吧
    2018-05-05
  • Python中的map()、apply()、applymap()的区别小结

    Python中的map()、apply()、applymap()的区别小结

    map()、apply()和applymap()方法是Python中常用的转换方法,,输出的结果及类型完全取决于作为给定方法的参数的函数,本文就来介绍一下这三种方法的区别,具有一定的参考价值,感兴趣的可以了解一下
    2023-10-10
  • Python flask 框架使用flask-login 模块的详细过程

    Python flask 框架使用flask-login 模块的详细过程

    Flask-Login 是一个 Flask 模块,可以为 Flask 应用程序提供用户登录功能,这篇文章主要介绍了Python flask 框架使用 flask-login 模块,需要的朋友可以参考下
    2023-01-01
  • Python新手学习raise用法

    Python新手学习raise用法

    在本篇文章里小编给大家分享的是一篇关于Python新手学习raise用法的相关知识点,需要的朋友们可以参考下。
    2020-06-06
  • python如何读取和存储dict()与.json格式文件

    python如何读取和存储dict()与.json格式文件

    这篇文章主要介绍了python如何读取和存储dict()与.json格式文件,具有很好的参考价值,希望对大家有所帮助。
    2022-06-06
  • python中decimal模块的用法

    python中decimal模块的用法

    本文主要介绍了python中decimal模块的用法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-02-02
  • django自定义非主键自增字段类型详解(auto increment field)

    django自定义非主键自增字段类型详解(auto increment field)

    这篇文章主要介绍了django自定义非主键自增字段类型详解(auto increment field),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03

最新评论