Python快速实现从PDF中提取文本与图像坐标的终极指南

更新时间：2026年01月19日 11:51:10 作者：秋天的落叶铺满小路

在数据处理工作中,提取 PDF 文档中的文本和图像坐标是一个常见需求,本文将介绍如何使用 Spire.PDF for Python 库实现这一功能,通过简单的代码示例帮助你快速上手

Spire.PDF 简介

Spire.PDF for Python 是一个功能强大的 PDF 处理库，允许开发者以编程方式操作 PDF 文件。它支持提取文本、图像、元数据等。当我们需要获取特定文本或图像的坐标时，这个库显得尤为便捷。

安装命令：pip install spire-pdf

坐标系设定

在 Spire.PDF 中，坐标系设定非常重要：

原点 (0, 0) 位于页面的左上角。
X 轴向右延伸，Y 轴向下延伸。

理解这一点有助于我们更好地定位 PDF 中的元素。

获取文本坐标

以下是使用 Spire.PDF 提取 PDF 中指定文本坐标的步骤：

创建 PdfDocument 对象。
加载 PDF 文档。
获取特定页面。
创建 PdfTextFinder 对象并设置查找选项。
查找文本并获取其坐标。

下面是获取文本坐标的示例代码：

from spire.pdf.common import *
from spire.pdf import *
 
# 创建 PdfDocument 对象
doc = PdfDocument()
 
# 加载 PDF 文档
doc.LoadFromFile("Input.pdf")
 
# 获取特定页面
page = doc.Pages.get_Item(0)
 
# 创建 PdfTextFinder 对象
textFinder = PdfTextFinder(page)
 
# 指定查找选项
findOptions = PdfTextFindOptions()
findOptions.Parameter = TextFindParameter.WholeWord
textFinder.Options = findOptions
 
# 在页面中查找字符串 "隐私政策"
findResults = textFinder.Find("隐私政策")
 
# 获取查找结果中第一个实例
result = findResults[0]
 
# 获取找到文本的 X/Y 坐标
x = int(result.Positions[0].X)
y = int(result.Positions[0].Y)
print("The coordinates of the first instance of the found text are:", (x, y))
 
# 释放资源
doc.Dispose()

代码解析

PdfDocument 对象用于打开现有 PDF 文件。

通过 PdfTextFinder 可以轻松找到指定文本，设置的查找选项允许忽略大小写并确保匹配完整单词。

最后，通过 result.Positions 获取文本坐标，其中 (0, 0) 表示页面的左上角。

获取图片坐标

获取图像坐标的过程与文本提取类似，但使用 PdfImageHelper 处理图像信息。以下是示例代码：

from spire.pdf.common import *
from spire.pdf import *
 
# 创建 PdfDocument 对象
doc = PdfDocument()
 
# 加载 PDF 文档
doc.LoadFromFile("Input.pdf")
 
# 获取特定页面
page = doc.Pages.get_Item(0)
 
# 创建 PdfImageHelper 对象
imageHelper = PdfImageHelper()
 
# 获取页面中的图像信息
imageInformation = imageHelper.GetImagesInfo(page)
 
# 获取指定图像的 X/Y 坐标
x = int(imageInformation[0].Bounds.X)
y = int(imageInformation[0].Bounds.Y)
print("The coordinates of the specified image are:", (x, y))
 
# 释放资源
doc.Dispose()

代码解析

使用 PdfImageHelper 类来获取特定页面上的所有图像信息。

通过 imageInformation 对象获取图像的边界坐标（X, Y），便于后续处理。

总结

本文介绍了如何使用 Spire.PDF for Python 提取 PDF 中文本及图像的坐标，并提供了相关示例代码。无论是在信息提取、数据分析，还是文档处理方面，掌握这些技术都将极大提升你的工作效率。希望这篇博客能帮助你快速上手 PDF 坐标提取的相关操作！

到此这篇关于Python快速实现从PDF中提取文本与图像坐标的终极指南的文章就介绍到这了,更多相关Python提取PDF文本与图像坐标内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

Python爬虫 bilibili视频弹幕提取过程详解
这篇文章主要介绍了Python爬虫 bilibili视频弹幕提取过程详解,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2019-07-07
python GUI图形化编程wxpython的使用
这篇文章主要介绍了python GUI图形化编程wxpython的使用，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2019-07-07
Python如何用wx模块创建文本编辑器
在本篇文章里小编给大家整理的是关于Python的wx模块创建文本编辑器方法，需要的朋友们可以参考下。
2020-06-06
Python采集某网站文档并保存word格式的示例
这篇文章主要介绍了Python采集某网站文档并保存word格式的示例,我们平常需要下载文档的时候，是不是发现，要么不能下载，要么不能复制，那么我们今天来分享一下，如何用Python将这些不给下载的文档给批量下载下来,需要的朋友可以参考下
2023-07-07
手把手教你安装Windows版本的Tensorflow
这篇文章主要介绍了手把手教你安装Windows版本的Tensorflow，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-03-03
Python scrapy增量爬取实例及实现过程解析
这篇文章主要介绍了Python scrapy增量爬取实例及实现过程解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2019-12-12
python通过定义一个类实例作为ftp回调方法
这篇文章主要介绍了python通过定义一个类实例作为ftp回调方法,涉及Python中类与回调方法的使用技巧,非常具有实用价值,需要的朋友可以参考下
2015-05-05
python flask开发的简单基金查询工具
基于python flask开发的简单基金查询工具，支持大盘指数实时情况查看，总持仓实际涨幅、预估涨幅等功能，感兴趣的朋友可以下载该项目来查看使用
2021-06-06
Python使用WebSocket和SSE实现HTTP服务器消息推送方式
本文介绍了两种实时数据获取的技术：WebSocket和SSE,WebSocket是全双工通信协议,支持双向通信,但需要专门定义数据协议,SSE是一种单工通信技术,基于HTTP的流式数据传输,客户端开发简单,但只能单工通信
2024-11-11
Python 2.6.6升级到Python2.7.15的详细步骤
这篇文章主要介绍了Python 2.6.6升级到Python2.7.15的详细步骤,本文分步骤给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2020-12-12