Python实现合并PDF文件的三种方式

更新时间：2023年11月14日 08:06:52 作者：E-iceblue

在处理多个 PDF 文档时,频繁地打开关闭文件会严重影响效率,因此我们可以先将这些PDF文件合并起来再操作,本文将分享3种使用 Python 合并 PDF 文件的实现方法,希望对大家有所帮助

在处理多个 PDF 文档时，频繁地打开关闭文件会严重影响效率。因此，对于一大堆内容相关的 PDF 文件，我们可以先将这些 PDF 文件合并起来再操作，从而提高工作效率。比如，在传送大量的 PDF 文档时，在处理同一项目下的多个 PDF 文档时，或在打印一系列 PDF 文档时，将文档合并起来可以减少工作量。本文将分享3种使用 Python 合并 PDF 文件的实现方法。

安装

Python中合并PDF需要用到 Spire.PDF for Python 库。安装十分简单，直接使用以下pip命令即可。或者可以下载后再安装。

pip install Spire.PDF

方法1：通过 MergeFiles () 直接合并 PDF 文件

MergeFiles(List[str]) 方法可以将一个文件路径列表对应的所有 PDF 文件按列表顺序合并为一个 PDF 文件。代码如下:

from spire.pdf.common import *
from spire.pdf import *
import os

# 指定文件夹路径
folder_path = "G:/文档/"

# 遍历文件夹中的文件并创建文件路径列表
pdf_files = []
for file_name in sorted(os.listdir(folder_path)):
    if file_name.endswith(".pdf"):
        file_path = os.path.join(folder_path, file_name)
        pdf_files.append(file_path)

# 合并PDF文档
pdf = PdfDocument.MergeFiles(pdf_files)

# 保存结果文档
pdf.Save("output/合并PDF.pdf", FileFormat.PDF)
pdf.Close()

方法2：通过AppendPage() 插入页面合并 PDF 文件

AppendPage(PdfDocument) 方法可以在一个 PDF 文件中插入另一个 PDF 文件的所有页面。具体实现代码参考：

from spire.pdf.common import *
from spire.pdf import *

# 遍历文件夹中的文件，载入每个PDF文件PdfDocument对象并列表
folder_path = "G:/文档/"
pdf_files = []
for file_name in sorted(os.listdir(folder_path)):
    if file_name.endswith(".pdf"):
        file_path = os.path.join(folder_path, file_name)
        pdf_files.append(PdfDocument(file_path))

# 创建一个PdfDocument对象
newPdf = PdfDocument()

# 将加载的PDF文档的页面插入到新的PDF文档中
for pdf in pdf_files:
    newPdf.AppendPage(pdf)

# 保存新的PDF文档
newPdf.SaveToFile("output/插入页面合并PDF.pdf")

方法3：合并不同 PDF 文件的指定页面

InsertPage (PdfDocument, pageIndex: int) 方法可以将一个 PDF 文件的指定页面插入到另一个 PDF 文件中。我们可以通过这个方法合并不同 PDF 文件的指定页面。

from spire.pdf import *
from spire.pdf.common import *

# 创建PDF文件路径列表
file1 = "示例1.pdf"
file2 = "示例2.pdf"
file3 = "示例3.pdf"
files = [file1, file2, file3]

# 加载每个PDF文件并添加到列表中
pdfs = []
for file in files:
    pdfs.append(PdfDocument(file))

# 创建一个PdfDocument对象
newPdf = PdfDocument()

# 将加载的PDF文档中选择的页面插入到新文档中
newPdf.InsertPage(pdfs[0], 0)
newPdf.InsertPage(pdfs[1], 1)
newPdf.InsertPageRange(pdfs[2], 0, 1)

# 保存新的PDF文档
newPdf.SaveToFile("output/合并不同PDF的指定页面.pdf")

到此这篇关于Python实现合并PDF文件的三种方式的文章就介绍到这了,更多相关Python合并PDF内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

对python Tkinter Text的用法详解
今天小编就为大家分享一篇对python Tkinter Text的用法详解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-10-10
使用Python Pathlib模块一站式解决文件路径难题
在本文中，将详细介绍pathlib模块，包括如何创建路径、检查文件和目录的存在、遍历目录、执行文件操作等，此外，还将提供丰富的示例代码来演示如何使用pathlib模块来处理文件和目录
2023-11-11
pytorch中nn.RNN()汇总
这篇文章主要介绍了pytorch中nn.RNN()知识，本文通过实例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
2022-12-12
解析Sentry Relay 二次开发调试
这篇文章主要介绍了Sentry Relay 二次开发调试简介,集成测试要求 Redis 和 Kafka 在其默认配置中运行，获取所有必需服务的最便捷方式是通过 sentry devservices，这需要最新的 Sentry 开发环境，本文给大家介绍的非常详细，需要的朋友参考下吧
2022-03-03
pytorch中nn.Flatten()函数详解及示例
nn.Flatten是一个类,而torch.flatten()则是一个函数,下面这篇文章主要给大家介绍了关于pytorch中nn.Flatten()函数详解及示例的相关资料,需要的朋友可以参考下
2023-01-01
Python调试神器之PySnooper的使用教程分享
对于每个程序开发者来说，调试几乎是必备技能。本文小编就来给大家介绍一款非常好用的调试工具，它能在一些场景下，大幅度提高调试的效率，那就是 PySnooper，希望大家喜欢
2023-02-02
Python爬取当网书籍数据并数据可视化展示
这篇文章主要介绍了Python爬取当网书籍数据并数据可视化展示,下面文章围绕Python爬虫的相关资料展开对爬取当网书籍数据的详细介绍，需要的小伙伴可以参考一下，希望对你有所帮助
2022-01-01
Python2到Python3的迁移过程中报错AttributeError: ‘str‘ objec
在 Python 编程过程中,AttributeError: 'str' object has no attribute 'decode' 是一个常见的错误,这通常会在处理字符串时出现,尤其是在 Python 2 到 Python 3 的迁移过程中,本文将详细介绍该问题的根源,并提供解决方案,需要的朋友可以参考下
2025-04-04
django之导入并执行自定义的函数模块图解
这篇文章主要介绍了django之导入并执行自定义的函数模块图解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-04-04
python3 Scrapy爬虫框架ip代理配置的方法
Scrapy是用python实现的一个为了爬取网站数据，提取结构性数据而编写的应用框架。使用Twisted高效异步网络框架来处理网络通信。这篇文章主要介绍了python3 Scrapy爬虫框架ip代理配置,需要的朋友可以参考下
2020-01-01