Python使用pypdf按指定页码范围批量拆分PDF

更新时间：2026年01月04日 14:59:32 作者：weixin_46244623

在处理电子书,扫描书籍或技术文档时,经常会遇到一个需求,即按照指定页码范围把一个 PDF 拆分成多个 PDF 文件,本文将介绍一种简单、稳定、无需外部依赖的方法,有需要的可以了解下

一、环境准备

Python 版本

Python 3.8+（推荐 3.9 / 3.10 / 3.11）

可用以下命令确认：

python --version

安装 pypdf

使用 pip 安装最新版 pypdf：

pip install pypdf

如果你在 Linux / macOS 上，且存在 Python2/3 共存问题，可使用：

pip3 install pypdf

安装完成后测试是否成功：

from pypdf import PdfReader, PdfWriter
print("pypdf installed OK")

二、实现思路说明

关键点解析

PdfReader：读取原始 PDF
PdfWriter：创建新的 PDF 文件
PDF 页码从 0 开始，而我们日常看到的是从 1 开始
用户只需定义一个页码范围列表即可完成拆分

适用场景

按目录拆书
按章节导出
按页码人工校正后的分割

三、完整 Python 实现代码

from pypdf import PdfReader, PdfWriter
import os


def split_pdf_by_page_ranges(input_pdf, output_folder, ranges):
    reader = PdfReader(input_pdf)

    # 创建输出目录
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

    for idx, (start_page, end_page) in enumerate(ranges, 1):
        writer = PdfWriter()

        # PDF 内部页码从 0 开始，因此要 -1
        for page_num in range(start_page - 1, end_page):
            if page_num < len(reader.pages):
                writer.add_page(reader.pages[page_num])
            else:
                print(f"Warning: page {page_num + 1} out of range.")

        output_filename = (
            f"{output_folder}/chapter_{idx}_pages_{start_page}-{end_page}.pdf"
        )

        with open(output_filename, "wb") as output_file:
            writer.write(output_file)

        print(f"Saved {output_filename}")

四、自定义章节页码范围

你只需要定义一个 页码区间列表，格式如下：

# ✏️ 自定义分章节页码（格式：[(开始页, 结束页), ...]）
page_ranges = [
    (1, 34),    # 序
    (35, 50),   # 第一章
    (51, 73),   # 第二章
    (74, 93),   # 第三章
    (94, 118),  # 第四章
    (119, 152), # 第五章
    (153, 166), # 第六章
    (167, 183), # 第七章
    (184, 206), # 第八章
    (207, 230), # 第九章
    (231, 251), # 第十章
]

注意事项：

页码是 PDF 阅读器中看到的页码
不需要关心 0 / 1 的问题，代码已处理
超出 PDF 总页数会自动提示 Warning，不会报错

五、执行拆分

split_pdf_by_page_ranges(
    "input.pdf",
    "./output_manual_split",
    page_ranges
)

执行后目录结构如下：

output_manual_split/
├── chapter_1_pages_1-34.pdf
├── chapter_2_pages_35-50.pdf
├── chapter_3_pages_51-73.pdf
├── ...
└── chapter_11_pages_231-251.pdf

完整代码

from pypdf import PdfReader, PdfWriter
import os


def split_pdf_by_page_ranges(input_pdf, output_folder, ranges):
    reader = PdfReader(input_pdf)


    if not os.path.exists(output_folder):
        os.makedirs(output_folder)


    for idx, (start_page, end_page) in enumerate(ranges, 1):
        writer = PdfWriter()


        # 页码从 0 开始，用户输入通常是从 1 开始
        for page_num in range(start_page - 1, end_page):
            if page_num < len(reader.pages):
                writer.add_page(reader.pages[page_num])
            else:
                print(f"Warning: page {page_num + 1} out of range.")

        output_filename = f"{output_folder}/chapter_{idx}_pages_{start_page}-{end_page}.pdf"
        with open(output_filename, "wb") as output_file:
            writer.write(output_file)


        print(f"Saved {output_filename}")


# ✏️ 自定义你的分章节页码（格式：[(开始页, 结束页), ...]）
page_ranges = [
    (1, 34),   # 序
    (35, 50),  # 第一章
    (51, 73),  # 第二章
    (74,93),   # 第三章
    (94,118),     # 第四章
    (119,152),      # 第五章
    (153,166),      # 第六章
    (167,183),      # 第七章
    (184,206),      # 第八章
    (207,230),      # 第九章
    (231,251),      # 第十章
]


# 用法示例
split_pdf_by_page_ranges("input.pdf", "./output_manual_split", page_ranges)

以上就是Python使用pypdf按指定页码范围批量拆分PDF的详细内容，更多关于Python pypdf拆分PDF的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

selenium XPath定位的实现示例
XPath是一种在XML文档中定位和选择节点的语言,通过路径表达式遍历XML树,支持节点选取、字符串匹配、数值计算、逻辑运算等功能,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
2024-10-10
Python实现的文本对比报告生成工具示例
这篇文章主要介绍了Python实现的文本对比报告生成工具,涉及Python基于difflib模块实现对文本内容进行对比的相关操作技巧,需要的朋友可以参考下
2018-05-05
Python 数据处理库 pandas 入门教程基本操作
pandas是一个Python语言的软件包，在我们使用Python语言进行机器学习编程的时候，这是一个非常常用的基础编程库。本文是对Python 数据处理库 pandas 入门教程,非常不错，感兴趣的朋友一起看看吧
2018-04-04
基于梯度爆炸的解决方法:clip gradient
今天小编就为大家分享一篇基于梯度爆炸的解决方法:clip gradient，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-02-02
pycharm + django跨域无提示的解决方法
这篇文章主要给大家介绍了关于pycharm + django跨域无提示的解决方法，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-12-12
Keras 快速解决OOM超内存的问题
这篇文章主要介绍了Keras 快速解决OOM超内存的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-06-06
详解python字符串相关str
这篇文章主要为大家介绍了python字符串相关str，具有一定的参考价值，感兴趣的小伙伴们可以参考一下，希望能够给你带来帮助
2022-01-01
Python3 shutil（高级文件操作模块）实例用法总结
在本篇文章里小编给大家整理的是一篇关于Python3 shutil实例用法内容，有兴趣的朋友们可以学习下。
2020-02-02
Python爬虫如何破解JS加密的Cookie
这篇文章主要介绍了Python爬虫如何破解JS加密的Cookie，帮助大家更好的理解和使用爬虫，感兴趣的朋友可以了解下
2020-11-11
Pytorch实现简单自定义网络层的方法
这篇文章主要给大家介绍了关于Pytorch实现简单自定义网络层的相关资料,文中通过实例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2022-05-05