python的​PyPDF2实现pdf文件切割和合并

 更新时间:2022年02月13日 11:03:44   作者:qq_29235677  
大家好,本篇文章主要讲的是python的​PyPDF2实现pdf文件切割和合并,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下

今天想使用pdf的切分软件实现pdf文件的切分,但是软件需要会员???好吧,,,,又要会员,这么简单的功能能难倒咱们程序员吗。俗话说自给自足丰衣足食,决定使用python自己切分文件。

在百度了一番后,发现大多都是使用 Adobe Acrobat 软件进行剪裁,这完全不 Pythonic,因此又找了用 Python 处理 PDF 文件的方法,最后发现了 PyPDF2 这个库,本文将利用这个库,实现对 PDF 的分割。

首先,你需要通过 pip 安装这个库:

pip install PyPDF2

要使用python的

# 导入读写pdf模块
from PyPDF2 import PdfFileReader, PdfFileWriter
'''
注意:
页数从0开始索引
range()是左闭右开区间
'''
 
def split_pdf(file_name, start_page, end_page, output_pdf):
    '''
    :param file_name:待分割的pdf文件名
    :param start_page: 执行分割的开始页数
    :param end_page: 执行分割的结束位页数
    :param output_pdf: 保存切割后的文件名
    '''
    # 读取待分割的pdf文件
    input_file = PdfFileReader(open(file_name, 'rb'))
    # 实例一个 PDF文件编写器
    output_file = PdfFileWriter()
    # 把分割的文件添加在一起
    for i in range(start_page, end_page):
        output_file.addPage(input_file.getPage(i))
    # 将分割的文件输出保存
    with open(output_pdf, 'wb') as f:
        output_file.write(f)
 
def merge_pdf(merge_list, output_pdf):
    """
    merge_list: 需要合并的pdf列表
    output_pdf:合并之后的pdf名
    """
    # 实例一个 PDF文件编写器
    output = PdfFileWriter()
    for ml in merge_list:
        pdf_input = PdfFileReader(open(ml, 'rb'))
        page_count = pdf_input.getNumPages()
        for i in range(page_count):
            output.addPage(pdf_input.getPage(i))
 
    output.write(open(output_pdf, 'wb'))
 
 
if __name__ == '__main__':
    # 分割pdf
    split_pdf("test.pdf", 0, 3, "0-2.pdf")
    split_pdf("test.pdf", 7, 12, "7-11.pdf")
    split_pdf("test.pdf", 18, 23, "18-22.pdf")
    split_pdf("test.pdf", 27, 33, "26-32.pdf")
    split_pdf("test.pdf", 40, 44, "40-43.pdf")
    split_pdf("test.pdf", 46, 51, "46-50.pdf")
    split_pdf("test.pdf", 58, 66, "58-65.pdf")
    split_pdf("test.pdf", 77, 84, "77-83.pdf")
    split_pdf("test.pdf", 93, 97, "93-96.pdf")
    split_pdf("test.pdf", 102, 106, "102-105.pdf")
    # 合并pdf
    # 合并的pdf列表
    pdf_list = ["0-2.pdf", "7-11.pdf", "18-22.pdf", "26-32.pdf", "40-43.pdf", "46-50.pdf", "58-65.pdf", "77-83.pdf", "93-96.pdf", "102-105.pdf"]
    merge_pdf(pdf_list, "all.pdf")

下面是切分好的文件效果,完美 

到此这篇关于python的​PyPDF2实现pdf文件切割和合并的文章就介绍到这了,更多相关python PyPDF2实现pdf剪裁内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python 删除系统中的文件(按时间,大小,扩展名)

    python 删除系统中的文件(按时间,大小,扩展名)

    这篇文章主要介绍了python 如何删除系统中的文件,分别按时间,大小,扩展名删除,满足不同需求,感兴趣的朋友可以了解下
    2020-11-11
  • python找出一个列表中相同元素的多个索引实例

    python找出一个列表中相同元素的多个索引实例

    今天小编就为大家分享一篇python找出一个列表中相同元素的多个索引实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-06-06
  • python使用tkinter实现透明窗体上绘制随机出现的小球(实例代码)

    python使用tkinter实现透明窗体上绘制随机出现的小球(实例代码)

    今天教大家怎么实现Tkinter透明窗体,在上篇文章给大家介绍过透明窗体上绘制小球,今天接着通过实例代码给大家分享python使用tkinter实现透明窗体上绘制随机出现的小球的实例代码,感兴趣的朋友跟随小编一起看看吧
    2021-05-05
  • Python字符串逆序输出的实例讲解

    Python字符串逆序输出的实例讲解

    今天小编就为大家分享一篇关于Python字符串逆序输出的实例讲解,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-02-02
  • Python中使用tkFileDialog实现文件选择、保存和路径选择

    Python中使用tkFileDialog实现文件选择、保存和路径选择

    这篇文章主要介绍了Python中使用tkFileDialog实现文件选择、保存和路径选择,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-05-05
  • python实现处理Excel表格超详细系列

    python实现处理Excel表格超详细系列

    这篇文章主要介绍了python实现处理Excel表格超详细系列,文章围绕主题展开详细的内容介绍,具有一定的参考价值,需要的小伙伴可以参考一下
    2022-08-08
  • python+selenium实现自动抢票功能实例代码

    python+selenium实现自动抢票功能实例代码

    Selenium是ThoughtWorks公司的一个强大的开源Web功能测试工具系列,采用Javascript来管理整个测试过程,包括读入测试套件、执行测试和记录测试结果。这篇文章主要介绍了python+selenium实现自动抢票,需要的朋友可以参考下
    2018-11-11
  • 关于python selenium 运行时弹出窗口问题

    关于python selenium 运行时弹出窗口问题

    最近在做一个网页代填项目,用到了python的selenium知识,经过了各种尝试与搜索最后终算是较完美的解决了,下面小编给大家带来了python selenium 运行时弹出窗口问题,感兴趣的朋友一起看看吧
    2021-11-11
  • Appium+Python自动化环境搭建实例教程

    Appium+Python自动化环境搭建实例教程

    这篇文章主要介绍了Appium+Python自动化环境搭建实例教程,本文通过实例代码图文相结合给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-08-08
  • pandas 数据索引与选取的实现方法

    pandas 数据索引与选取的实现方法

    这篇文章主要介绍了pandas 数据索引与选取的实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-06-06

最新评论