20行Python代码实现一款永久免费PDF编辑工具

更新时间：2022年07月13日 08:58:46 作者：程序员枸杞.

本文主要介绍了Python代码实现一款永久免费PDF编辑工具，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

PyPDF2

PyPDF2是一个第三方的python PDF库，它能够对PDF文件进行分割、合并、裁剪和转换页面。

另外，它还可以对PDF文件添加自定义数据、水印、密码，也可以从PDF文件中检索出文本和元数据。

安装

使用pip直接安装：

$ pip install PyPDF2

下面就来演示几项PDF编辑功能，并且会逐行解释代码的含义。

删除PDF页

先给出实现代码，

from PyPDF2 import PdfFileWriter, PdfFileReader
 
output = PdfFileWriter()     // 1
input1 = PdfFileReader(open("example.pdf", "rb")) // 2
 
def delete_pdf(index):
 pages = input1.getNumPages() // 3
 
 for i in range(pages):
  if i+1 in index:
   continue
  output.addPage(input1.getPage(i))  // 4
 
 outputStream = open("PyPDF2-output.pdf", "wb")
 output.write(outputStream)  // 5
 
delete_pdf([2,3,4])

下面来解释一下代码中的几个关键点：

声明一个用于输出PDF的实例；
读取本地PDF文件；
获取PDF文档的页数；
读取PDF的第i页，添加到输出output实例中；
把编辑后的文档保存到本地；

合并PDF

已经实现了删除PDF页，接下来就看一下如何把另外一个PDF中的页面合并到当前PDF中。

方法1：

可以沿着前面删除PDF页的方式进行拓展一下，对PDF进行合并。

from PyPDF2 import PdfFileWriter, PdfFileReader
 
output = PdfFileWriter()
input1 = PdfFileReader(open("example.pdf", "rb"))
input2 = PdfFileReader(open("simple2.pdf", "rb")) // 1
 
def merge_pdf(add_index, origin_index):
 pages = input1.getNumPages()
 k = 0
 for i in range(pages):
  if i+1 in add_index:
   output.addPage(input2.getPage(origin_index[k])) // 2
   pages += 1
   k += 1
  output.addPage(input1.getPage(i))
 
 outputStream = open("PyPDF2-output.pdf", "wb")
 output.write(outputStream)
 
merge_pdf([2,3,4], [0, 0, 0])

读取需要合并的源文件；
遍历到指定页，合并源PDF的页面；

方法2：

除了方法1，还有另外一种方法可以合并PDF：

from PyPDF2 import PdfFileMerger // 1
 
merger = PdfFileMerger()
 
input1 = open("document1.pdf", "rb") // 2
input2 = open("document2.pdf", "rb")
input3 = open("document3.pdf", "rb")
 
merger.append(fileobj = input1, pages = (0,3)) // 3
 
merger.merge(position = 2, fileobj = input2, pages = (0,1)) // 4
 
merger.append(input3) // 5
 
output = open("document-output.pdf", "wb")
merger.write(output)

导入PyPDF2合并模块PdfFileMerger;
读取需要处理和合并的PDF文档；
从第一个PDF文档中取出需要合并的前3页；
把第二个PDF文档的第一页插入到文档中；
把第三个PDF文档附到输出文档末尾；

除了上述介绍的2项主要功能，PyPDF2也有一些其他小功能：

旋转

input1.getPage(1).rotateClockwise(90)

使得页面1旋转90度。

添加水印

page = input1.getPage(3)
watermark = PdfFileReader(open("watermark.pdf", "rb"))
page.mergePage(watermark.getPage(0))

其中，水印存储在另外一个PDF文档watermark.pdf中。

加密

password = "secret"
output.encrypt(password)

首先给一个secret密码，然后使用encrypt对输出文档进行加密。

pdfminer

前面介绍的PyPDF2主要擅长于PDF页面级编辑，而对于文本和源数据级别编辑能力较弱。

所以，这里就来介绍另外一款Python库来弥补它的不足。

PDFMiner是一个PDF文档的文本提取工具，它具有如下特性：

能够准确获取文本的位置和布局信息；
可以将PDF转换为HTML/XML等格式；
可以提取目录；
可以提取标签内容；
支持各种字体类型（Type1、TrueType、Type3和CID）;
支持中、日、韩语言和垂直书写文本;

安装

$ pip install pdfminer

PDF转TxT

pdfminer在GitHub的托管项目中，在目录tools下给出了一些实用的工具集，例如，PDF转HTML、PDF转HTML、PDF转TXT。我们可以直接通过使用下面命令提出PDF文档中的文本信息。

$ pdf2txt.py samples/simple1.pdf

总结

通过上述2款Python库，就可以实现从页面到文本元数据的编辑，本文只是简单的介绍了每项的基本用法。关于详细的用法和函数列表，可以阅读官方文档，或者阅读GitHub上项目源码进行了解。此外，可以在这些基本的用法基础上进行发散思维，发掘更多有价值的应用场景，例如，提出文本数据之后调用翻译API进行文献翻译。也可以，对软件进行封装，开发成一款通用的PDF编辑工具。

20行Python代码就轻松解决了困扰很多同学已久的PDF编辑问题，可见Python的作用和价值是不可忽视的。

到此这篇关于20行Python代码实现一款永久免费PDF编辑工具的文章就介绍到这了,更多相关Python PDF编辑工具内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

Python
PDF

python多线程案例之多任务copy文件完整实例
这篇文章主要介绍了python多线程案例之多任务copy文件,结合完整实例形式分析了Python使用multiprocessing模块实现基于多线程的文件拷贝相关操作技巧,需要的朋友可以参考下
2019-10-10
python提取图像的名字*.jpg到txt文本的方法
下面小编就为大家分享一篇python提取图像的名字*.jpg到txt文本的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-05-05
Python调用win10toast框架实现定时调起系统通知
win10toast是一个windows通知的出发框架，使用它可以轻松的调起系统通知。通过它可以很方便的做一个定时通知的功能应用。本文将调用win10toast实现定时调起系统通知功能，需要的可以参考一下
2022-01-01
python启动办公软件进程(word、excel、ppt、以及wps的et、wps、wpp)
见如下源代码，也可从附件中下载。
2009-04-04
Python中逗号的三种作用实例分析
这篇文章主要介绍了Python中逗号的三种作用,实例分析了Python中的逗号在类型转换与打印输出时的使用技巧,需要的朋友可以参考下
2015-06-06
解决Keras 自定义层时遇到版本的问题
这篇文章主要介绍了解决Keras 自定义层时遇到版本的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-06-06
讲解Python中运算符使用时的优先级
这篇文章主要介绍了讲解Python中运算符使用时的优先级,是Python学习当中的基础知识,需要的朋友可以参考下
2015-05-05
Pytorch实战之数据加载和处理详解
Pytorch提供了许多工具来简化和希望数据加载，使代码更具可读性，本文将通过一些简单示例为大家具体讲讲，感兴趣的小伙伴可以跟随小编一起学习一下
2023-06-06
如何用python复制粘贴excel指定单元格(可保留格式)
这篇文章主要给大家介绍了关于如何用python复制粘贴excel指定单元格(可保留格式)的相关资料,利用python操作excel非常方便,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
2023-07-07
PyQt编程之如何在屏幕中央显示窗体的实例
今天小编就为大家分享一篇PyQt编程之如何在屏幕中央显示窗体的实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-06-06