Python GUI实现PDF转Word功能

 更新时间:2024年12月19日 11:27:17   作者:winfredzhang  
这篇文章主要介绍了如何使用 wxPython 创建一个简单的图形用户界面(GUI)应用程序,结合 pdf2docx 库,实现将 PDF 转换为 Word 文档的功能,需要的可以参考下

在日常工作中,我们经常需要将 PDF 文档转换为 Word 文件。幸运的是,Python 提供了很多强大的库,帮助我们实现这一功能。今天,我将与大家分享如何使用 wxPython 创建一个简单的图形用户界面(GUI)应用程序,结合 pdf2docx 库,实现将 PDF 转换为 Word 文档的功能。

项目概述

这个小工具的主要目的是通过一个简单的窗口,让用户选择一个 PDF 文件,然后点击“转换”按钮,程序会将 PDF 文件转换为 Word 格式并保存在相同目录下。我们将使用 wxPython 来创建图形界面,pdf2docx 来进行实际的 PDF 转换。

全部代码

import wx
import os
from pdf2docx import Converter

class PDFConverterFrame(wx.Frame):
    def __init__(self):
        super().__init__(parent=None, title='PDF to Word Converter', size=(500, 200))
        self.pdf_path = None
        
        # Create main panel
        panel = wx.Panel(self)
        
        # Create vertical box sizer
        vbox = wx.BoxSizer(wx.VERTICAL)
        
        # Create file picker button
        self.file_picker = wx.FilePickerCtrl(
            panel, 
            message="Choose a PDF file",
            wildcard="PDF files (*.pdf)|*.pdf",
            style=wx.FLP_USE_TEXTCTRL | wx.FLP_OPEN | wx.FLP_FILE_MUST_EXIST
        )
        vbox.Add(self.file_picker, 0, wx.ALL | wx.EXPAND, 5)
        
        # Create status text
        self.status_text = wx.StaticText(panel, label="Select a PDF file to convert")
        vbox.Add(self.status_text, 0, wx.ALL | wx.CENTER, 5)
        
        # Create convert button
        convert_btn = wx.Button(panel, label='Convert to Word')
        convert_btn.Bind(wx.EVT_BUTTON, self.on_convert)
        vbox.Add(convert_btn, 0, wx.ALL | wx.CENTER, 5)
        
        # Set panel sizer
        panel.SetSizer(vbox)
        
        # Center window on screen
        self.Centre()
        
    def on_convert(self, event):
        pdf_path = self.file_picker.GetPath()
        if not pdf_path:
            wx.MessageBox('Please select a PDF file first!', 'Error', wx.OK | wx.ICON_ERROR)
            return
            
        if not os.path.exists(pdf_path):
            wx.MessageBox('Selected PDF file does not exist!', 'Error', wx.OK | wx.ICON_ERROR)
            return
            
        # Generate output path (same name, same directory, .docx extension)
        docx_path = os.path.splitext(pdf_path)[0] + '.docx'
        
        try:
            # Update status
            self.status_text.SetLabel("Converting... Please wait.")
            self.Layout()
            
            # Convert PDF to Word
            cv = Converter(pdf_path)
            cv.convert(docx_path)
            cv.close()
            
            # Show success message
            self.status_text.SetLabel("Conversion completed successfully!")
            wx.MessageBox(
                f'PDF has been converted to Word!\nSaved as: {docx_path}',
                'Success',
                wx.OK | wx.ICON_INFORMATION
            )
            
        except Exception as e:
            # Show error message
            self.status_text.SetLabel("Conversion failed!")
            wx.MessageBox(
                f'An error occurred during conversion:\n{str(e)}',
                'Error',
                wx.OK | wx.ICON_ERROR
            )

if __name__ == '__main__':
    # Initialize wx application
    app = wx.App()
    
    # Create and show frame
    frame = PDFConverterFrame()
    frame.Show()
    
    # Start application main loop
    app.MainLoop()

项目要求

wxPython:用于创建图形界面。

pdf2docx:一个将 PDF 文件转换为 DOCX 文件的 Python 库。

操作系统文件管理功能:用于检查文件是否存在,并获取文件路径。

代码结构

我们来看看完整的代码,并逐行解析每个部分的功能。

import wx
import os
from pdf2docx import Converter

class PDFConverterFrame(wx.Frame):
    def __init__(self):
        super().__init__(parent=None, title='PDF to Word Converter', size=(500, 200))
        self.pdf_path = None
        
        # 创建主面板
        panel = wx.Panel(self)
        
        # 创建垂直排列的布局
        vbox = wx.BoxSizer(wx.VERTICAL)
        
        # 创建文件选择控件
        self.file_picker = wx.FilePickerCtrl(
            panel, 
            message="Choose a PDF file",
            wildcard="PDF files (*.pdf)|*.pdf",
            style=wx.FLP_USE_TEXTCTRL | wx.FLP_OPEN | wx.FLP_FILE_MUST_EXIST
        )
        vbox.Add(self.file_picker, 0, wx.ALL | wx.EXPAND, 5)
        
        # 创建状态文本控件
        self.status_text = wx.StaticText(panel, label="Select a PDF file to convert")
        vbox.Add(self.status_text, 0, wx.ALL | wx.CENTER, 5)
        
        # 创建转换按钮
        convert_btn = wx.Button(panel, label='Convert to Word')
        convert_btn.Bind(wx.EVT_BUTTON, self.on_convert)
        vbox.Add(convert_btn, 0, wx.ALL | wx.CENTER, 5)
        
        # 设置面板布局
        panel.SetSizer(vbox)
        
        # 窗口居中显示
        self.Centre()
        
    def on_convert(self, event):
        # 获取选择的 PDF 文件路径
        pdf_path = self.file_picker.GetPath()
        if not pdf_path:
            wx.MessageBox('Please select a PDF file first!', 'Error', wx.OK | wx.ICON_ERROR)
            return
            
        if not os.path.exists(pdf_path):
            wx.MessageBox('Selected PDF file does not exist!', 'Error', wx.OK | wx.ICON_ERROR)
            return
            
        # 生成输出路径(同名的 DOCX 文件)
        docx_path = os.path.splitext(pdf_path)[0] + '.docx'
        
        try:
            # 更新状态文本为正在转换
            self.status_text.SetLabel("Converting... Please wait.")
            self.Layout()
            
            # 使用 pdf2docx 库进行转换
            cv = Converter(pdf_path)
            cv.convert(docx_path)
            cv.close()
            
            # 转换成功后更新状态文本
            self.status_text.SetLabel("Conversion completed successfully!")
            wx.MessageBox(
                f'PDF has been converted to Word!\nSaved as: {docx_path}',
                'Success',
                wx.OK | wx.ICON_INFORMATION
            )
            
        except Exception as e:
            # 如果发生错误,显示错误信息
            self.status_text.SetLabel("Conversion failed!")
            wx.MessageBox(
                f'An error occurred during conversion:\n{str(e)}',
                'Error',
                wx.OK | wx.ICON_ERROR
            )

if __name__ == '__main__':
    # 启动 wxPython 应用
    app = wx.App()
    
    # 创建并显示窗口
    frame = PDFConverterFrame()
    frame.Show()
    
    # 进入应用的主循环
    app.MainLoop()

代码解析

1. 创建窗口和面板

我们首先通过 wx.Frame 创建了主窗口,wx.Panel 用作主窗口中的面板,所有控件都将放置在这个面板中。wx.BoxSizer(wx.VERTICAL) 用来管理控件的布局,确保它们在窗口中按垂直方向排列。

panel = wx.Panel(self)
vbox = wx.BoxSizer(wx.VERTICAL)

2. 文件选择器

我们使用 wx.FilePickerCtrl 来允许用户选择 PDF 文件。通过设置 wildcard,我们限制了文件选择框只显示 .pdf 文件。

self.file_picker = wx.FilePickerCtrl(
    panel, 
    message="Choose a PDF file",
    wildcard="PDF files (*.pdf)|*.pdf",
    style=wx.FLP_USE_TEXTCTRL | wx.FLP_OPEN | wx.FLP_FILE_MUST_EXIST
)

3. 状态文本

状态文本用来实时反馈转换过程中的信息(如正在转换、转换成功或失败)。

self.status_text = wx.StaticText(panel, label="Select a PDF file to convert")

4. 转换按钮

点击按钮时触发 on_convert 方法,该方法首先检查是否选择了文件,然后检查文件是否存在,最后调用 pdf2docx 库进行转换。

convert_btn = wx.Button(panel, label='Convert to Word')
convert_btn.Bind(wx.EVT_BUTTON, self.on_convert)

5. 文件转换

文件转换过程通过 pdf2docx.Converter 完成。转换过程中,程序会更新状态文本,提示用户正在进行转换,并在成功完成后显示结果信息。

cv = Converter(pdf_path)
cv.convert(docx_path)
cv.close()

6. 错误处理

如果转换过程中出现任何问题,程序会捕获异常并弹出错误提示。

except Exception as e:
    self.status_text.SetLabel("Conversion failed!")
    wx.MessageBox(f'An error occurred during conversion:\n{str(e)}', 'Error', wx.OK | wx.ICON_ERROR)

如何运行这个程序

确保你已经安装了所需的 Python 库:

pip install wxPython pdf2docx

将上述代码保存为 pdf_to_word_converter.py 文件。

在终端或命令行中运行该文件:

python pdf_to_word_converter.py

打开程序后,选择一个 PDF 文件,点击“Convert to Word”按钮,程序会自动将其转换为 Word 文件。

运行结果

以上就是Python GUI实现PDF转Word功能的详细内容,更多关于Python PDF转Word的资料请关注脚本之家其它相关文章!

相关文章

  • python 除法保留两位小数点的方法

    python 除法保留两位小数点的方法

    今天小编就为大家分享一篇python 除法保留两位小数点的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-07-07
  • 浅谈django rest jwt vue 跨域问题

    浅谈django rest jwt vue 跨域问题

    这篇文章主要介绍了django rest jwt vue 跨域问题,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-10-10
  • Python实现PS滤镜的旋转模糊功能示例

    Python实现PS滤镜的旋转模糊功能示例

    这篇文章主要介绍了Python实现PS滤镜的旋转模糊功能,涉及Python基于skimage库针对图片进行旋转与模糊化处理的相关操作技巧,需要的朋友可以参考下
    2018-01-01
  • 利用python模拟sql语句对员工表格进行增删改查

    利用python模拟sql语句对员工表格进行增删改查

    这篇文章主要给大家介绍了关于利用python模拟sql语句实现对员工表格进行增删改查的相关资料,文中介绍了详细的需求以及示例代码,对大家的理解和学习具有一定的参考学习价值,需要的朋友们下面来一起看看吧。
    2017-07-07
  • Numpy掩码式数组详解

    Numpy掩码式数组详解

    下面小编就为大家分享一篇Numpy掩码式数组详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-04-04
  • 关于sys.stdout和print的区别详解

    关于sys.stdout和print的区别详解

    今天小编就为大家分享一篇关于sys.stdout和print的区别详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • Jetson Xavier NX安装CUDA支持的PyTorch教程

    Jetson Xavier NX安装CUDA支持的PyTorch教程

    本文介绍了在Jetson Xavier NX上安装CUDA支持的PyTorch的方法,提供了两种安装方式,一种是直接安装编译好的PyTorch轮子,另一种是自己从源码构建,文中详细描述了安装前的准备工作、安装步骤以及可能遇到的问题和解决方案
    2026-04-04
  • python实现将视频按帧读取到自定义目录

    python实现将视频按帧读取到自定义目录

    今天小编就为大家分享一篇python实现将视频按帧读取到自定义目录,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • 图文详解如何利用PyTorch实现图像识别

    图文详解如何利用PyTorch实现图像识别

    这篇文章主要给大家介绍了关于如何利用PyTorch实现图像识别的相关资料,文中通过图文以及实例代码介绍的非常详细,对大家学习或者使用PyTorch具有一定的参考学习价值,需要的朋友可以参考下
    2023-04-04
  • Python中的远程调试与性能优化技巧分享

    Python中的远程调试与性能优化技巧分享

    Python 是一种简单易学、功能强大的编程语言,广泛应用于各种领域,包括网络编程、数据分析、人工智能等,在开发过程中,我们经常会遇到需要远程调试和性能优化的情况,本文将介绍如何利用远程调试工具和性能优化技巧来提高 Python 应用程序的效率和性能
    2024-05-05

最新评论