Java实现一键将Word文档转为PDF

 更新时间:2025年02月09日 12:44:31   作者:五行星辰  
在开发中,经常会碰到需要把 Word 文档转换成 PDF 格式的需求,Java 有不少好用的库能实现这个功能,本文为大家介绍了两个常用的方法,需要的可以了解下

在开发中,经常会碰到需要把 Word 文档转换成 PDF 格式的需求,像生成报告、合同啥的。Java 有不少好用的库能实现这个功能,下面就给大家介绍两种常见的方法,分别使用 Apache POI 和 Docx4J 结合 iText 库来实现 Word 转 PDF。

方法一:使用 Apache POI 和 iText

1. 引入依赖

如果你用 Maven 管理项目,在 pom.xml 里添加以下依赖:

<dependencies>
    <!-- Apache POI 处理 Word 文档 -->
    <dependency>
        <groupId>org.apache.poi</groupId>
        <artifactId>poi-ooxml</artifactId>
        <version>5.2.3</version>
    </dependency>
    <!-- iText 生成 PDF 文档 -->
    <dependency>
        <groupId>com.itextpdf</groupId>
        <artifactId>itextpdf</artifactId>
        <version>5.5.13.3</version>
    </dependency>
</dependencies>

2. 代码示例

import com.itextpdf.text.*;
import com.itextpdf.text.pdf.PdfWriter;
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFParagraph;
import org.apache.poi.xwpf.usermodel.XWPFRun;
 
import java.io.*;
 
public class WordToPdfWithPOI {
    public static void main(String[] args) {
        try {
            // 读取 Word 文档
            FileInputStream fis = new FileInputStream("input.docx");
            XWPFDocument document = new XWPFDocument(fis);
 
            // 创建 PDF 文档
            Document pdfDoc = new Document();
            PdfWriter.getInstance(pdfDoc, new FileOutputStream("output.pdf"));
            pdfDoc.open();
 
            // 遍历 Word 文档的段落
            for (XWPFParagraph paragraph : document.getParagraphs()) {
                StringBuilder text = new StringBuilder();
                // 遍历段落中的文本运行对象
                for (XWPFRun run : paragraph.getRuns()) {
                    text.append(run.getText(0));
                }
                // 将段落文本添加到 PDF 文档中
                Paragraph pdfParagraph = new Paragraph(text.toString());
                pdfDoc.add(pdfParagraph);
            }
 
            // 关闭文档和流
            pdfDoc.close();
            document.close();
            fis.close();
 
            System.out.println("Word 转 PDF 成功!");
        } catch (Exception e) {
            e.printStackTrace();
            System.out.println("Word 转 PDF 失败:" + e.getMessage());
        }
    }
}

3. 代码解释

读取 Word 文档:用 FileInputStream 读取 input.docx 文件,再用 XWPFDocument 类把它加载到内存。

创建 PDF 文档:创建 Document 对象表示 PDF 文档,用 PdfWriter 关联输出流,然后打开文档准备写入内容。

遍历 Word 文档段落:遍历 Word 文档的每个段落,把段落里的文本提取出来,添加到 StringBuilder 里,再创建 Paragraph 对象添加到 PDF 文档中。

关闭文档和流:操作完成后,关闭 PDF 文档、Word 文档和输入流。

方法二:使用 Docx4J

1. 引入依赖

在 pom.xml 里添加以下依赖:

<dependencies>
    <dependency>
        <groupId>org.docx4j</groupId>
        <artifactId>docx4j-JAXB-Internal</artifactId>
        <version>11.4.9</version>
    </dependency>
    <dependency>
        <groupId>org.docx4j</groupId>
        <artifactId>docx4j-JAXB-ReferenceImpl</artifactId>
        <version>11.4.9</version>
    </dependency>
    <dependency>
        <groupId>org.docx4j</groupId>
        <artifactId>docx4j</artifactId>
        <version>11.4.9</version>
    </dependency>
    <dependency>
        <groupId>org.docx4j</groupId>
        <artifactId>docx4j-export-fo</artifactId>
        <version>11.4.9</version>
    </dependency>
</dependencies>

2. 代码示例

import org.docx4j.Docx4J;
import org.docx4j.convert.out.FOSettings;
import org.docx4j.openpackaging.packages.WordprocessingMLPackage;
 
import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;
 
public class WordToPdfWithDocx4J {
    public static void main(String[] args) {
        try {
            // 加载 Word 文档
            WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.load(new File("input.docx"));
 
            // 创建 FOSettings 对象
            FOSettings foSettings = Docx4J.createFOSettings();
            foSettings.setWmlPackage(wordMLPackage);
 
            // 创建输出流
            OutputStream os = new FileOutputStream(new File("output.pdf"));
 
            // 转换并保存为 PDF
            Docx4J.toPDF(foSettings, os, Docx4J.FLAG_EXPORT_PREFER_XSL);
 
            // 关闭输出流
            os.close();
 
            System.out.println("Word 转 PDF 成功!");
        } catch (Exception e) {
            e.printStackTrace();
            System.out.println("Word 转 PDF 失败:" + e.getMessage());
        }
    }
}

3. 代码解释

加载 Word 文档:用 WordprocessingMLPackage.load 方法加载 input.docx 文件。

创建 FOSettings 对象:FOSettings 用于配置转换设置,把加载的 Word 文档设置进去。

创建输出流:创建 FileOutputStream 用于输出 PDF 文件。

转换并保存为 PDF:调用 Docx4J.toPDF 方法进行转换,并将结果保存到输出流。

关闭输出流:操作完成后,关闭输出流。

嘿,朋友们!这两种方法都能帮你用 Java 把 Word 文档转换成 PDF。你可以根据自己的需求和喜好选择合适的方法。

到此这篇关于Java实现一键将Word文档转为PDF的文章就介绍到这了,更多相关Java Word转PDF内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 使用Mock进行业务逻辑层Service测试详解

    使用Mock进行业务逻辑层Service测试详解

    这篇文章主要介绍了使用Mock进行业务逻辑层Service测试详解,mock是一种模拟对象的技术,用于在测试过程中替代真实的对象,通过mock,我们可以控制被模拟对象的行为和返回值,以便进行更加精确的测试,需要的朋友可以参考下
    2023-08-08
  • springmvc使用@notNull注解验证请求参数方式

    springmvc使用@notNull注解验证请求参数方式

    这篇文章主要介绍了springmvc使用@notNull注解验证请求参数方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教<BR>
    2024-01-01
  • 用IntelliJ IDEA看Java类图的方法(图文)

    用IntelliJ IDEA看Java类图的方法(图文)

    这篇文章主要介绍了用IntelliJ IDEA看Java类图的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-02-02
  • springboot 如何添加webapp文件夹

    springboot 如何添加webapp文件夹

    这篇文章主要介绍了springboot 如何添加webapp文件夹,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-01-01
  • 基于spring boot实现一个全局异常处理器

    基于spring boot实现一个全局异常处理器

    在项目开发中,我们可以基于spring boot提供的切面特性,来很轻松的实现全局异常的处理,所以本文主要为大家介绍了如何基于spring boot实现一个全局异常处理器,有需要的可以参考下
    2023-09-09
  • Ubuntu16.04安装部署solr7的图文详细教程

    Ubuntu16.04安装部署solr7的图文详细教程

    这篇文章主要为大家详细介绍了Ubuntu16.04安装部署solr7的图文详细教程,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-07-07
  • java实现远程桌面的实例代码

    java实现远程桌面的实例代码

    下面小编就为大家分享一篇java实现远程桌面的实例代码,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-01-01
  • Java压缩文件工具类ZipUtil使用方法代码示例

    Java压缩文件工具类ZipUtil使用方法代码示例

    这篇文章主要介绍了Java压缩文件工具类ZipUtil使用方法代码示例,具有一定借鉴价值,需要的朋友可以参考下。
    2017-11-11
  • Mybatis对mapper的加载流程深入讲解

    Mybatis对mapper的加载流程深入讲解

    这篇文章主要给大家介绍了关于Mybatis对mapper的加载流程,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-11-11
  • MyBatis-Plus如何关闭SQL日志打印详解

    MyBatis-Plus如何关闭SQL日志打印详解

    在使用mybatisplus进行开发时,日志是一个非常有用的工具,它可以帮助我们更好地了解和调试我们的代码,这篇文章主要给大家介绍了关于MyBatis-Plus如何关闭SQL日志打印的相关资料,需要的朋友可以参考下
    2024-03-03

最新评论