Java调用Docx4j库玩转Word文档处理

 更新时间:2025年02月09日 09:56:35   作者:五行星辰  
在 Java 开发里处理 Word 文档时,Docx4j 可是个超厉害的库,它能让咱轻松创建,读取,修改和转换 Word 文档,下面我们就来看看具体是如何操作的吧

嘿,朋友们!在 Java 开发里处理 Word 文档时,Docx4j 可是个超厉害的库,它能让咱轻松创建、读取、修改和转换 Word 文档。下面咱就详细说说怎么用 Docx4j 来处理 Word 文档。

1. 引入依赖

要是你用 Maven 管理项目,就在 pom.xml 里加上这些依赖:

<dependencies>
    <dependency>
        <groupId>org.docx4j</groupId>
        <artifactId>docx4j-JAXB-Internal</artifactId>
        <version>11.4.9</version>
    </dependency>
    <dependency>
        <groupId>org.docx4j</groupId>
        <artifactId>docx4j-JAXB-ReferenceImpl</artifactId>
        <version>11.4.9</version>
    </dependency>
    <dependency>
        <groupId>org.docx4j</groupId>
        <artifactId>docx4j</artifactId>
        <version>11.4.9</version>
    </dependency>
</dependencies>

2. 创建一个简单的 Word 文档

下面是创建一个简单 Word 文档的 Java 代码示例:

import org.docx4j.Docx4J;
import org.docx4j.convert.out.FOSettings;
import org.docx4j.openpackaging.packages.WordprocessingMLPackage;
import org.docx4j.openpackaging.parts.WordprocessingML.MainDocumentPart;
import org.docx4j.wml.P;
import org.docx4j.wml.Text;
 
import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;
 
public class CreateWordDocument {
    public static void main(String[] args) {
        try {
            // 创建一个 WordprocessingMLPackage 对象,表示一个 Word 文档
            WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.createPackage();
            // 获取文档的主文档部分
            MainDocumentPart mainDocumentPart = wordMLPackage.getMainDocumentPart();
 
            // 创建一个段落
            P paragraph = mainDocumentPart.createParagraphOfText("这是用 Docx4j 创建的一个简单 Word 文档。");
 
            // 保存文档
            OutputStream os = new FileOutputStream(new File("output.docx"));
            Docx4J.save(wordMLPackage, os, Docx4J.FLAG_NONE);
            os.close();
 
            System.out.println("Word 文档创建成功!");
        } catch (Exception e) {
            e.printStackTrace();
            System.out.println("Word 文档创建失败:" + e.getMessage());
        }
    }
}

代码解释

WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.createPackage();:创建一个 WordprocessingMLPackage 对象,它代表整个 Word 文档。

MainDocumentPart mainDocumentPart = wordMLPackage.getMainDocumentPart();:获取文档的主文档部分,后续操作主要在这个部分进行。

P paragraph = mainDocumentPart.createParagraphOfText("这是用 Docx4j 创建的一个简单 Word 文档。");:创建一个段落,并添加文本内容。

OutputStream os = new FileOutputStream(new File("output.docx")); 和 Docx4J.save(wordMLPackage, os, Docx4J.FLAG_NONE);:将文档保存为 output.docx 文件。

3. 读取 Word 文档内容

下面是读取 Word 文档内容的示例代码:

import org.docx4j.Docx4J;
import org.docx4j.openpackaging.packages.WordprocessingMLPackage;
import org.docx4j.openpackaging.parts.WordprocessingML.MainDocumentPart;
import org.docx4j.wml.P;
import org.docx4j.wml.Text;
 
import java.io.File;
import java.util.List;
 
public class ReadWordDocument {
    public static void main(String[] args) {
        try {
            // 加载 Word 文档
            WordprocessingMLPackage wordMLPackage = Docx4J.load(new File("input.docx"));
            // 获取主文档部分
            MainDocumentPart mainDocumentPart = wordMLPackage.getMainDocumentPart();
 
            // 获取所有段落
            List<Object> paragraphs = mainDocumentPart.getContent();
            for (Object paraObj : paragraphs) {
                if (paraObj instanceof P) {
                    P paragraph = (P) paraObj;
                    List<Object> runs = paragraph.getContent();
                    for (Object runObj : runs) {
                        if (runObj instanceof Text) {
                            Text text = (Text) runObj;
                            System.out.print(text.getValue());
                        }
                    }
                    System.out.println();
                }
            }
        } catch (Exception e) {
            e.printStackTrace();
            System.out.println("Word 文档读取失败:" + e.getMessage());
        }
    }
}

代码解释

WordprocessingMLPackage wordMLPackage = Docx4J.load(new File("input.docx"));:加载 input.docx 文件。

通过遍历主文档部分的内容,找到所有段落和文本,然后将文本内容打印出来。

4. 替换 Word 文档中的文本

下面是替换 Word 文档中指定文本的示例代码:

import org.docx4j.Docx4J;
import org.docx4j.openpackaging.packages.WordprocessingMLPackage;
import org.docx4j.openpackaging.parts.WordprocessingML.MainDocumentPart;
import org.docx4j.wml.P;
import org.docx4j.wml.Text;
 
import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;
import java.util.List;
 
public class ReplaceTextInWord {
    public static void main(String[] args) {
        try {
            // 加载 Word 文档
            WordprocessingMLPackage wordMLPackage = Docx4J.load(new File("input.docx"));
            // 获取主文档部分
            MainDocumentPart mainDocumentPart = wordMLPackage.getMainDocumentPart();
 
            // 要替换的文本和替换后的文本
            String oldText = "旧文本";
            String newText = "新文本";
 
            // 获取所有段落
            List<Object> paragraphs = mainDocumentPart.getContent();
            for (Object paraObj : paragraphs) {
                if (paraObj instanceof P) {
                    P paragraph = (P) paraObj;
                    List<Object> runs = paragraph.getContent();
                    for (Object runObj : runs) {
                        if (runObj instanceof Text) {
                            Text text = (Text) runObj;
                            String value = text.getValue();
                            if (value != null && value.contains(oldText)) {
                                text.setValue(value.replace(oldText, newText));
                            }
                        }
                    }
                }
            }
 
            // 保存修改后的文档
            OutputStream os = new FileOutputStream(new File("output_replace.docx"));
            Docx4J.save(wordMLPackage, os, Docx4J.FLAG_NONE);
            os.close();
 
            System.out.println("Word 文档文本替换成功!");
        } catch (Exception e) {
            e.printStackTrace();
            System.out.println("Word 文档文本替换失败:" + e.getMessage());
        }
    }
}

代码解释

先加载 input.docx 文件,然后遍历文档中的所有段落和文本,找到包含指定旧文本的地方,将其替换为新文本。

最后将修改后的文档保存为 output_replace.docx 文件。

嘿,朋友们!有了这些示例代码,咱就能用 Docx4j 轻松处理 Word 文档啦。赶紧动手试试,让你的 Java 程序在 Word 文档处理方面大显身手!

到此这篇关于Java调用Docx4j库玩转Word文档处理的文章就介绍到这了,更多相关Java Docx4j处理Word内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Windows下将JAVA jar注册成windows服务的方法

    Windows下将JAVA jar注册成windows服务的方法

    这篇文章主要介绍了Windows下将JAVA jar注册成windows服务的方法,本文通过图文并茂的形式给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-07-07
  • SpringBoot JPA实现增删改查、分页、排序、事务操作等功能示例

    SpringBoot JPA实现增删改查、分页、排序、事务操作等功能示例

    本篇文章主要介绍了SpringBoot JPA实现增删改查、分页、排序、事务操作等功能示例,具有一定的参考价值,感兴趣的小伙伴们可以参考一下。
    2017-03-03
  • Java+TestNG接口自动化入门详解

    Java+TestNG接口自动化入门详解

    本文主要介绍了Java+TestNG接口自动化入门,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-12-12
  • JAVA集合框架工具类自定义Collections集合方法

    JAVA集合框架工具类自定义Collections集合方法

    今天小编就为大家分享一篇关于JAVA集合框架工具类自定义Collections集合方法,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2018-12-12
  • Spring中@Transactional用法详细介绍

    Spring中@Transactional用法详细介绍

    这篇文章主要介绍了Spring中@Transactional用法详细介绍的相关资料,需要的朋友可以参考下
    2017-02-02
  • java有序二叉树的删除节点方式

    java有序二叉树的删除节点方式

    文章描述了在二叉树中删除节点的三种情况及其对应的操作步骤,通过递归找到节点及其父节点,并根据节点的子树情况(无子树、单子树、双子树)进行相应的删除操作,文章还提供了一个测试类来验证删除操作的正确性
    2024-12-12
  • 关于Dubbo初始问题

    关于Dubbo初始问题

    这篇文章主要介绍了关于Dubbo初始问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-03-03
  • Java 超详细讲解设计模式之原型模式讲解

    Java 超详细讲解设计模式之原型模式讲解

    原型模式是用于创建重复的对象,同时又能保证性能。这种类型的设计模式属于创建型模式,它提供了一种创建对象的最佳方式,今天通过本文给大家介绍下Java 原型设计模式,感兴趣的朋友一起看看吧
    2022-03-03
  • Java开发如何把数据库里的未付款订单改成已付款

    Java开发如何把数据库里的未付款订单改成已付款

    这篇文章主要介绍了Java开发如何把数据库里的未付款订单改成已付款,先介绍MD5算法,简单的来说,MD5能把任意大小、长度的数据转换成固定长度的一串字符,实现思路非常简单需要的朋友可以参考下
    2022-11-11
  • Java并发之异步的八种实现方式

    Java并发之异步的八种实现方式

    本文主要介绍了Java并发之异步的八种实现方式,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-06-06

最新评论