Java docx4j高效处理Word文档的实战指南

 更新时间:2025年07月15日 16:01:45   作者:pengles  
对于需要在Java应用程序中生成、修改或处理Word文档的开发者来说,docx4j是一个强大而专业的选择,下面我们就来看看docx4j的具体使用吧

引言

在现代办公自动化和文档处理领域,Microsoft Word的.docx格式已成为行业标准。对于需要在Java应用程序中生成、修改或处理Word文档的开发者来说,docx4j是一个强大而专业的选择。本文将全面介绍docx4j库的特点、使用方法和适用场景,并通过丰富的代码示例展示其强大功能。

一、环境准备与基础配置

1.1 Maven依赖配置

<dependency>
    <groupId>org.docx4j</groupId>
    <artifactId>docx4j-core</artifactId>
    <version>8.3.4</version>
</dependency>
<dependency>
    <groupId>org.docx4j</groupId>
    <artifactId>docx4j-export-fo</artifactId>
    <version>8.3.4</version>
</dependency>

1.2 初始化测试类

public class Docx4jTest {
    private WordprocessingMLPackage wordPackage;
    private ObjectFactory factory;
    
    @BeforeEach
    public void setUp() throws Exception {
        wordPackage = WordprocessingMLPackage.createPackage();
        factory = Context.getWmlObjectFactory();
    }
    
    @AfterEach
    public void tearDown() throws Exception {
        if (wordPackage != null) {
            wordPackage.save(new File("test_output.docx"));
        }
    }
}

二、增强版文档操作示例

2.1 复杂表格生成(带样式和合并单元格)

@Test
public void testCreateComplexTable() throws Exception {
    // 创建5x5表格
    Tbl table = factory.createTbl();
    
    // 设置表格属性
    TblPr tblPr = factory.createTblPr();
    TblWidth tblWidth = factory.createTblWidth();
    tblWidth.setW(BigInteger.valueOf(5000));
    tblWidth.setType("dxa");
    tblPr.setTblWidth(tblWidth);
    table.setTblPr(tblPr);
    
    // 创建表头行
    Tr headerRow = factory.createTr();
    for (int i = 0; i < 5; i++) {
        Tc cell = createTableCell("表头 " + (i+1), true, "FF0000");
        headerRow.getContent().add(cell);
    }
    table.getContent().add(headerRow);
    
    // 创建数据行(带合并单元格)
    for (int row = 0; row < 4; row++) {
        Tr dataRow = factory.createTr();
        for (int col = 0; col < 5; col++) {
            if (row == 1 && col == 1) {
                // 合并单元格(横向合并2个)
                Tc cell = createTableCell("合并单元格", false, "00FF00");
                cell.getTcPr().setGridSpan(new BigInteger("2"));
                dataRow.getContent().add(cell);
                col++; // 跳过下一个单元格
            } else if (row == 2 && col == 0) {
                // 合并单元格(纵向合并2个)
                Tc cell = createTableCell("纵向合并", false, "0000FF");
                cell.getTcPr().setVMerge(factory.createCTVMerge());
                cell.getTcPr().getVMerge().setVal("restart");
                dataRow.getContent().add(cell);
            } else if (row == 3 && col == 0) {
                // 继续纵向合并
                Tc cell = createTableCell("", false, "0000FF");
                cell.getTcPr().setVMerge(factory.createCTVMerge());
                cell.getTcPr().getVMerge().setVal("continue");
                dataRow.getContent().add(cell);
            } else {
                dataRow.getContent().add(
                    createTableCell("数据 "+row+","+col, false, null));
            }
        }
        table.getContent().add(dataRow);
    }
    
    wordPackage.getMainDocumentPart().addObject(table);
    
    assertNotNull(table);
    assertEquals(5, table.getContent().size());
}

2.2 文档样式管理

@Test
public void testDocumentStyles() throws Exception {
    // 创建样式定义
    Styles styles = factory.createStyles();
    
    // 标题1样式
    Style titleStyle = factory.createStyle();
    titleStyle.setType("paragraph");
    titleStyle.setStyleId("Heading1");
    Style.Name name = factory.createStyleName();
    name.setVal("标题 1");
    titleStyle.setName(name);
    
    PPr ppr = factory.createPPr();
    ppr.setOutlineLvl(new BigInteger("0"));
    Jc jc = factory.createJc();
    jc.setVal(JcEnumeration.CENTER);
    ppr.setJc(jc);
    titleStyle.setPPr(ppr);
    
    RPr rpr = factory.createRPr();
    rpr.setB(new BooleanDefaultTrue());
    rpr.setSz(new HpsMeasure(BigInteger.valueOf(32)));
    rpr.setColor(new Color("2F5496"));
    titleStyle.setRPr(rpr);
    
    styles.getStyle().add(titleStyle);
    
    // 将样式添加到文档
    wordPackage.getMainDocumentPart().setStyleDefinitionsPart(
        new StylesPart(wordPackage, styles));
    
    // 使用样式
    P p = factory.createP();
    PPr pPr = factory.createPPr();
    pPr.setPStyle("Heading1");
    p.setPPr(pPr);
    R r = factory.createR();
    Text t = factory.createText();
    t.setValue("这是标题1样式");
    r.getContent().add(t);
    p.getContent().add(r);
    wordPackage.getMainDocumentPart().addObject(p);
    
    // 验证样式是否存在
    assertNotNull(wordPackage.getMainDocumentPart().getStyleDefinitionsPart());
    assertEquals(1, wordPackage.getMainDocumentPart()
        .getStyleDefinitionsPart().getJaxbElement().getStyle().size());
}

三、高级功能实现

3.1 生成带目录的文档

@Test
public void testGenerateTOC() throws Exception {
    // 添加标题样式(同2.2节)
    // ...
    
    // 添加几个带样式的标题
    addStyledParagraph("Heading1", "第一章 简介");
    addStyledParagraph("Heading2", "1.1 背景");
    addStyledParagraph("Heading1", "第二章 实现");
    addStyledParagraph("Heading2", "2.1 技术选型");
    
    // 创建目录字段代码
    P tocParagraph = factory.createP();
    FldChar fldChar = factory.createFldChar();
    fldChar.setFldCharType(STFldCharType.BEGIN);
    tocParagraph.getContent().add(fldChar);
    
    R tocRun = factory.createR();
    Text tocText = factory.createText();
    tocText.setSpace("preserve");
    tocText.setValue(" TOC \\o \"1-3\" \\h \\z \\u ");
    tocRun.getContent().add(tocText);
    tocParagraph.getContent().add(tocRun);
    
    FldChar fldCharSep = factory.createFldChar();
    fldCharSep.setFldCharType(STFldCharType.SEPARATE);
    tocParagraph.getContent().add(fldCharSep);
    
    // 目录占位文本
    R placeholderRun = factory.createR();
    Text placeholderText = factory.createText();
    placeholderText.setValue("目录将在此生成...");
    placeholderRun.getContent().add(placeholderText);
    tocParagraph.getContent().add(placeholderRun);
    
    FldChar fldCharEnd = factory.createFldChar();
    fldCharEnd.setFldCharType(STFldCharType.END);
    tocParagraph.getContent().add(fldCharEnd);
    
    // 将目录添加到文档开头
    wordPackage.getMainDocumentPart().addObject(0, tocParagraph);
    
    // 更新字段(生成实际目录)
    FieldUpdater updater = new FieldUpdater(wordPackage);
    updater.update(true);
    
    // 验证目录是否存在
    assertTrue(wordPackage.getMainDocumentPart().getContent().get(0) instanceof P);
}

3.2 文档加密与保护

@Test
public void testDocumentProtection() throws Exception {
    // 设置文档保护
    DocumentProtection protection = new DocumentProtection();
    protection.setEdit(ProtectionEditType.READ_ONLY);
    protection.setPassword("123456");
    
    // 应用保护设置
    wordPackage.getMainDocumentPart().getContents().getBody().setDocumentProtection(
        protection.createDocumentProtection());
    
    // 添加一些内容
    wordPackage.getMainDocumentPart().addParagraphOfText("这是受保护的文档");
    
    // 保存并重新加载验证保护
    ByteArrayOutputStream baos = new ByteArrayOutputStream();
    wordPackage.save(baos);
    
    ByteArrayInputStream bais = new ByteArrayInputStream(baos.toByteArray());
    WordprocessingMLPackage protectedPackage = WordprocessingMLPackage.load(bais);
    
    // 尝试修改(应抛出异常)
    assertThrows(Docx4JException.class, () -> {
        protectedPackage.getMainDocumentPart().addParagraphOfText("尝试修改");
        protectedPackage.save(new File("protected.docx"));
    });
    
    // 使用密码解除保护
    protectedPackage = WordprocessingMLPackage.load(new ByteArrayInputStream(baos.toByteArray()));
    protectedPackage.getMainDocumentPart().removeProtection("123456");
    protectedPackage.getMainDocumentPart().addParagraphOfText("已解除保护");
    protectedPackage.save(new File("unprotected.docx"));
}

四、测试工具类与实用方法

4.1 文档比较工具类

public class DocxComparator {
    public static boolean compareDocs(File doc1, File doc2) throws Exception {
        WordprocessingMLPackage pkg1 = WordprocessingMLPackage.load(doc1);
        WordprocessingMLPackage pkg2 = WordprocessingMLPackage.load(doc2);
        
        // 比较文档结构
        if (!compareParts(pkg1.getMainDocumentPart(), pkg2.getMainDocumentPart())) {
            return false;
        }
        
        // 比较样式
        if (!compareStyles(pkg1, pkg2)) {
            return false;
        }
        
        return true;
    }
    
    private static boolean compareParts(Part part1, Part part2) {
        // 实现具体的比较逻辑
        // ...
        return true;
    }
    
    private static boolean compareStyles(WordprocessingMLPackage pkg1, 
                                       WordprocessingMLPackage pkg2) {
        // 实现样式比较逻辑
        // ...
        return true;
    }
}

// 测试用例
@Test
public void testDocumentComparison() throws Exception {
    File original = new File("template.docx");
    File generated = new File("test_output.docx");
    
    // 生成测试文档
    WordprocessingMLPackage pkg = WordprocessingMLPackage.createPackage();
    pkg.getMainDocumentPart().addParagraphOfText("测试内容");
    pkg.save(generated);
    
    // 比较文档
    assertFalse(DocxComparator.compareDocs(original, generated));
    
    // 比较相同文档
    assertTrue(DocxComparator.compareDocs(generated, generated));
}

4.2 性能测试工具

public class Docx4jBenchmark {
    public static long measureDocumentCreation(int paragraphCount) throws Exception {
        long start = System.currentTimeMillis();
        
        WordprocessingMLPackage wordPackage = WordprocessingMLPackage.createPackage();
        ObjectFactory factory = Context.getWmlObjectFactory();
        
        for (int i = 0; i < paragraphCount; i++) {
            P p = factory.createP();
            R r = factory.createR();
            Text t = factory.createText();
            t.setValue("段落 " + (i+1));
            r.getContent().add(t);
            p.getContent().add(r);
            wordPackage.getMainDocumentPart().addObject(p);
        }
        
        ByteArrayOutputStream out = new ByteArrayOutputStream();
        wordPackage.save(out);
        
        return System.currentTimeMillis() - start;
    }
}

// 性能测试用例
@Test
public void testPerformance() throws Exception {
    int[] testSizes = {100, 1000, 5000};
    
    for (int size : testSizes) {
        long time = Docx4jBenchmark.measureDocumentCreation(size);
        System.out.printf("生成 %d 段落的文档耗时: %d ms%n", size, time);
        assertTrue(time < 10000, "性能测试失败,耗时过长");
    }
}

五、集成测试示例

5.1 端到端文档生成测试

@Test
public void testEndToEndDocumentGeneration() throws Exception {
    // 1. 创建文档
    WordprocessingMLPackage wordPackage = WordprocessingMLPackage.createPackage();
    
    // 2. 添加封面
    addCoverPage(wordPackage);
    
    // 3. 添加目录
    addTableOfContents(wordPackage);
    
    // 4. 添加章节内容
    addChapter(wordPackage, "1. 简介", "这是文档的简介部分...");
    addChapter(wordPackage, "2. 实现", "详细实现说明...");
    
    // 5. 添加表格
    addSampleTable(wordPackage);
    
    // 6. 添加图表
    addSampleChart(wordPackage);
    
    // 7. 添加页眉页脚
    addHeaderFooter(wordPackage);
    
    // 8. 保存文档
    File output = new File("full_document.docx");
    wordPackage.save(output);
    
    // 验证
    assertTrue(output.exists());
    assertTrue(output.length() > 1024); // 文档大小应大于1KB
    
    // 验证文档结构
    WordprocessingMLPackage loaded = WordprocessingMLPackage.load(output);
    assertNotNull(loaded.getMainDocumentPart());
    assertNotNull(loaded.getMainDocumentPart().getStyleDefinitionsPart());
    
    // 验证内容
    String xml = XmlUtils.marshaltoString(
        loaded.getMainDocumentPart().getJaxbElement(), true);
    assertTrue(xml.contains("简介"));
    assertTrue(xml.contains("实现"));
}

5.2 异常处理测试

@Test
public void testExceptionHandling() {
    // 测试无效文件加载
    assertThrows(Docx4JException.class, () -> {
        WordprocessingMLPackage.load(new File("nonexistent.docx"));
    });
    
    // 测试无效操作
    assertThrows(IllegalStateException.class, () -> {
        WordprocessingMLPackage wordPackage = WordprocessingMLPackage.createPackage();
        wordPackage.save(null);
    });
    
    // 测试样式操作错误
    assertThrows(InvalidFormatException.class, () -> {
        WordprocessingMLPackage wordPackage = WordprocessingMLPackage.createPackage();
        P p = factory.createP();
        PPr pPr = factory.createPPr();
        pPr.setPStyle("InvalidStyle");
        p.setPPr(pPr);
        wordPackage.getMainDocumentPart().addObject(p);
        wordPackage.save(new File("invalid_style.docx"));
    });
}

六、实用工具方法集

文档生成工具类

public class DocxGenerator {
    private final WordprocessingMLPackage wordPackage;
    private final ObjectFactory factory;
    
    public DocxGenerator() throws Docx4JException {
        this.wordPackage = WordprocessingMLPackage.createPackage();
        this.factory = Context.getWmlObjectFactory();
    }
    
    public void addTitle(String text, int level) {
        P p = factory.createP();
        PPr pPr = factory.createPPr();
        pPr.setPStyle("Heading" + level);
        p.setPPr(pPr);
        
        R r = factory.createR();
        Text t = factory.createText();
        t.setValue(text);
        r.getContent().add(t);
        p.getContent().add(r);
        
        wordPackage.getMainDocumentPart().addObject(p);
    }
    
    public void addParagraph(String text) {
        wordPackage.getMainDocumentPart().addParagraphOfText(text);
    }
    
    public void addTable(List<List<String>> data) {
        Tbl table = factory.createTbl();
        
        // 添加表头
        if (!data.isEmpty()) {
            Tr headerRow = factory.createTr();
            for (String header : data.get(0)) {
                headerRow.getContent().add(createTableCell(header, true, null));
            }
            table.getContent().add(headerRow);
        }
        
        // 添加数据行
        for (int i = 1; i < data.size(); i++) {
            Tr dataRow = factory.createTr();
            for (String cellData : data.get(i)) {
                dataRow.getContent().add(createTableCell(cellData, false, null));
            }
            table.getContent().add(dataRow);
        }
        
        wordPackage.getMainDocumentPart().addObject(table);
    }
    
    public void saveToFile(String filename) throws Docx4JException {
        wordPackage.save(new File(filename));
    }
    
    private Tc createTableCell(String text, boolean isHeader, String color) {
        Tc cell = factory.createTc();
        P p = factory.createP();
        R r = factory.createR();
        Text t = factory.createText();
        t.setValue(text);
        r.getContent().add(t);
        
        if (isHeader || color != null) {
            RPr rPr = factory.createRPr();
            if (isHeader) {
                rPr.setB(new BooleanDefaultTrue());
            }
            if (color != null) {
                Color textColor = new Color();
                textColor.setVal(color);
                rPr.setColor(textColor);
            }
            r.setRPr(rPr);
        }
        
        p.getContent().add(r);
        cell.getContent().add(p);
        return cell;
    }
}

// 使用示例
@Test
public void testDocxGenerator() throws Exception {
    DocxGenerator generator = new DocxGenerator();
    
    generator.addTitle("测试文档", 1);
    generator.addParagraph("这是一个自动生成的测试文档");
    
    List<List<String>> tableData = new ArrayList<>();
    tableData.add(Arrays.asList("ID", "名称", "数量"));
    tableData.add(Arrays.asList("1", "商品A", "100"));
    tableData.add(Arrays.asList("2", "商品B", "200"));
    generator.addTable(tableData);
    
    generator.saveToFile("generated_doc.docx");
    
    File output = new File("generated_doc.docx");
    assertTrue(output.exists());
}

结语

本文提供了docx4j的全面增强版实现,包含丰富的代码示例和测试用例。通过这些示例,开发者可以:

  • 掌握docx4j的高级功能实现
  • 学习如何为docx4j编写有效的测试用例
  • 了解性能优化和异常处理的最佳实践
  • 使用提供的工具类简化日常开发

建议在实际项目中:

  • 根据业务需求封装专用工具类
  • 建立完善的测试体系
  • 监控文档生成的性能指标
  • 做好异常处理和日志记录

通过这些实践,可以充分发挥docx4j的强大功能,构建稳定高效的文档处理系统。

到此这篇关于Java docx4j高效处理Word文档的实战指南的文章就介绍到这了,更多相关Java docx4j处理Word内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Java springboot探究配置文件优先级

    Java springboot探究配置文件优先级

    在springboot项目中,我们可以通过在yml文件中设置变量,再通过@Value注解来获得这个变量并使用,但如果这个项目已经部署到服务器上,我们想更改这个数据了需要怎么做呢,其实在springboot项目中,配置文件是有优先级的
    2023-04-04
  • Java实现一致性Hash算法详情

    Java实现一致性Hash算法详情

    这篇文章主要介绍了Java实现一致性Hash算法详情,文章围绕主题展开详细的内容介绍,具有一定的参考价值,需要的小伙伴可以参考一下
    2022-09-09
  • Java利用Spire.XLS for Java自动化设置Excel的文档属性

    Java利用Spire.XLS for Java自动化设置Excel的文档属性

    一个专业的 Excel 文件,其文档属性往往能大大提升文件的可管理性和可检索性,下面我们就来看看Java如何使用Spire.XLS for Java实现自动化设置Excel的文档属性吧
    2025-12-12
  • Java 实现使用Comparable按照我们指定的规则排序

    Java 实现使用Comparable按照我们指定的规则排序

    这篇文章主要介绍了Java 如何使用Comparable按照我们指定的规则排序,通过练习创建TreeSet集合使用无参构造方法,并按照年龄从小到大的顺序排序,若年龄相同再按照姓名的字母顺序排序展开内容,需要的朋友可以参考一下
    2022-04-04
  • SpringSecurity、Shiro 和 Sa-Token怎么选,哪个更好

    SpringSecurity、Shiro 和 Sa-Token怎么选,哪个更好

    本文介绍了SpringSecurity、ApacheShiro和Sa-Token三个主流安全框架的特点,并分析了它们在不同场景下的适用性,文章提供了一个决策流程图,帮助开发者根据具体需求选择合适的框架,感兴趣的朋友跟随小编一起看看吧
    2025-12-12
  • 关于idea一直卡在build不动的解决方案

    关于idea一直卡在build不动的解决方案

    这篇文章主要介绍了idea一直卡在build不动的解决方案,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-10-10
  • 浅谈JVM 底层解析 i++和 ++i 区别

    浅谈JVM 底层解析 i++和 ++i 区别

    这篇文章主要介绍了JVM 底层解析 i++和 ++i 区别,需要的朋友可以参考下面文章的具体内容
    2021-09-09
  • Java常见的四种负载均衡算法

    Java常见的四种负载均衡算法

    本文主要介绍了Java常见的四种负载均衡算法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-05-05
  • java读取xml配置参数代码实例

    java读取xml配置参数代码实例

    这篇文章主要介绍了java读取xml配置参数代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-12-12
  • java之super关键字用法实例解析

    java之super关键字用法实例解析

    这篇文章主要介绍了java之super关键字用法实例解析,较为详细的分析了super关键字的用法及内存分布,需要的朋友可以参考下
    2014-09-09

最新评论