使用Python创建读取和修改Word文档

 更新时间:2025年02月08日 08:32:00   作者:Eiceblue  
Python凭借其简洁语法和丰富的生态工具链,是实现文档自动化处理的理想工具,本文将介绍如何使用Python实现Word文档的创建,读取及修改,需要的可以了解下

自动化文档处理是提升工作效率的关键路径之一,而Python凭借其简洁语法和丰富的生态工具链,是实现文档自动化处理的理想工具。通过编程手段批量生成结构规范的合同模板、动态注入数据分析结果生成可视化报告,或是快速提取海量文档中的关键信息,这种代码驱动的工作流不仅消除了人工重复操作带来的误差风险,更将文档处理从机械劳动升级为可扩展的智能系统。本文将介绍如何使用Python实现Word文档的创建、读取及修改。

本文所使用的方法需要用到免费的Free Spire.Doc for Python,PyPI:pip install spire.doc.free

用Python创建Word文档

我们可以通过创建Document实例来创建Word文档,然后在文档中添加节(Document.AddSection)、段落(Section.AddParagraph)以及文本(Paragraph.AppendText),并对其进行格式设置,从而实现个性化的Word文档创建。以下是操作步骤示例:

  • 实例化Document类从而创建Word文档。
  • 使用Document.AddSection()方法在文档中添加一个节,并通过Section.PageSetup自定义节的页面设置。
  • 通过ParagraphStyle类创建段落样式并使用Document.Styles.Add()方法将样式添加到文档中。
  • 使用Section.AddParagraph()方法在节中添加段落。
  • 使用Paragraph.ApplyStyle()方法应用段落样式。
  • 使用Document.SaveToFile()方法或Document.SaveToStream()方法保存创建的文档。
  • 释放资源。

代码示例

from spire.doc import *

# 实例化Document类从而创建Word文档
doc = Document()

# 添加一个节到文档中
section = doc.AddSection()
# 设置页边距
section.PageSetup.Margins.Top = 50
section.PageSetup.Margins.Bottom = 50
section.PageSetup.Margins.Left = 50
section.PageSetup.Margins.Right = 50

# 添加标题段落
titleParagraph = section.AddParagraph()
titleParagraph.AppendText("数字时代的隐秘角落")
titleParagraph.ApplyStyle(BuiltinStyle.Heading2)

# 创建正文段落样式
bodyStyle = ParagraphStyle(doc)
bodyStyle.Name = "BodyStyle"
bodyStyle.CharacterFormat.FontName = "黑体"
bodyStyle.CharacterFormat.FontSize = 12
bodyStyle.CharacterFormat.TextColor = Color.get_Brown()
# 将样式添加到文档中
doc.Styles.Add(bodyStyle)

# 添加正文段落
bodyParagraph = section.AddParagraph()
bodyParagraph.AppendText("在这个高度数字化的时代,每一秒钟都有海量的信息被创建、分享和遗弃。"
                         "我们习惯于快速滚动过无数的更新动态,追逐最新的趋势和技术。"
                         "然而,在这个过程中,许多珍贵的“网络遗产”正在被悄然遗忘。"
                         "这些遗产包括早期互联网用户的创意作品、已停止运营的在线社区的记忆以及那些曾经风靡一时但现在无人问津的数字内容。"
                         "它们不仅仅是数据堆砌而成的遗迹,更是人类探索数字领域历程的见证。"
                         "通过探索这些被遗忘的角落,我们可以更好地理解互联网文化的发展脉络,并从中汲取对未来创新有益的经验与教训。"
                         "这不仅是一次对过去的回顾,更是一场关于如何在瞬息万变的数字世界中保存人类共同记忆的深刻思考。")
# 将正文段落样式应用到段落中
bodyParagraph.ApplyStyle(bodyStyle.Name)

# 保存文档
doc.SaveToFile("output/Example.docx", FileFormat.Docx2019)
doc.Close()

结果

用Python读取Word文档文本

如果我们需要读取现有Word文档中的文本内容为字符串,从而方便进行其他操作或进一步处理,可以使用Document.LoadFromFile或Document.LoadFromStream方法载入Word文档,然后直接使用Document.GetText方法获取文档中的所有文本内容。以下是操作步骤示例:

  • 创建Document对象。
  • 使用Document.LoadFromFile()方法从文件载入Word文档,或使用Document.LoadFromStream()方法从流载入Word文档。
  • 使用Document.GetText()方法获取文档中的所有文本内容。
  • 输出读取的内容或用于其他操作。

代码示例

from spire.doc import Document

# 创建Document对象
doc = Document()

# 载入Word文档
doc.LoadFromFile("output/Example.docx")

# 获取文档中的所有文本为字符串
text = doc.GetText()

# 输出获取到的字符串
print(text)

结果

用Python修改Word文档

我们也可以使用Free Spire.Doc for Python载入Word文档,并直接使用库中的类和方法对文档进行修改。以下是操作步骤示例:

  • 创建Document对象。
  • 使用Document.LoadFromFile()方法从文件载入Word文档,或使用Document.LoadFromStream()方法从流载入Word文档。
  • 使用Document.Sections.get_Item()方法获取一个节。
  • 使用Section.PageSetup下的属性修改页面设置。
  • 使用Section.Paragraphs.get_Item()方法获取节中的段落。
  • 使用Paragraph.Text属性设置新的段落文本。
  • 使用Paragraph.ApplyStyle()方法更改段落样式。
  • 使用Document.SaveToFile()方法或Document.SaveToStream()方法保存修改后的文档。

代码示例

from spire.doc import Document, BuiltinStyle

# 创建Document对象
doc = Document()

# 载入Word文档
doc.LoadFromFile("output/Example.docx")

# 获取文档第一节
section = doc.Sections.get_Item(0)

# 修改节的左右页边距
section.PageSetup.Margins.Left = 100
section.PageSetup.Margins.Right = 100

# 获取节中的第一个段落
para = section.Paragraphs.get_Item(0)

# 修改段落文本
para.Text = "探索被遗忘的网络遗产"

# 修改段落样式
para.ApplyStyle(BuiltinStyle.Heading1)

# 保存修改后的文档
doc.SaveToFile("output/ModifiedExample.docx")
doc.Close()

结果

到此这篇关于使用Python创建读取和修改Word文档的文章就介绍到这了,更多相关Python操作Word内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 浅谈python3发送post请求参数为空的情况

    浅谈python3发送post请求参数为空的情况

    今天小编就为大家分享一篇浅谈python3发送post请求参数为空的情况,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • python实现飞机大战微信小游戏

    python实现飞机大战微信小游戏

    这篇文章主要为大家详细介绍了python实现飞机大战微信小游戏,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-09-09
  • Anaconda中导出环境的实现步骤

    Anaconda中导出环境的实现步骤

    在 Anaconda 中导出环境是一种常用的做法,可以将当前的环境配置导出到一个文件中,本文主要介绍了Anaconda中导出环境的实现步骤,具有一定的参考价值
    2024-05-05
  • Python列表创建与销毁及缓存池机制

    Python列表创建与销毁及缓存池机制

    这篇文章主要介绍了Python列表创建与销毁及缓存池机制,文章基于python展开对列表创建与销毁内容的展开,具有一定的参考价值,需要的小伙伴可以参考一下
    2022-05-05
  • 教你使用Python写一个简单的JSONParser

    教你使用Python写一个简单的JSONParser

    这篇文章主要介绍了教你使用Python写一个简单的JSONParser,它的整个效果,有点类似于 python 标准库 json 的 json.load() 方法,需要的朋友可以参考下
    2023-04-04
  • 使用python接入微信聊天机器人

    使用python接入微信聊天机器人

    这篇文章主要为大家详细介绍了使用python接入微信聊天机器人,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-06-06
  • Django中modelform组件实例用法总结

    Django中modelform组件实例用法总结

    在本篇文章里小编给大家整理的是关于Django中modelform组件实例用法内容,有兴趣的朋友们可以跟着学习下。
    2020-02-02
  • python对excel文档去重及求和的实例

    python对excel文档去重及求和的实例

    下面小编就为大家分享一篇python对excel文档去重及求和的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-04-04
  • Python爬取网站图片并保存的实现示例

    Python爬取网站图片并保存的实现示例

    这篇文章主要介绍了Python爬取网站图片并保存的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-02-02
  • python学习字符串驻留与常量折叠隐藏特性详解

    python学习字符串驻留与常量折叠隐藏特性详解

    这篇文章主要为大家介绍了python学习中字符串驻留与常量折叠的一些隐藏特性,并给大家进行了详细分析,有需要的朋友可以借鉴参考下,希望能够有所帮助
    2021-09-09

最新评论