Python使用docx模块编辑Word文档

 更新时间:2023年07月19日 11:27:35   作者:W金刚葫芦娃W  
docx提供了一组功能丰富的函数和方法,用于创建、修改和读取Word文档,Python可以用它对word文档进行大批量的编辑,下面小编就来通过一些示例为大家好好讲讲吧

前言

该模块可以通过python代码来对word文档进行大批量的编辑。docx它提供了一组功能丰富的函数和方法,用于创建、修改和读取Word文档。下面是docx模块中一些常用的函数和方法的介绍:

安装:

pip install docx

一、准备一个word文档

文档内容大致如下

二、读取文档中的内容

1、读取段落内容

通过遍历 doc.paragraphs 来获取文档中的每个段落的文本内容

from docx import Document
path = 'test.docx'         #word文档路径
doc  = Document(path)   #创建一个文档对象
#遍历文档中的所有段落
for par in doc.paragraphs:
    text = par.text
    print(text)

输出的结果如下:

2、读取表格内容

from docx import Document
path = 'test.docx'         #word文档路径
doc  = Document(path)   #创建一个文档对象
# 遍历文档中的表格
for table in doc.tables:
    for row in table.rows:
        for cell in row.cells:
            text = cell.text
            print(text)

输出的结果如下:

三、修改

修改内容需要注意,需要配合document.save(file_path):将文档保存到指定的文件路径file_path。

1、修改文档内容

比如把文档中的   “所有的123”  替换成   “好好学习”

from docx import Document
path = 'test.docx'         #word文档路径
doc  = Document(path)   #创建一个文档对象
# 遍历文档中的所有段落
for par in doc.paragraphs:
    text = par.text
    if '123' in par.text:
        par.text = par.text.replace('123','好好学习!')
#凡是有保存功能的,需要先把原文档关闭才可以编辑
doc.save(path)  #注意这里如果使用的原文档的路径,则会直接对原文档的内容进行修改,
new_path = 'new_test.docx'    #创建一个新路径
doc.save(new_path)          #这里则会把内容保存到一个新文档中

输出结果:

因为我这里保存了两个路径: 

1、可以看到这里新生成了一个word文档

2、查看两个文档中的内容

原文档:

新生成文档:

总结:

1、思路:

先定位修改的内容——>然后赋值——>保存(没有修改的内容都会原样保存下来)

2、运行修改的功能时候需要把原文档关闭;

3、如果不生成新的文档则切记,修改内容不可逆!!! 

2、修改表格内容

把表格中的    “休息”  替换成  “预习”

这里可以多复制几张表格

按照上面的思路来:

1、先定位,找到修改目标的坐标

from docx import Document
path = 'test.docx'         #word文档路径
doc  = Document(path)   #创建一个文档对象
tables = doc.tables
#获取表格中所有内容对应的坐标
for i, row in enumerate(tables[0].rows):
    for j, cell in enumerate(row.cells):
        print( f'[+]{cell.text}    [+]对应的坐标是   ({i}, {j})\n')
 

输出结果:

这里注意(这里找坐标和我们平时看表的习惯不一样,他们并没有逻辑上的关系,而只是单纯的坐标来对应)

2、记住这个坐标我们后面就可以对所有的表进行修改:

注意下面代码中的  cell(2,1) 中的坐标就是上面我们找到的坐标,通过tables[tab]是逐一遍历出每一张表格,然后把对应的坐标文档替换为  '预习'.

from docx import Document
path = 'test.docx'         #word文档路径
doc  = Document(path)   #创建一个文档对象
tables = doc.tables         #这里已经把文档中的所有表格都取出来了,以列表的形式存储
#获取表格中所有内容对应的坐标
for tab in range(len(tables)):
        tables[tab].cell(2,1).text='预习'
# #凡是有保存功能的,需要先把原文档关闭才可以编辑
doc.save(path)  #注意这里如果使用的原文档的路径,则会直接对原文档的内容进行修改,

输出结果:

到此这篇关于Python使用docx模块编辑Word文档的文章就介绍到这了,更多相关Python docx编辑Word内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python字典删除键值对和元素的四种方法(小结)

    Python字典删除键值对和元素的四种方法(小结)

    删除列表或者字符串元素的方法不止一种,同样,删除字典元素的方法也不止一种,本文主要介绍python中删除字典元素的四种方法:1、使用del语句;2、使用clear();3、使用pop();4、使用popitem()。感兴趣的可以了解一下
    2021-12-12
  • Python利用哈希表缓存避免重复计算实现性能提速

    Python利用哈希表缓存避免重复计算实现性能提速

    这篇文章主要介绍了Python利用哈希表缓存避免重复计算实现性能提速,通过为输入图像生成内容哈希,并结合LRU内存管理策略,实现了对重复识别请求的高效拦截,需要的朋友可以参考下
    2026-02-02
  • python中os库的函数使用

    python中os库的函数使用

    这篇文章主要介绍了python中os库的使用,本篇文章记录下python中os库的一些函数使用,对python os库使用感兴趣的朋友跟随小编一起看看吧
    2022-10-10
  • 浅析Python __name__ 是什么

    浅析Python __name__ 是什么

    这篇文章主要介绍了Python __name__ 是什么,本文通过实例代码给大家介绍了Python __name__ 的作用,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-07-07
  • Python+OpenCV内置方法实现行人检测

    Python+OpenCV内置方法实现行人检测

    OpenCV附带一个预训练的HOG+线性SVM模型,可用于在图像和视频流中执行行人检测。本文我们将使用Opencv自带的模型实现对视频流中的行人检测。感兴趣的小伙伴可以跟随小编一起学习一下
    2021-12-12
  • Python爬虫之教你利用Scrapy爬取图片

    Python爬虫之教你利用Scrapy爬取图片

    这篇文章主要介绍了Python爬虫之教你利用Scrapy爬取图片,文中有非常详细的代码示例,对正在学习python的小伙伴们有非常好的帮助,需要的朋友可以参考下
    2021-04-04
  • Python第三方库Click快速使用详解

    Python第三方库Click快速使用详解

    这篇文章主要介绍了Python第三方库Click的相关资料,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友一起看看吧
    2024-12-12
  • Python爬取数据保存为Json格式的代码示例

    Python爬取数据保存为Json格式的代码示例

    今天小编就为大家分享一篇关于Python爬取数据保存为Json格式的代码示例,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-04-04
  • 使用Pandas处理时间序列数据Time Series详解

    使用Pandas处理时间序列数据Time Series详解

    SQLAlchemy是Python中最流行的ORM(对象关系映射)框架之一,它提供了高效且灵活的数据库操作方式,本文将介绍如何使用SQLAlchemy ORM进行数据库操作,有需要的可以了解下
    2025-11-11
  • 用python爬取分析淘宝商品信息详解技术篇

    用python爬取分析淘宝商品信息详解技术篇

    这篇文章主要介绍了用python爬取分析淘宝商品信息的技术,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-08-08

最新评论