使用Python实现一键往Word文档的表格中填写数据

 更新时间:2023年12月13日 11:12:05   作者:艾派森  
在工作中,我们经常遇到将Excel表中的部分信息填写到Word文档的对应表格中,以生成报告,方便打印,所以本文小编就给大家介绍了如何使用Python实现一键往Word文档的表格中填写数据,文中有详细的代码示例供大家参考,需要的朋友可以参考下

一、Python处理Word

  • Python处理Word的好处

使用Python处理Word文档具有许多优势,以下是一些主要的好处:

  1. 自动化和批量处理: Python可以帮助你自动化处理大量的Word文档,例如批量替换文本、生成报告、提取数据等。这样可以节省大量的时间和劳动力。

  2. 数据提取和转换: 如果你需要从大量的Word文档中提取特定数据,Python可以轻松实现这一点。你可以编写脚本来搜索并提取你需要的信息,然后将其转换为其他格式,如CSV、Excel或数据库。

  3. 定制化和自由度: 使用Python处理Word文档意味着你可以根据自己的需求定制处理过程。你可以创建定制的模板、样式和布局,以及根据项目需求进行灵活的调整。

  4. 与其他工具和技术的集成: Python可以与许多其他库和技术进行集成,例如数据库、Web服务、数据分析工具等。这使得你可以将Word文档的处理与其他工作流程结合起来,实现更复杂的任务。

  5. 文档生成和报告: 如果你需要定期生成报告或文档,Python可以通过自动生成文本、图表和表格等来实现。这对于数据分析、项目管理和业务报告等非常有用。

  6. 版本控制和代码重用: 使用Python代码处理Word文档可以实现代码重用和版本控制。你可以将处理文档的代码存储在版本控制系统中,以便团队成员协作、维护和共享代码。

  7. 跨平台性: 大多数Python库可以在多个操作系统上运行,因此你可以在Windows、Linux和macOS等不同平台上处理Word文档。

  • Python处理Word的第三方库

在Python中,有几个第三方库可以用于处理Word文档。以下是一些常用的第三方库:

  1. python-docx: 这是一个用于创建和修改Microsoft Word文档(.docx格式)的流行库。它允许你读取、编辑和创建Word文档,包括段落、表格、图像等。

  2. pywin32(仅限Windows): 这个库允许你在Windows上与Microsoft Office应用程序进行交互,包括Word。它可以用于自动化操作,例如创建、打开、编辑和保存文档。

  3. docx2txt: 这个库可以用来将.docx文件转换为纯文本(.txt格式)。它适用于从Word文档中提取文本内容。

  4. python-docx-template: 这个库扩展了python-docx库,使你能够在模板中插入变量和循环,并以更动态的方式生成Word文档。

  5. py-docx: 这是另一个用于处理.docx文件的库。它提供了类似python-docx的功能,但使用不同的接口。

二、一键往Word文档的表格中填写数据

技术工具:

Python版本:3.9

代码编辑器:jupyter notebook

在工作中,我们经常遇到将Excel表中的部分信息填写到Word文档的对应表格中,以生成报告,方便打印。今天我们就来试试如何往固定的Word模板中填写数据。此例要求将Excel档的“收货数据”填写到Word档的“收货记录”中去,并加总收货数量。模板是下面这样的。

要求结果是这样的:

首先,需要从Excel表格中提取数据。

#从Excel表中提取数据
from openpyxl import load_workbook
wb = load_workbook("收货数据.xlsx")
ws = wb.active
data=[]
for row in range(2,ws.max_row+1):
    seq = ws["A"+str(row)].value
    supplier = ws["B"+str(row)].value
    material_pn = ws["C"+str(row)].value
    material_model = ws["D"+str(row)].value
    desp = ws["E"+str(row)].value
    qty = ws["F"+str(row)].value
    date = ws["G"+str(row)].value.date()
    info = [seq, supplier, material_pn, material_model, desp, qty, date]
    data.append(info)
# 检查一下数据
data[0]

由于需要将数量列的数据加总,所以先定义一个加总函数,以便后面调用。

#定义数量加总函数
def Sum_list(list):
    s = 0
    for i in list: #累加列表中的所有数
        s+=i
    return s
# 加总数量列的所有数字
qty_list=[]
for i in data:
    qty_list.append(i[5]) #数量在内层列表的第6个位置,索引是5
sum_qty= Sum_list(qty_list) #调用加总函数加总
sum_qty

定义单元格合并函数 

#定义合并单元格的函数    
def Merge_cells(table,target_list,start_row,col):
    '''
    table: 是需要操作的表格
    target_list: 是目标列表,即含有重复数据的列表
    start_row: 是开始行,即表格中开始比对数据的行(需要将标题除开)
    col: 是需要处理数据的列
    '''
    start = 0 #开始行计数
    end = 0 #结束行计数
    reference = target_list[0] #设定基准,以列表中的第一个字符串开始
    for i in range(len(target_list)): #遍历列表
        if target_list[i] != reference: #开始比对,如果内容不同执行如下
            reference = target_list[i] #基准变成列表中下一个字符串
            end = i - 1 
            table.cell(start+start_row,col).merge(table.cell(end+start_row,col))
            start = end + 1
        if i == len(target_list) - 1: #遍历到最后一行,按如下操作
            end = i
            table.cell(start+start_row,col).merge(table.cell(end+start_row,col))

然后往word的表格中写入数据,并合并单元格。

#数据提取即处理完毕后,就可以往Word的表格中写入数据了
from docx import Document
doc = Document("收货记录模板.docx")
#读取word文档中的第一个表格的第二和第三列除标题和尾部总数行的数据
table = doc.tables[0] #已确定是第一个表格,其索引是0
supplier = [] #存储供应商名称
pn = [] #存储物料编码
for i in data:
    supplier.append(i[1])
    pn.append(i[2])
#按需增加行,以便填写数据
for i in range(len(supplier)): #模板中已经有一行了,所以总共只需增加len(supplier)行
    table.add_row() 
#增加好行后先做合并单元格操作
Merge_cells(table,supplier,1,1) #开始合并行为2,索引为1;供应商名称是在2列,索引为1
Merge_cells(table,pn,1,2) #开始合并行为2,索引为1;物料编码是在3列,索引为2
 
#写入数据到表格
for row in range(1,len(supplier)+1):
    for col in range(7):        
        table.cell(row,col).text = str(data[row-1][col])
 
max_row = len(table.rows) #获取最大一行
qty_row = max_row-1 #确定需要写入加总数据的一行
table.cell(qty_row,5).merge(table.cell(qty_row,5)) #合并右下角用于填写数量的两个单元格
table.cell(qty_row,4).text = '总数:'
table.cell(qty_row,5).text = str(sum_qty)
 
doc.save("收货记录.docx")

由于合并供应商名称和物料编码两列中的相同内容的单元格,所有需要把这两列的信息从总数据`data`中单独提取出来。新建了`supplier`和`pn`两个空列表,然后遍历`data`,将数据取出并存入空列表。随后,我们根据实际需要,新增一些空白行,以便后面写入数据。新增行的数量以`supplier`列表中元素的个数为依据。这个表格已经存在一个空白行,算上外行要填“总数”,只需增加`supplier`列表中元素的个数对应那么多行就够了。当然这里也可以以列表`pn`中元素个数为依据,两者是相等的。增加好行后,先调用函数`Merge_cells`做合并单元格操作(如果先写入数据,再合并,会导致单元格内容重复)。合并完后,就可以写入数据到表格了,此处遍历需要写入数据的行和列,然后从`data`中提取数据。数据行写完后,还需要写入最后一行的“总数”字样和总的物料数量。最后保存数据,得到如下结果:

以上就是使用Python实现一键往Word文档的表格中填写数据的详细内容,更多关于Python一键往Word填数据的资料请关注脚本之家其它相关文章!

相关文章

  • Python超简单容易上手的画图工具库推荐

    Python超简单容易上手的画图工具库推荐

    今天小编给大家分享一款很棒的python画图工具库,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧
    2021-05-05
  • Python使用pip安装Matplotlib的方法详解

    Python使用pip安装Matplotlib的方法详解

    在网上看见许多matplotlib的安装教程都是比较复杂,需要配置许多环境,对于电脑基础不好的人来说可是一件头疼的事情,今天我介绍一个简单的安装方法,下面这篇文章主要给大家介绍了关于Python使用pip安装Matplotlib的相关资料,需要的朋友可以参考下
    2022-07-07
  • Python3学习笔记之列表方法示例详解

    Python3学习笔记之列表方法示例详解

    Python3 列表 序列是Python中最基本的数据结构,下面这篇文章主要给大家介绍了关于Python3学习笔记之列表方法的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下。
    2017-10-10
  • Python实现监控一个程序的运行情况

    Python实现监控一个程序的运行情况

    这篇文章主要为大家介绍了Python如何实现监控一个程序的运行情况,然后视情况将进程杀死并重启,文中的示例代码简洁易懂,需要的可以参考一下
    2023-05-05
  • python进阶TensorFlow神经网络拟合线性及非线性函数

    python进阶TensorFlow神经网络拟合线性及非线性函数

    这篇文章是python进阶学习主要介绍了TensorFlow神经网络拟合线性及非线性函数原理及示例解析,有需要的朋友可以借鉴参考下,希望能够有所帮助
    2021-10-10
  • python 实现提取log文件中的关键句子,并进行统计分析

    python 实现提取log文件中的关键句子,并进行统计分析

    今天小编就为大家分享一篇python 实现提取log文件中的关键句子,并进行统计分析,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • python3将变量写入SQL语句的实现方式

    python3将变量写入SQL语句的实现方式

    这篇文章主要介绍了python3将变量写入SQL语句的实现方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • python的pyecharts绘制各种图表详细(附代码)

    python的pyecharts绘制各种图表详细(附代码)

    这篇文章主要介绍了python的pyecharts绘制各种图表详细(附代码),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-11-11
  • Python实现简单猜数字游戏

    Python实现简单猜数字游戏

    这篇文章主要为大家详细介绍了Python实现猜数字游戏,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-02-02
  • 一文教会你用nginx+uwsgi部署自己的django项目

    一文教会你用nginx+uwsgi部署自己的django项目

    uWSGI是一个Web服务器,它实现了WSGI协议、uwsgi、http等协议,下面这篇文章主要给大家介绍了关于用nginx+uwsgi部署自己的django项目的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下
    2022-08-08

最新评论