Python实现将Word表格嵌入到Excel中

 更新时间:2021年12月10日 11:20:49   作者:酸菜鱼编程  
把Word中的表格转到Excel中,顺便做一个调整。这个需求在实际工作中,很多人还是经常碰到的!本文就将介绍如何利用Python实现这一功能,需要的朋友可以了解一下

今日需求

其实就是把Word中的表格转到Excel中,顺便做一个调整。这个需求在实际工作中,很多人还是经常碰到的!

如果单单是两个表格,那只要简单的复制黏贴即可,但如果上百了呢?那就得考虑自动化了。好在今天碰到的需求中的原文件格式是比较有规律的,那直接来尝试一下。

# 首先要pip install python-docx
# 如果原文件是doc格式,那就先转成docx
from docx import Document
import pandas as pd
 
path = "./word表格转excel.docx"
docx = Document(path)
table_s = docx.tables  # 返回一个Table对象的列表
 
len(table_s) --> 2 # 返回值是2,因为原文件中只有两个表格
 
list_ = []  # 初始化一个空列表,用来装后面的dict_
 
for table in table_s:  # 循环所有的表格列表
    dict_ = {}
    dict_['名称'] = table.cell(0, 1).text  # 表格的索引是从(0行,0列)开始
    dict_['身份'] = table.cell(0, 3).text
    dict_['简介'] = table.cell(1, 1).text
    for i in range(3, len(table.rows)):  # 后续的内容格式不固定,所以循环获取
        dict_[table.cell(i, 0).text] = table.cell(i, 1).text
    list_.append(dict_)

当完成上述操作后,list_就会是一个字典列表。

接下来,将列表转为DataFrame进行操作即可。

df = pd.DataFrame(list_)
 
# 先将前三列作为索引,然后逆透视其他列,其实这就是个一维表转二维表的过程
df = df.set_index(['名称', '身份', '简介']).stack(level=0).to_frame()
 
# 重新设置一下行列索引的名字
df.index.names = ['名称', '身份', '简介', '物质']
df.columns = ['现状']

此时的df就跟需求结果相差不大了。

最后将DataFrame导出,稍作美化即可完成需求。

# 导出的时候一定要设置index=True不然只会保留一列Series
df.to_excel("data3.xlsx", index=True, merge_cells=True)

完整代码 

# 首先要pip install python-docx
# 如果原文件是doc格式,那就先转成docx
from docx import Document
import pandas as pd
 
path = "./word表格转excel.docx"
docx = Document(path)
table_s = docx.tables  # 返回一个Table对象的列表
 
list_ = []  # 初始化一个空列表,用来装后面的dict_
 
for table in table_s:  # 循环所有的表格列表
    dict_ = {}
    dict_['名称'] = table.cell(0, 1).text  # 表格的索引是从(0行,0列)开始的
    dict_['身份'] = table.cell(0, 3).text
    dict_['简介'] = table.cell(1, 1).text
    for i in range(3, len(table.rows)):  # 循环获得后面的内容
        dict_[table.cell(i, 0).text] = table.cell(i, 1).text
    list_.append(dict_)
 
df = pd.DataFrame(list_)
 
# 先将前三列作为索引,然后逆透视其他列,就是个一维表转二维表的过程
df = df.set_index(['名称', '身份', '简介']).stack(level=0).to_frame()
 
# 重新设置一下行列索引的名字
df.index.names = ['名称', '身份', '简介', '物质']
df.columns = ['现状']
 
# 导出的时候一定要设置index=True不然只会保留一列Series
df.to_excel("data3.xlsx", index=True, merge_cells=True)

到此这篇关于Python实现将Word表格嵌入到Excel中的文章就介绍到这了,更多相关Python Word表格嵌入Excel内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Keras Convolution1D与Convolution2D区别说明

    Keras Convolution1D与Convolution2D区别说明

    这篇文章主要介绍了Keras Convolution1D与Convolution2D区别说明,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-05-05
  • python实现DES加密解密方法实例详解

    python实现DES加密解密方法实例详解

    这篇文章主要介绍了python实现DES加密解密方法,以实例形式较为详细的分析了基于Python实现的DES加密与解密技巧,需要的朋友可以参考下
    2015-06-06
  • Python中request库的各种用法详细解析

    Python中request库的各种用法详细解析

    本文详细介绍了Python的requests库的安装与使用,包括HTTP请求方法、请求头、请求体的基本概念,以及发送GET和POST请求的基本用法,同时,探讨了会话对象、处理重定向、超时设置、代理支持等高级功能,帮助读者更高效地处理复杂的HTTP请求场景,需要的朋友可以参考下
    2024-10-10
  • python 数字转换为日期的三种实现方法

    python 数字转换为日期的三种实现方法

    在Python中,我们经常需要处理日期和时间,本文主要介绍了python 数字转换为日期的三种实现方法,包含datetime模块,strftime方法及pandas库,具有一定的参考价值,感兴趣的可以了解一下
    2024-02-02
  • Python matplotlib如何绘制各种流线图

    Python matplotlib如何绘制各种流线图

    在Python中不仅可以绘制折线图、柱状图、散点图等常规图外,还支持绘制量场图、频谱图、提琴图、箱型图等特殊图。本文将主要介绍如何绘制流线图,需要的朋友可以参考一下
    2021-12-12
  • PIL包中Image模块的convert()函数的具体使用

    PIL包中Image模块的convert()函数的具体使用

    这篇文章主要介绍了PIL包中Image模块的convert()函数的具体使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-02-02
  • 在Python程序中操作文件之flush()方法的使用教程

    在Python程序中操作文件之flush()方法的使用教程

    这篇文章主要介绍了在Python程序中操作文件之flush()方法的使用教程,是Python入门学习中的基础知识,需要的朋友可以参考下
    2015-05-05
  • 完美解决python中ndarray 默认用科学计数法显示的问题

    完美解决python中ndarray 默认用科学计数法显示的问题

    今天小编就为大家分享一篇完美解决python中ndarray 默认用科学计数法显示的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-07-07
  • Python实现动态生成系统数据库设计到Word文档

    Python实现动态生成系统数据库设计到Word文档

    这篇文章主要为大家详细介绍了如何利用Python实现填写相关数据库信息后,生成系统数据库设计到word文档,文中示例代码讲解详细,感兴趣的小伙伴可以了解一下
    2023-06-06
  • python基础之匿名函数介绍

    python基础之匿名函数介绍

    大家好,本篇文章主要讲的是python基础之匿名函数介绍,感兴趣的同学赶快来看一看,对你有帮助的话记得收藏一下,方便下次浏览
    2021-12-12

最新评论