Python读取Word文档中的Excel嵌入文件的方法详解

 更新时间:2022年12月14日 08:47:07   作者:小小明-代码实体  
这篇文章主要为大家详细介绍了Python读取Word文档中的Excel嵌入文件的方法,文中的示例代码讲解详细,具有一定的借鉴价值,需要的可以参考一下

今天群友提出一个问题:

给出Word示例如下:

对于这种嵌入文件在Word中都属于ole文件。

下面我们假设需要读取每个嵌入的Excel文件中的python工作表中的A1单元格。

python调用宏实现

首先我们看看如何调用com接口的宏代码实现这个效果,最终完整代码如下:

from win32com import client as win32
import os

word = win32.Dispatch("Word.Application")
word.Visible = True
wdDoc = word.Documents.Open(os.path.abspath("test.docx"))
try:
    for shape in wdDoc.InlineShapes:
        if shape.Type != 1 or not shape.OLEFormat.ProgID.startswith("Excel.Sheet"):
            # 要求形状类型为wdInlineShapeEmbeddedOLEObject,是Excel类型的OLE对象
            continue
        shape.OLEFormat.Open()
        xlApp = win32.GetActiveObject('Excel.Application')
        book = xlApp.Workbooks(1)
        print([sht.Name for sht in book.Sheets])
        print(book.Sheets("python").Range("A1").Value)
        book.Close()
finally:
    wdDoc.Close()
    xlApp.Quit()
    word.Quit()

执行结果:

['java', 'forever', 'python']
python
['java', 'forever', 'python']
python hello world
['java', 'forever', 'python']
python

注意:此方法仅支持在已安装办公软件(office或WPS)的windows环境下使用。

python解析ole文件实现

我通过压缩软件看到三个Excel文件其实是以ole的bin文件形式存储:

我们也只需要理解并解析这些文件就可以得到对应的Excel文件,然后直接使用openpyxl或pandas解析。

HY.Li大佬提供了对应的代码:

思路与我的想法不谋而合,不过我不知道用olefile这个现成的库可以解析这些文件,原本还打算自己实现一下。

参考上面的代码,最终我的实现如下:

import olefile
from zipfile import ZipFile
from openpyxl import load_workbook

filename = "test.docx"
with ZipFile(filename, "r") as zip_file:
    for name in zip_file.namelist():
        if not name.startswith("word/embeddings/"):
            continue
        with zip_file.open(name) as f:
            if not olefile.isOleFile(f):
                continue
            ole = olefile.OleFileIO(f)
            try:
                book = load_workbook(ole.openstream("package"))
                print(book.sheetnames)
                print(book["python"]["A1"].value)
            except Exception as e:
                print(name, "当前ole对象不是Excel文件:", e)

结果:

['java', 'forever', 'python']
python
['java', 'forever', 'python']
python hello world
['java', 'forever', 'python']
python

相对来说,此方法跨平台,速度快。

到此这篇关于Python读取Word文档中的Excel嵌入文件的方法详解的文章就介绍到这了,更多相关Python读取Word中的Excel嵌入文件内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Caffe数据可视化环境python接口配置教程示例

    Caffe数据可视化环境python接口配置教程示例

    这篇文章主要为大家介绍了Caffe数据可视化环境python接口配置教程示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-06-06
  • 查看Python安装路径几种方法小结

    查看Python安装路径几种方法小结

    这篇文章主要介绍了查看Python安装路径几种方法小结,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-11-11
  • python安装包出现Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))问题解决

    python安装包出现Retrying (Retry(total=4, connect=None, read=No

    这篇文章主要给大家介绍了关于python安装包出现Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))问题的解决方法,需要的朋友可以参考下
    2022-09-09
  • 浅谈Python中re.match()和re.search()的使用及区别

    浅谈Python中re.match()和re.search()的使用及区别

    这篇文章主要介绍了浅谈Python中re.match()和re.search()的使用及区别,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • Python异常模块traceback用法实例分析

    Python异常模块traceback用法实例分析

    这篇文章主要介绍了Python异常模块traceback用法,结合实例形式分析了Python异常模块traceback的基本功能、使用方法及相关操作注意事项,需要的朋友可以参考下
    2019-10-10
  • 哪种Python框架适合你?简单介绍几种主流Python框架

    哪种Python框架适合你?简单介绍几种主流Python框架

    这篇文章主要介绍了几种主流的Python框架,帮助大家更好的理解和学习Python,感兴趣的朋友可以了解下
    2020-08-08
  • python matplotlib绘图详解大全(非常详细!)

    python matplotlib绘图详解大全(非常详细!)

    这篇文章主要给大家介绍了关于python matplotlib绘图详解的相关资料,matplotlib是python中用于绘制各种图像的模块,功能十分强大,通常与pandas模块搭配使用,可以生成各种样视的图片,用于数据的分析和展示,需要的朋友可以参考下
    2023-09-09
  • Python 设计模式创建型单例模式

    Python 设计模式创建型单例模式

    这篇文章主要介绍了Python 设计模式创建型单例模式,即Singleton,单例是一种设计模式,应用该模式的类只会生成一个实例,下文详细介绍需要的小伙伴可以参考一下
    2022-02-02
  • python字典排序实例详解

    python字典排序实例详解

    这篇文章主要介绍了python字典排序实现方法,实例分析了Python字典排序的相关技巧,需要的朋友可以参考下
    2015-05-05
  • python绘制无向图度分布曲线示例

    python绘制无向图度分布曲线示例

    今天小编就为大家分享一篇python绘制无向图度分布曲线示例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-11-11

最新评论