Python实现将HTML表格一键导出为Excel(xlsx)的实战指南

 更新时间:2026年01月21日 08:21:51   作者:weixin_46244623  
在数据采集、网页解析或自动化报表场景中,我们经常会遇到需要将HTML 页面中提取的表格数据导出为Excel文件,下面我们就来看看如何使用Python实现这一功能吧

在数据采集、网页解析或自动化报表场景中,我们经常会遇到这样一个需求:

从 HTML 页面中提取表格数据,并导出为 Excel 文件

本文将使用 BeautifulSoup + Pandas + OpenPyXL,实现一个通用、简单、可复用的工具函数,把 HTML 中的 <table> 表格直接导出为 .xlsx 文件。

一、实现思路

整体流程非常清晰:

  • 使用 BeautifulSoup 解析 HTML
  • 查找页面中所有 <table> 标签
  • 使用 pandas.read_html 将表格转为 DataFrame
  • 使用 ExcelWriter 将多个表格写入 Excel 的不同 Sheet

二、环境准备

安装依赖

pip install beautifulsoup4 pandas openpyxl lxml

lxmlpandas.read_html 推荐的解析器,性能更好。

三、核心代码实现

HTML 表格导出函数

from bs4 import BeautifulSoup
import pandas as pd


def html_table_to_xlsx(html_content, output_file):
    """
    将 HTML 中的表格提取并导出为 xlsx 文件。

    :param html_content: HTML 文本内容
    :param output_file: 导出的 xlsx 文件路径
    """
    # 使用 BeautifulSoup 解析 HTML
    soup = BeautifulSoup(html_content, 'html.parser')

    # 查找 HTML 中的所有表格
    tables = soup.find_all('table')
    if not tables:
        print("HTML 中没有找到表格!")
        return

    # 逐个解析表格并导出到 Excel
    with pd.ExcelWriter(output_file, engine='openpyxl') as writer:
        for i, table in enumerate(tables):
            # 将 HTML table 转为 DataFrame
            df = pd.read_html(str(table))[0]

            # 不同表格写入不同的 sheet
            sheet_name = f"Sheet{i + 1}"
            df.to_excel(writer, index=False, sheet_name=sheet_name)

    print(f"表格已成功导出到 {output_file}")

四、示例演示

示例 HTML 内容

html_content = """
<html>
<head><title>测试表格</title></head>
<body>
    <table border="1">
        <tr>
            <th>姓名</th>
            <th>年龄</th>
            <th>城市</th>
        </tr>
        <tr>
            <td>张三</td>
            <td>28</td>
            <td>北京</td>
        </tr>
        <tr>
            <td>李四</td>
            <td>34</td>
            <td>上海</td>
        </tr>
    </table>
</body>
</html>
"""

调用函数导出 Excel

html_table_to_xlsx(html_content, "output.xlsx")

执行后,会在当前目录生成一个 output.xlsx 文件,内容如下:

姓名年龄城市
张三28北京
李四34上海

到此这篇关于Python实现将HTML表格一键导出为Excel(xlsx)的实战指南的文章就介绍到这了,更多相关Python HTML表格导出为Excel内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 树莓派使用USB摄像头和motion实现监控

    树莓派使用USB摄像头和motion实现监控

    这篇文章主要为大家详细介绍了树莓派使用USB摄像头和motion实现监控,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-06-06
  • python并行设计的实现

    python并行设计的实现

    python中的并行设计可以显著增强程序处理大量数据或复杂计算的速度,通过使用threading、multiprocessing和concurrent.futures等库,开发者可以有效利用多核CPU的计算力,下面就来详细的介绍一下
    2024-09-09
  • pyspark操作MongoDB的方法步骤

    pyspark操作MongoDB的方法步骤

    这篇文章主要介绍了pyspark操作MongoDB的方法步骤,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-01-01
  • Python爬虫包BeautifulSoup异常处理(二)

    Python爬虫包BeautifulSoup异常处理(二)

    这篇文章主要为大家详细介绍了Python爬虫包BeautifulSoup的异常处理,具有一定的参考价值,感兴趣的朋友可以参考一下
    2018-06-06
  • 使用pycharm进行绘图,图片无法显示的解决

    使用pycharm进行绘图,图片无法显示的解决

    这篇文章主要介绍了使用pycharm进行绘图,图片无法显示的解决方案,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-07-07
  • 基于Python实现文件分类器的示例代码

    基于Python实现文件分类器的示例代码

    这篇文章主要为大家详细介绍了如何基于Python实现文件分类器,目的主要是为了将办公过程中产生的各种格式的文件完成整理,感兴趣的可以了解一下
    2023-04-04
  • 浅谈关于Python3中venv虚拟环境

    浅谈关于Python3中venv虚拟环境

    这篇文章主要介绍了浅谈关于Python3中venv虚拟环境,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-08-08
  • Python实现跨平台表格数据分页打印预览处理详解

    Python实现跨平台表格数据分页打印预览处理详解

    这篇文章主要为大家详细介绍了如何使用PySide6/PyQt6实现Python跨平台表格数据分页打印预览处理,感兴趣的小伙伴可以跟随小编一起学习一下
    2025-03-03
  • Python使用Streamlit快速创建仪表盘

    Python使用Streamlit快速创建仪表盘

    这篇文章主要为大家详细介绍了Python如何使用Streamlit快速创建一个简单的仪表盘,文中的示例代码简洁易懂,快跟随小编一起来学习一下吧
    2023-09-09
  • Python中使用socks5设置全局代理的方法示例

    Python中使用socks5设置全局代理的方法示例

    这篇文章主要介绍了Python中使用socks5设置全局代理的方法示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-04-04

最新评论