Python实现将Sheet页拆分成单独的Excel文件

 更新时间:2025年02月27日 10:05:12   作者:游客520  
这篇文章主要为大家详细介绍了如何使用 Python 将一个 Excel 文件中的每个工作表(Sheet)保存成单独的 Excel 文件,有需要的小伙伴可以了解下

在日常的数据处理工作中,很多时候我们会遇到一个包含多个工作表(Sheet)的 Excel 文件,可能需要将每个工作表分别保存为独立的 Excel 文件。手动进行这种操作非常繁琐且易出错,但借助 Python 中的 pandas 库,我们可以非常方便地自动化这个过程。

在这篇博文中,我们将介绍如何使用 Python 将一个 Excel 文件中的每个工作表(Sheet)保存成单独的 Excel 文件。

1. 使用 pandas 库进行操作

除了 openpyxl,pandas 库也可以用来处理 Excel 文件。pandas 提供了非常简便的读取和写入 Excel 文件的方法,特别适合需要处理大量数据的场景。

安装 pandas 和 openpyxl

pandas 需要依赖 openpyxl 来处理 .xlsx 格式的文件。如果没有安装,可以通过以下命令一起安装:

pip install pandas openpyxl

代码实现

使用 pandas 来实现将 Excel 文件中的每个工作表保存为单独的文件的代码如下:

import pandas as pd
 
def split_excel_sheet(input_file):
    # 读取 Excel 文件中的所有工作表
    xls = pd.ExcelFile(input_file)
 
    # 遍历每个工作表
    for sheet_name in xls.sheet_names:
        # 读取每个工作表的数据
        df = pd.read_excel(xls, sheet_name)
 
        # 保存每个工作表为单独的 Excel 文件
        new_file = f"{sheet_name}.xlsx"
        df.to_excel(new_file, index=False)
        print(f"工作表 '{sheet_name}' 已保存为 {new_file}")
 
# 使用示例
input_file = '/path/to/example.xlsx'  # 需要分割的 Excel 文件
split_excel_sheet(input_file)

代码解析

读取 Excel 文件:通过 pd.ExcelFile(input_file) 读取整个 Excel 文件。

遍历工作表:通过 xls.sheet_names 获取文件中的所有工作表名称,并遍历每个工作表。

读取工作表数据:使用 pd.read_excel() 读取每个工作表的数据,并将其转换为 DataFrame 格式。

保存为单独的 Excel 文件:通过 df.to_excel() 将每个工作表的数据保存为单独的 Excel 文件,index=False 参数用于不保存行索引。

输出示例

和 openpyxl 实现类似,运行上面的代码后,程序会输出每个工作表被保存为单独 Excel 文件的消息。例如:

工作表 'Sheet1' 已保存为 Sheet1.xlsx

工作表 'Sheet2' 已保存为 Sheet2.xlsx

2. 总结

通过 Python 的 openpyxl 和 pandas 库,我们可以轻松地将一个 Excel 文件中的每个工作表保存为单独的 Excel 文件。pandas:适用于数据分析和处理,操作简便,尤其在处理数据量较大的 Excel 文件时非常高效。

3.知识拓展

下面小编为大家整理了其他Python中Excel的相关操作,例如合并多个excel,感兴趣的可以了解下

自动化办公之合并多个excel

我们将利用 pandas 和 openpyxl 库来完成这一任务。pandas 适用于数据的读取和处理,而 openpyxl 适用于操作 Excel 文件。

安装所需库

首先,确保你已安装了以下 Python 库:

pip install pandas openpyxl

示例代码

假设你有多个 Excel 文件,文件结构如下:

file1.xlsx
file2.xlsx
file3.xlsx

每个文件中都有一个工作表,包含相同结构的数据(列名相同)。

1. 导入库

import pandas as pd 
import os

2. 读取多个 Excel 文件并合并

我们使用 os 模块来遍历指定目录下的所有 Excel 文件,并通过 pandas 读取数据。将每个文件的数据合并到一个大的 DataFrame 中。

def merge_excel_files(input_folder, output_file):
    # 获取文件夹中的所有 Excel 文件
    all_files = [f for f in os.listdir(input_folder) if f.endswith('.xlsx')]
    
    # 初始化一个空的 DataFrame 用于存储合并后的数据
    combined_df = pd.DataFrame()
    
    # 遍历所有文件,逐个读取并合并
    for file in all_files:
        file_path = os.path.join(input_folder, file)
        print(f"正在处理文件: {file_path}")
        
        # 读取 Excel 文件
        df = pd.read_excel(file_path)
        
        # 合并数据
        combined_df = pd.concat([combined_df, df], ignore_index=True)
    
    # 将合并后的数据保存到新的 Excel 文件
    combined_df.to_excel(output_file, index=False)
    print(f"合并完成,结果已保存到: {output_file}")

3.调用函数并运行

调用上面的 merge_excel_files 函数,并传入文件夹路径和输出文件路径:

# 指定输入文件夹路径和输出文件路径
input_folder = 'path_to_your_excel_files'  # 替换为你的文件夹路径
output_file = 'merged_output.xlsx'         # 输出文件路径
 
# 调用合并函数
merge_excel_files(input_folder, output_file)

代码说明

获取文件列表:通过 os.listdir 获取指定目录下的所有 .xlsx 文件。

读取和合并数据:利用 pandas.read_excel 读取每个 Excel 文件的数据,并使用 pandas.concat 方法将数据合并到一个大的 DataFrame 中。ignore_index=True 确保合并后的数据不会重复索引。

保存合并结果:最后,将合并后的数据保存到一个新的 Excel 文件中,使用 to_excel 方法。

执行结果

执行上述代码后,你会看到如下输出:

正在处理文件: path_to_your_excel_files/file1.xlsx
正在处理文件: path_to_your_excel_files/file2.xlsx
正在处理文件: path_to_your_excel_files/file3.xlsx
合并完成,结果已保存到: merged_output.xlsx

合并后的数据将被保存到 merged_output.xlsx 文件中。

到此这篇关于Python实现将Sheet页拆分成单独的Excel文件的文章就介绍到这了,更多相关Python Sheet页拆分成单独Excel内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 一文带你学会Python Flask框架设置响应头

    一文带你学会Python Flask框架设置响应头

    本篇博客我们将带大家全面了解Python中Flask框架关于请求的相关设置的相关知识,文中的示例代码讲解详细,对我们学习Python有一定帮助,需要的可以参考一下
    2023-01-01
  • 在python环境下运用kafka对数据进行实时传输的方法

    在python环境下运用kafka对数据进行实时传输的方法

    今天小编就为大家分享一篇在python环境下运用kafka对数据进行实时传输的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • 安装ElasticSearch搜索工具并配置Python驱动的方法

    安装ElasticSearch搜索工具并配置Python驱动的方法

    这篇文章主要介绍了安装ElasticSearch搜索工具并配置Python驱动的方法,文中还介绍了其与Kibana数据显示客户端的配合使用,需要的朋友可以参考下
    2015-12-12
  • Python开源自动化工具Playwright安装及介绍使用

    Python开源自动化工具Playwright安装及介绍使用

    playwright-python是一个强大的Python库,仅用一个API即可自动执行Chromium、Firefox、WebKit等主流浏览器自动化操作,本文就详细的介绍一下如何使用,感兴趣的可以了解一下
    2021-12-12
  • Python如何避免文件同名产生覆盖

    Python如何避免文件同名产生覆盖

    这篇文章主要介绍了Python如何避免文件同名产生覆盖,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-06-06
  • Python3.7 + Yolo3实现识别语音播报功能

    Python3.7 + Yolo3实现识别语音播报功能

    这篇文章主要介绍了Python3.7 + Yolo3识别语音播报功能,开始之前我们先得解析出来Yolo3的代码,从而获取到被识别出来的物体标签,具体详细过程跟随小编一起看看吧
    2021-12-12
  • python中的属性管理机制详解

    python中的属性管理机制详解

    这篇文章主要介绍了python中的属性管理机制,主要包括私有属性和属性限制-__slots__方法,文中详细介绍了python中如何去声明变量的相关知识,需要的朋友可以参考下
    2022-06-06
  • Python爬虫获取图片并下载保存至本地的实例

    Python爬虫获取图片并下载保存至本地的实例

    今天小编就为大家分享一篇Python爬虫获取图片并下载保存至本地的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06
  • Python中JSON数据的相互转化详解

    Python中JSON数据的相互转化详解

    这篇文章主要介绍了Python中JSON数据的相互转化详解,JSON 是一种轻量级的数据交互格式,可以按照 JSON 指定的格式去组织和封装数据,
    JSON 本质是一个带有特定格式的字符串,需要的朋友可以参考下
    2023-12-12
  • Python GUI编程 文本弹窗的实例

    Python GUI编程 文本弹窗的实例

    今天小编就为大家分享一篇Python GUI编程 文本弹窗的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-06-06

最新评论