Python实现批量提取Excel数据

 更新时间:2024年12月17日 15:33:42   作者:Sitin涛哥  
在数据处理和分析的过程中,Excel 是一种广泛使用的数据存储格式,本文将详细介绍如何使用 pandas、openpyxl 和 xlrd 三种库来批量提取 Excel 数据,并提供相应的示例代码,需要的可以参考下

在数据处理和分析的过程中,Excel 是一种广泛使用的数据存储格式。使用 Python 可以高效地从多个 Excel 文件中提取数据,进行汇总和分析。本文将详细介绍如何使用 pandas、openpyxl 和 xlrd 三种库来批量提取 Excel 数据,并提供相应的示例代码。

使用 pandas 批量提取 Excel 数据

pandas 是一个强大的数据分析库,它提供了直接读取和处理 Excel 文件的功能。

1. 安装 pandas

首先,确保已安装 pandas 和 openpyxl:

pip install pandas openpyxl

2. 读取单个 Excel 文件

import pandas as pd

# 读取 Excel 文件
df = pd.read_excel('data.xlsx')

# 显示前几行数据
print(df.head())

3. 批量读取多个 Excel 文件

假设有多个 Excel 文件存放在一个文件夹中,文件名格式为 data_1.xlsx, data_2.xlsx,以此类推。

import os

# 存放 Excel 文件的文件夹路径
folder_path = 'path_to_folder'

# 获取所有 Excel 文件路径
file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]

# 初始化一个空的 DataFrame
all_data = pd.DataFrame()

# 逐个读取并合并
for file in file_list:
    df = pd.read_excel(file)
    all_data = all_data.append(df, ignore_index=True)

# 显示合并后的数据
print(all_data.head())

使用 openpyxl 批量提取 Excel 数据

openpyxl 是一个专门处理 Excel 文件的库,适用于处理 .xlsx 格式的文件。

1. 安装 openpyxl

pip install openpyxl

2. 读取单个 Excel 文件

from openpyxl import load_workbook

# 加载 Excel 文件
wb = load_workbook('data.xlsx')

# 选择活动工作表
ws = wb.active

# 读取所有数据
data = []
for row in ws.iter_rows(values_only=True):
    data.append(row)

# 打印数据
for row in data:
    print(row)

3. 批量读取多个 Excel 文件

import os
from openpyxl import load_workbook

# 存放 Excel 文件的文件夹路径
folder_path = 'path_to_folder'

# 获取所有 Excel 文件路径
file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]

# 初始化一个空的列表
all_data = []

# 逐个读取并合并
for file in file_list:
    wb = load_workbook(file)
    ws = wb.active
    for row in ws.iter_rows(values_only=True):
        all_data.append(row)

# 打印合并后的数据
for row in all_data:
    print(row)

使用 xlrd 批量提取 Excel 数据

xlrd 是一个用于读取 Excel 文件的库,适用于 .xls 和 .xlsx 格式的文件。

1. 安装 xlrd

pip install xlrd

2. 读取单个 Excel 文件

import xlrd

# 打开 Excel 文件
workbook = xlrd.open_workbook('data.xls')

# 选择工作表
sheet = workbook.sheet_by_index(0)

# 读取所有数据
data = []
for row_idx in range(sheet.nrows):
    row = sheet.row_values(row_idx)
    data.append(row)

# 打印数据
for row in data:
    print(row)

3. 批量读取多个 Excel 文件

import os
import xlrd

# 存放 Excel 文件的文件夹路径
folder_path = 'path_to_folder'

# 获取所有 Excel 文件路径
file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xls') or f.endswith('.xlsx')]

# 初始化一个空的列表
all_data = []

# 逐个读取并合并
for file in file_list:
    workbook = xlrd.open_workbook(file)
    sheet = workbook.sheet_by_index(0)
    for row_idx in range(sheet.nrows):
        row = sheet.row_values(row_idx)
        all_data.append(row)

# 打印合并后的数据
for row in all_data:
    print(row)

总结

本文详细介绍了如何使用 pandas、openpyxl 和 xlrd 三种库批量提取 Excel 数据,并提供了相应的示例代码。通过这些方法,可以高效地处理多个 Excel 文件,提高数据处理的效率。希望这些内容能够帮助大家在实际开发中更好地处理 Excel 数据。

到此这篇关于Python实现批量提取Excel数据的文章就介绍到这了,更多相关Python批量提取Excel数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python 使用SFTP和FTP实现对服务器的文件下载功能

    Python 使用SFTP和FTP实现对服务器的文件下载功能

    这篇文章主要介绍了Python 使用SFTP和FTP实现对服务器的文件下载功能,本文通过实例代码给大家介绍的非常想详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-12-12
  • 零基础写python爬虫之打包生成exe文件

    零基础写python爬虫之打包生成exe文件

    本文介绍了通过pyinstaller和pywin32两个插件在windows环境下,将py文件打包成exe文件,有需要的朋友可以参考下
    2014-11-11
  • Python的10道简单测试题(含答案)

    Python的10道简单测试题(含答案)

    这篇文章主要介绍了Python的10道简单测试题(含答案),学习了一段时间python的小伙伴来做几道测试题检验一下自己的学习成果吧
    2023-04-04
  • Python控制流之循环控制详解(break, continue, pass)

    Python控制流之循环控制详解(break, continue, pass)

    本文将详细介绍这三种循环控制语句的使用方法和最佳实践,并附上一个综合详细的例子,帮助您全面掌握Python循环控制的用法,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2025-04-04
  • 使用Python加密和解密PDF文件

    使用Python加密和解密PDF文件

    在日常工作和生活中,保护PDF文件的隐私和安全至关重要,Python提供了一些强大的库,使得加密和解密PDF文件变得相对简单,本文将详细介绍如何使用PyPDF2库来加密和解密PDF文件,需要的朋友可以参考下
    2025-03-03
  • PyMongo进行MongoDB查询和插入操作的高效使用示例

    PyMongo进行MongoDB查询和插入操作的高效使用示例

    这篇文章主要为大家介绍了PyMongo进行MongoDB查询和插入操作的高效使用示例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-11-11
  • Python中关于文件的具体操作与介绍

    Python中关于文件的具体操作与介绍

    文件与目录操作是编程语言中非常重要的功能,Python也对其提供了相应的API支持,这篇博文就是具体介绍它们的使用方法,通读本篇对大家的学习或工作具有一定的价值,需要的朋友可以参考下
    2021-09-09
  • Python全栈之推导式和生成器

    Python全栈之推导式和生成器

    这篇文章主要为大家介绍了Python推导式和生成器,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2021-12-12
  • python爬虫parsel-css选择器的具体用法

    python爬虫parsel-css选择器的具体用法

    本文主要介绍了python爬虫parsel-css选择器的具体用法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-06-06
  • Python爬虫实战之爬取某宝男装信息

    Python爬虫实战之爬取某宝男装信息

    网络爬虫是一种按照一定的规则自动浏览、检索网页信息的程序或者脚本。网络爬虫能够自动请求网页,并将所需要的数据抓取下来。本文将为大家介绍如何利用爬虫获取某宝男装信息,感兴趣的小伙伴可以了解一下
    2021-12-12

最新评论