Python自动化处理Excel数据的操作过程

更新时间：2023年11月02日 08:56:36 作者：qwerrt9

在实际数据处理和分析过程中，经常会遇到需要从大量数据中提取出特定日期范围内的信息的需求，本文将介绍如何使用Python的pandas库来处理Excel文件，感兴趣的朋友跟随小编一起看看吧

需求描述：数据格式如下所示，需要分离出2023年7月1号之后的数据明细
数据核对与处理：从Excel文件中提取特定日期后的签收数据
1. 引言
2. 准备工作
3. 设置显示选项
4. 读取Excel数据文件
5. 数据处理
6. 筛选数据并保存结果
7. 结果展示
8. 总结
完整代码:

需求描述：数据格式如下所示，需要分离出2023年7月1号之后的数据明细

数据核对与处理：从Excel文件中提取特定日期后的签收数据

1. 引言

在实际数据处理和分析过程中，经常会遇到需要从大量数据中提取出特定日期范围内的信息的需求。本文将介绍如何使用Python的pandas库来处理Excel文件，并提取出2023年7月1日之后的签收数据。

2. 准备工作

首先，我们需要导入所需的库。在本文中，我们将使用pandas库来处理Excel文件。

import pandas as pd

3. 设置显示选项

为了能够正确显示所有列和行，我们可以设置pandas的显示选项。

pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)

4. 读取Excel数据文件

接下来，我们使用pd.read_excel()函数来读取Excel文件中的数据，并指定nrows参数来限制读取的行数。

data = pd.read_excel('C:\\Users\\Admin\\Desktop\\数据核对\\工作簿2.xlsx', nrows=600)

5. 数据处理

为了方便后续操作，我们将DataFrame的索引设置为“货件单号”和“SKU”。

data = data.set_index(['货件单号', 'SKU'])

然后，我们将“签收明细”这一列进行拆分，并将拆分后的每个数据项排成多行。

data = data['签收明细'].str.split('\n', expand=True).stack().reset_index(level=2, drop=True)
data.name = '签收明细'

接着，我们从拆分后的数据中提取出“日期”和“数量”两列，并将其转换为正确的数据类型。

data = data.str.split(' \| ', expand=True)
data.columns = ['日期', '数量']
data['日期'] = pd.to_datetime(data['日期'])
data['数量'] = pd.to_numeric(data['数量'])

6. 筛选数据并保存结果

现在，我们可以筛选出2023年7月1日之后的数据，并将结果保存到Excel文件中。

result = data[data['日期'] >= '2023-07-01'].reset_index()
result.to_excel('2023年7月1号之后签收数据.xlsx', index=True)

7. 结果展示

最后，我们输出提示信息，显示结果已经保存到文件中。

print(f"结果已经保存到文件中：2023年7月1号之后签收数据.xlsx")

8. 总结

本文介绍了如何使用Python的pandas库处理Excel文件，并提取出特定日期范围内的签收数据。通过设置显示选项、读取Excel文件、进行数据处理、筛选数据并保存结果，我们能够高效地处理大量数据，并得到我们需要的信息

完整代码:

import pandas as pd
# 设置最大列数为 None，以显示所有列
pd.set_option('display.max_columns', None)
# 设置最大行数为 None，以显示所有行
pd.set_option('display.max_rows', None)
# 读取Excel数据文件
data = pd.read_excel('C:\\Users\\Admin\\Desktop\\数据核对\\工作簿2.xlsx', nrows=600)
# 输出全部数据（显示所有行和列）
print(data)
# 将DataFrame的索引设置为“货件单号”和“SKU”，以便后续操作
data = data.set_index(['货件单号', 'SKU'])
# 将“签收明细”这一列进行拆分，并将拆分后的每个数据项排成多行
data = data['签收明细'].str.split('\n', expand=True).stack().reset_index(level=2, drop=True)
data.name = '签收明细'
# 从拆分后的数据中提取“日期”和“数量”两列
data = data.str.split(' \| ', expand=True)
data.columns = ['日期', '数量']
data['日期'] = pd.to_datetime(data['日期'])
data['数量'] = pd.to_numeric(data['数量'])
# 筛选出 2023 年 7 月 1 日之后的数据，并将结果保存到 Excel 文件中
result = data[data['日期'] >= '2023-07-01'].reset_index() # 筛选符合条件的行，并重置索引
result.to_excel('2023年7月1号之后签收数据.xlsx', index=True) # 将结果保存到 Excel 文件中
# 输出提示信息
print(f"结果已经保存到文件中：2023年7月1号之后签收数据.xlsx")

到此这篇关于Python自动化处理Excel数据的文章就介绍到这了,更多相关Python 处理Excel数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

教你用pytorch训练五子棋ai示例代码
这篇文章主要介绍了五个与五子棋相关的Python文件,包括游戏逻辑、神经网络模型、训练代码以及玩家对战代码,文中通过代码介绍的非常详细,需要的朋友可以参考下
2025-03-03
Window系统下Python如何安装OpenCV库
这篇文章主要介绍了Window系统下Python如何安装OpenCV库，本文分步骤给大家介绍的详细，对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
2020-03-03
Python使用sqlite3模块内置数据库
这篇文章主要介绍了Python使用sqlite3模块内置数据库,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-05-05
python实现单目标、多目标、多尺度、自定义特征的KCF跟踪算法(实例代码)
这篇文章主要介绍了python实现单目标、多目标、多尺度、自定义特征的KCF跟踪算法,本文通过实例代码给大家介绍的非常详细，具有一定的参考借鉴价值，需要的朋友可以参考下
2020-01-01
python pandas创建多层索引MultiIndex的6种方式
这篇文章主要为大家介绍了python pandas创建多层索引MultiIndex的6种方式，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2022-07-07
python使用xlsxwriter实现有向无环图到Excel的转换
这篇文章主要为大家详细介绍了python使用xlsxwriter实现有向无环图到Excel的转换，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-12-12
Python动态强类型解释型语言原理解析
这篇文章主要介绍了Python动态强类型解释型语言原理解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-03-03
Python实现读取及写入csv文件的方法示例
这篇文章主要介绍了Python实现读取及写入csv文件的方法,涉及Python针对csv格式文件的读取、遍历、写入等相关操作技巧,需要的朋友可以参考下
2018-01-01
python基础之元组
这篇文章主要介绍了python的元组,实例分析了Python中返回一个返回值与多个返回值的方法,需要的朋友可以参考下
2021-10-10
基于Python实现绘制属于你的世界地图
Python之所以这么流行，是因为它不仅能够应用于科技领域，还能用来做许多其他学科的研究工具，绘制地图便是其功能之一。本文我们将用matplot工具包之一的 mpl_toolkits 来绘制世界地图，需要的可以参考一下
2022-11-11