Python实现为Excel中每个单元格计算其在文件中的平均值

更新时间：2023年10月07日 08:42:14 作者：疯狂学习GIS

这篇文章主要为大家详细介绍了如何基于Python语言实现对大量不同的Excel文件加以跨文件、逐单元格平均值计算,感兴趣的小伙伴可以跟随小编一起学习一下

本文介绍基于Python语言，对大量不同的Excel文件加以跨文件、逐单元格平均值计算的方法。

首先，我们来明确一下本文的具体需求。现有一个文件夹，其中有如下所示的大量Excel文件，我们这里就以 .csv 文件为例来介绍。其中，每一个 .csv 文件的名称都是如下图所示的 Ref_XXX_Y.csv 格式的，其中 XXX 表示三个字母，后面的 Y 则表示若干位数字。

对于其中的每一个 .csv 文件，都有着如下图所示的数据格式。

我们现在的需求是，希望对于每一个名称为 Ref_GRA_Y.csv 格式的 .csv 文件，求取其中每一个单元格在所有文件中数据的平均值。例如，对于上图中 DOY 为 1 的 blue 这个单元格，那么求出来的平均值就是在全部名称为 Ref_GRA_Y.csv 格式的 .csv 文件之中， DOY 为 1 且列名为 blue 的单元格的平均值。此外，如果像上图一样，出现了部分单元格数值为 0 的情况，表明在当前文件夹下，这个单元格是没有数据的，因此需要在计算的时候舍去（并且取平均值时候的分母也要减小 1 ）。

知道了需求，我们就可以开始代码的书写。其中，本文用到的具体代码如下所示。此外，本文实现的需求也和我们之前的文章基于Python读取多个Excel文件数据并跨越不同xlsx表格文件计算平均值有些类似，大家如果有需要，也可以参考之前的这一篇文章。

# -*- coding: utf-8 -*-
"""
Created on Fri Oct  6 13:07:48 2023
@author: fkxxgis
"""
import os
import glob
import pandas as pd
folder_path = "E:/04_Reconstruction/02_Data/01_RGBNINDVI_History"
output_path = "E:/04_Reconstruction/02_Data"
file_pattern = "Ref_GRA_*.csv"
file_paths = glob.glob(os.path.join(folder_path, file_pattern))
combined_data = pd.DataFrame()
for file_path in file_paths:
    df = pd.read_csv(file_path)
    df_filtered = df[df != 0]
    combined_data = pd.concat([combined_data, df_filtered])
average_values = combined_data.groupby('DOY').mean()
output_file = "04_Data_YearAverage.csv"
average_values.to_csv(os.path.join(output_path,output_file), index=True)

其中，上述代码的具体介绍如下。

首先，我们导入必要的库—— os 库用于文件路径操作， glob 库用于文件匹配， pandas 库用于数据处理和分析。同时，我们定义文件夹路径 folder_path ，代表存储 .csv 文件的文件夹路径；定义输出路径 output_path ，代表保存结果文件的路径；定义文件匹配模式 file_pattern ，用于匹配需要处理的 .csv 文件的文件名模式。

随后，我们使用 glob.glob() 函数结合文件夹路径和文件匹配模式，获取满足条件的 .csv 文件的路径列表，存储在 file_paths 变量中。创建一个空的数据框 combined_data ，用于存储所有文件的数据。

接下来，我们使用一个循环，遍历 file_paths 列表中的每个文件路径。对于每个文件路径，使用 pd.read_csv() 函数加载 .csv 文件，并将其存储在名为 df 的数据框中。其次，使用条件筛选语句 df[df != 0] 排除值为 0 的数据，并将结果存储在名为 df_filtered 的数据框中。紧接着，将当前文件的数据框 df_filtered 合并到总数据框 combined_data 中，这一步骤使用 pd.concat() 函数实现。

完成所有文件的处理后，使用 combined_data.groupby('DOY').mean() 计算所有文件的平均值，按照 DOY 列进行分组并求平均值。随后，定义输出文件名 output_file ，代表保存平均值结果的文件名。

最后，使用 os.path.join() 函数结合输出路径和输出文件名，生成保存路径，并使用 average_values.to_csv() 函数将平均值数据框 average_values 保存为一个新的 .csv 文件，指定 index=True 以包含索引列。

运行上述代码，我们即可得到结果文件。如下图所示，可以看到结果文件中，已经是计算之后的平均值结果了。

至此，大功告成。

到此这篇关于Python实现为Excel中每个单元格计算其在文件中的平均值的文章就介绍到这了,更多相关Python计算平均值内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

Python实现信息轰炸工具(再也不怕说不过别人了)
不知道各位小伙伴有没有遇到过这样的一个故事,发现自己直接喷不过,打字速度不够给力.下面这篇文章就能解决自己喷不过的苦恼,话不多说,上才艺,需要的朋友可以参考下
2021-06-06
python命令行传递参数的两种方式
python在命令行运行.py文件时,如何在命令行传递参数给运行程序,python默认提供了sys模块的系统参数属性实现接收命令行中的外部参数,本文给大家介绍了python命令行传递参数的两种方式,需要的朋友可以参考下
2024-05-05
Python 京东云无线宝消息推送功能
这篇文章主要介绍了Python 京东云无线宝消息推送功能,发送钉钉消息获取可用积分，详细配置文件通过实例代码给大家讲解的很详细，代码+注释讲解的很详细，需要的朋友可以参考下
2021-05-05
Python实现爬虫爬取NBA数据功能示例
这篇文章主要介绍了Python实现爬虫爬取NBA数据功能,涉及Python针对URL模块、字符串、列表遍历、Excel写入等相关操作技巧,需要的朋友可以参考下
2018-05-05
selenium+python实现1688网站验证码图片的截取功能
这篇文章主要介绍了selenium+python实现1688网站验证码图片的截取,需要的朋友可以参考下
2018-08-08
使用Python的开发框架Brownie部署以太坊智能合约
在本文中，我们将使用Python部署智能合约。这篇文章可能是您走向智能合约和区块链开发的桥梁！
2021-05-05
python使用xmlrpclib模块实现对百度google的ping功能
这篇文章主要介绍了python使用xmlrpclib模块实现对百度google的ping功能,实例分析了xmlrpclib模块的相关技巧,需要的朋友可以参考下
2015-06-06
python 实现将Numpy数组保存为图像
今天小编就为大家分享一篇python 实现将Numpy数组保存为图像，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-01-01
Python纯代码通过神经网络实现线性回归的拟合方式
这篇文章主要介绍了Python纯代码通过神经网络实现线性回归的拟合方式，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2023-05-05
从环境变量到配置中心带你掌握Python多环境配置
这篇文章主要为大家详细介绍了Python中配置管理的艺术,本文会从环境变量到配置中心带你优雅驾驭多环境配置,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下
2026-03-03

Python实现为Excel中每个单元格计算其在文件中的平均值

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具