Python实现为Excel中每个单元格计算其在文件中的平均值

 更新时间:2023年10月07日 08:42:14   作者:疯狂学习GIS  
这篇文章主要为大家详细介绍了如何基于Python语言实现对大量不同的Excel文件加以跨文件、逐单元格平均值计算,感兴趣的小伙伴可以跟随小编一起学习一下

本文介绍基于Python语言,对大量不同的Excel文件加以跨文件逐单元格平均值计算的方法。

首先,我们来明确一下本文的具体需求。现有一个文件夹,其中有如下所示的大量Excel文件,我们这里就以 .csv 文件为例来介绍。其中,每一个 .csv 文件的名称都是如下图所示的 Ref_XXX_Y.csv 格式的,其中 XXX 表示三个字母,后面的 Y 则表示若干位数字。

对于其中的每一个 .csv 文件,都有着如下图所示的数据格式。

我们现在的需求是,希望对于每一个名称为 Ref_GRA_Y.csv 格式的 .csv 文件,求取其中每一个单元格在所有文件中数据的平均值。例如,对于上图中 DOY 1 blue 这个单元格,那么求出来的平均值就是在全部名称为 Ref_GRA_Y.csv 格式的 .csv 文件之中, DOY 1 且列名为 blue 的单元格的平均值。此外,如果像上图一样,出现了部分单元格数值为 0 的情况,表明在当前文件夹下,这个单元格是没有数据的,因此需要在计算的时候舍去(并且取平均值时候的分母也要减小 1 )。

知道了需求,我们就可以开始代码的书写。其中,本文用到的具体代码如下所示。此外,本文实现的需求也和我们之前的文章基于Python读取多个Excel文件数据并跨越不同xlsx表格文件计算平均值有些类似,大家如果有需要,也可以参考之前的这一篇文章。

# -*- coding: utf-8 -*-
"""
Created on Fri Oct  6 13:07:48 2023
@author: fkxxgis
"""
import os
import glob
import pandas as pd
folder_path = "E:/04_Reconstruction/02_Data/01_RGBNINDVI_History"
output_path = "E:/04_Reconstruction/02_Data"
file_pattern = "Ref_GRA_*.csv"
file_paths = glob.glob(os.path.join(folder_path, file_pattern))
combined_data = pd.DataFrame()
for file_path in file_paths:
    df = pd.read_csv(file_path)
    df_filtered = df[df != 0]
    combined_data = pd.concat([combined_data, df_filtered])
average_values = combined_data.groupby('DOY').mean()
output_file = "04_Data_YearAverage.csv"
average_values.to_csv(os.path.join(output_path,output_file), index=True)

其中,上述代码的具体介绍如下。

首先,我们导入必要的库—— os 库用于文件路径操作, glob 库用于文件匹配, pandas 库用于数据处理和分析。同时,我们定义文件夹路径 folder_path ,代表存储 .csv 文件的文件夹路径;定义输出路径 output_path ,代表保存结果文件的路径;定义文件匹配模式 file_pattern ,用于匹配需要处理的 .csv 文件的文件名模式。

随后,我们使用 glob.glob() 函数结合文件夹路径和文件匹配模式,获取满足条件的 .csv 文件的路径列表,存储在 file_paths 变量中。创建一个空的数据框 combined_data ,用于存储所有文件的数据。

接下来,我们使用一个循环,遍历 file_paths 列表中的每个文件路径。对于每个文件路径,使用 pd.read_csv() 函数加载 .csv 文件,并将其存储在名为 df 的数据框中。其次,使用条件筛选语句 df[df != 0] 排除值为 0 的数据,并将结果存储在名为 df_filtered 的数据框中。紧接着,将当前文件的数据框 df_filtered 合并到总数据框 combined_data 中,这一步骤使用 pd.concat() 函数实现。

完成所有文件的处理后,使用 combined_data.groupby('DOY').mean() 计算所有文件的平均值,按照 DOY 列进行分组并求平均值。随后,定义输出文件名 output_file ,代表保存平均值结果的文件名。

最后,使用 os.path.join() 函数结合输出路径和输出文件名,生成保存路径,并使用 average_values.to_csv() 函数将平均值数据框 average_values 保存为一个新的 .csv 文件,指定 index=True 以包含索引列。

运行上述代码,我们即可得到结果文件。如下图所示,可以看到结果文件中,已经是计算之后的平均值结果了。

至此,大功告成。

到此这篇关于Python实现为Excel中每个单元格计算其在文件中的平均值的文章就介绍到这了,更多相关Python计算平均值内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python中语音转文字相关库介绍(最新推荐)

    Python中语音转文字相关库介绍(最新推荐)

    Python的speech_recognition库是一个用于语音识别的Python包,它可以使Python程序能够识别和翻译来自麦克风、音频文件或网络流的语音,这篇文章主要介绍了Python中语音转文字相关库介绍,需要的朋友可以参考下
    2023-05-05
  • Python OpenCV实现3种滤镜效果实例

    Python OpenCV实现3种滤镜效果实例

    opencv是一个很强大的库,支持多个编程语言,下面这篇文章主要给大家介绍了关于Python OpenCV实现3种滤镜效果的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下
    2022-04-04
  • Django零基础入门之自定义标签及模板中的使用

    Django零基础入门之自定义标签及模板中的使用

    这篇文章主要介绍了Django零基础入门之自定义标签及模板中的使用,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-09-09
  • Python Numpy数组扩展repeat和tile使用实例解析

    Python Numpy数组扩展repeat和tile使用实例解析

    这篇文章主要介绍了Python Numpy数组扩展repeat和tile使用实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-12-12
  • python+opencv轮廓检测代码解析

    python+opencv轮廓检测代码解析

    这篇文章主要介绍了python+opencv轮廓检测代码解析,本文实例实现对图片的简单处理,比如图片的读取,灰度显示等相关内容,具有一定借鉴价值,需要的朋友可以参考下
    2018-01-01
  • Caffe卷积神经网络solver及其配置详解

    Caffe卷积神经网络solver及其配置详解

    这篇文章主要为大家介绍了Caffe卷积神经网络solver及其配置详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-06-06
  • pycharm快捷键汇总

    pycharm快捷键汇总

    本文给大家分享的是PyCharm开发工具的快捷键大全整理,非常详细,适合使用PyCharm作为开发工具的开发人员参考使用,能够帮助提高开发效率和速度
    2020-02-02
  • python ChainMap的使用和说明详解

    python ChainMap的使用和说明详解

    这篇文章主要介绍了python ChainMap的使用和说明详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-06-06
  • Python Django 封装分页成通用的模块详解

    Python Django 封装分页成通用的模块详解

    这篇文章主要介绍了Python Django 封装分页成通用的模块详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-08-08
  • Python求离散序列导数的示例

    Python求离散序列导数的示例

    今天小编就为大家分享一篇Python求离散序列导数的示例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07

最新评论