Python读取大量Excel文件并跨文件批量计算平均值的方法

 更新时间:2023年02月02日 08:40:09   作者:疯狂学习GIS  
这篇文章主要介绍了Python读取大量Excel文件并跨文件批量计算平均值,介绍基于Python语言,实现对多个不同Excel文件进行数据读取与平均值计算的方法,需要的朋友可以参考下

本文介绍基于Python语言,实现对多个不同Excel文件进行数据读取与平均值计算的方法~

脚本之家推荐学习python书籍

  首先,让我们来看一下具体需求:目前有一个文件夹,其中存放了大量Excel文件;文件名称是每一位同学的名字,即文件名称没有任何规律。

  而每一个文件都是一位同学对全班除了自己之外的其他同学的各项打分,我们以其中一个Excel文件为例来看:

  可以看到,全班同学人数(即表格行数)很多、需要打分的项目(即表格列数)有11个(不算总分);同时,由于不能给自己打分,导致每一份表格中会有一行没有数据。

  而我们需要做的,就是求出每一位同学的、11个打分项目分别的平均分,并存放在一个新的、表头(行头与列头)与大家打分文件一致的总文件中,如下图。其中,每一个格子都代表了这位同学、这一项打分项目在经过班级除其之外的每一位同学打分后计算出的平均值。

  可以看到,一个人就需要算11次平均,更何况一个班会有数十位同学。如果单独用Excel计算,是非常麻烦的。

  而借助Python,就会简单很多。具体代码如下。在这里,就不再像平日里机器学习、深度学习代码博客那样,对代码加以逐段、分部分的具体解释了,直接列出全部代码,大家参考注释即可理解。

# -*- coding: utf-8 -*-
"""
Created on Thu Apr  8 16:24:41 2021

@author: fkxxgis
"""

import os
import numpy as np
from openpyxl import load_workbook

file_path='F:/班长/2020-2021综合测评与评奖评优/01_综合测评/地信XXXX班互评打分表/' #这里是每一位同学打分Excel文件存放的路径
output_path='F:/班长/2020-2021综合测评与评奖评优/01_综合测评/地信XXXX班综合素质测评互评打分表.xlsx' #这里是最终结果存放路径,请不要和上述路径一致
first_row=5 #第一个分数所在的行数
first_column=3 #第一个分数所在的列数
all_row=32 #班级同学总数
all_column=11 #需要计算的分数项目个数

all_excel=os.listdir(file_path) #获取打分文件路径下全部Excel文件
file_row=first_row+all_row-1
file_column=first_column+all_column-1
all_mean_score=np.zeros((file_row,file_column),dtype=float) #新建一个二维数组,存放每一位同学、每一项项目的分数平均值
for now_row in range(first_row,file_row+1):
    for now_column in range (first_column,file_column+1):
        all_score=[]
        for excel_num in range(0,len(all_excel)):
            now_excel=load_workbook(file_path+all_excel[excel_num]) #打开第一个打分Excel文件
            all_sheet=now_excel.get_sheet_names() #获取打分文件的全部Sheet名称
            now_sheet=now_excel.get_sheet_by_name(all_sheet[0]) #本文中分数全部存储于第一个Sheet,因此下标为0
            single_score=now_sheet.cell(now_row,now_column).value #获取对应单元格数据
            if single_score==None: #如果这个单元格为空(也就是自己不给自己打分的那一行)
                pass
            else:
                all_score.append(single_score)
        all_mean_score[now_row-1,now_column-1]=np.mean(all_score) #计算全部同学为这一位同学、这一个打分项目所打分数的平均值

output_excel=load_workbook(output_path) #读取结果存放Excel
output_all_sheet=output_excel.get_sheet_names() #这里代码含义同上
output_sheet=output_excel.get_sheet_by_name(output_all_sheet[0])
output_sheet=output_excel.active
for output_now_row in range(first_row,file_row+1):
    for output_now_column in range (first_column,file_column+1):
        exec("output_sheet.cell(output_now_row,output_now_column).value=all_mean_score[output_now_row-1,output_now_column-1]") #将二维数组中每一位同学、每一项打分项目的最终平均分数写入结果文件的对应位置
output_excel.save(output_path)

  至此,大功告成。

补充:python批量读取Excel文件

将同一个文件夹下的xlsx文件读取:

import os
import pandas as pd

path = r'./path of file'
for i in os.listdir(path):
    df = pd.read_excel(os.path.join(path,i))

到此这篇关于Python读取大量Excel文件并跨文件批量计算平均值的文章就介绍到这了,更多相关Python读取大量Excel文件内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 机器学习之数据清洗及六种缺值处理方式小结

    机器学习之数据清洗及六种缺值处理方式小结

    本文主要介绍了机器学习之数据清洗及六种缺值处理方式小结,包括删除空行、填充平均值、中位数、众数、线性插值和随机森林填充,具有一定的参考价值,感兴趣的可以了解一下
    2025-03-03
  • 夯实基础python集合的应用场景及字符串定义和表示

    夯实基础python集合的应用场景及字符串定义和表示

    这篇文章主要为大家介绍了python集合的应用场景及字符串定义和表示,来帮大家夯实基础,有需要的朋友可以借鉴参考下,希望能够有所帮助
    2023-10-10
  • Python中变量的作用域的具体使用

    Python中变量的作用域的具体使用

    本文主要介绍了Python中变量的作用域的具体使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-03-03
  • python numpy实现文件存取的示例代码

    python numpy实现文件存取的示例代码

    这篇文章主要介绍了python numpy实现文件存取的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-05-05
  • 详解Python如何在多层循环中使用break/continue

    详解Python如何在多层循环中使用break/continue

    关于break/continue这两个关键字在平常的使用过程中一直比较迷糊。所以本文将详细讲讲Python如何在多层循环中使用break/continue,需要的可以参考一下
    2022-05-05
  • Python的Web框架Django介绍与安装方法

    Python的Web框架Django介绍与安装方法

    这篇文章介绍了Python的Web框架Django与安装方法,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-06-06
  • python中ASCII码字符与int之间的转换方法

    python中ASCII码字符与int之间的转换方法

    今天小编就为大家分享一篇python中ASCII码字符与int之间的转换方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-07-07
  • python回调函数的使用方法

    python回调函数的使用方法

    在计算机程序设计中,回调函数,或简称回调(Callback),是指通过函数参数传递到其它代码的,某一块可执行代码的引用。这一设计允许了底层代码调用在高层定义的子程序
    2014-01-01
  • ​cmd输入python打开微软应用商店的解决方法

    ​cmd输入python打开微软应用商店的解决方法

    在命令控制行中输入python想使用Python环境,却意外打开了微软自带的应用商店,十分苦恼,下面这篇文章主要给大家介绍了关于​cmd输入python打开微软应用商店的解决方法,需要的朋友可以参考下
    2024-03-03
  • Python反转序列的方法实例分析

    Python反转序列的方法实例分析

    这篇文章主要介绍了Python反转序列的方法,结合实例形式分析了列表、元组及字符串反转的具体实现技巧,需要的朋友可以参考下
    2018-03-03

最新评论