Python数据分析处理(三)--运动员信息的分组与聚合

更新时间：2022年01月25日 13:12:06 作者：a Fang

这篇文章主要介绍了Python数据清洗与处理运动员信息的分组与聚合，根据Python数据清洗与处理的相关资料展开运动员信息的分组与聚合的文章内容,需要的朋友可以参考一下

3.1 数据的爬取

代码：

import pandas as pd
f = open('运动员信息表.csv')
data=pd.read_csv(f,skiprows=0,header=0)
print(data)

运行结果：

首先使用pd.read_csv(f,skiprows=0,header=0)进行数据的读取，并且将数据转换成为dataframe的格式给对象，做初始化，方便后面进行数据的分析。

3.2统计男篮、女篮运动员的平均年龄、身高、体重

代码：

sex=data[["年龄（岁）","身高(cm)","体重(kg)"]].groupby(data["性别"])

print(sex.mean())

运行结果：

首先我们先把数据提取出来做个分组，先把"年龄（岁）",“身高(cm)”,"体重(kg)"这三行数据提取出来再根据性别进行分组。

sex=data[["年龄（岁）","身高(cm)","体重(kg)"]].groupby(data["性别"])

然后再调用mean()求平均值，求出男篮、女篮运动员的平均年龄、身高、体重。

3.3统计男篮运动员年龄、身高、体重的极差值

代码：

sex=data[["年龄（岁）","身高(cm)","体重(kg)"]].groupby(data["性别"])
basketball_male=dict([x for x in sex])['男']
basketball_male
#求极差
def range_data_group(arr):
    return arr.max()-arr.min()
#进行每列不同的聚合
basketball_male.agg({
"年龄（岁）":range_data_group,"身高(cm)":range_data_group,"体重(kg)":range_data_group
})

运行结果：

首先提取数据：

单行循环提取数据，dict([x for x in sex])在循环体内的语句只有一行的情况的下，可以简化for循环的书写。定义一个函数def range_data_group(arr):求极差；

极差的求法：使用最大值减去最小值。就得到极差。

agg()函数：DataFrame.agg（*func*，*axis = 0*，* args*，*** kwargs* ）*

func : 函数，函数名称，函数列表，字典{‘行名/列名’，‘函数名’}

使用指定轴上的一个或多个操作进行聚合。

需要注意聚合函数操作始终是在轴（默认是列轴，也可设置行轴）上执行，不同于 numpy聚合函数

最后我们可以得到三列数据：分别对应"年龄（岁）",“身高(cm)”,“体重(kg)”。

3.4 统计男篮运动员的体质指数

3.4.1添加体重指数

代码：

data["体质指数"]=0
data

运行结果：

添加一行体重指数：data[“体质指数”]=0

3.4.2计算bmi值并添加数据

代码：

# 计算bmi数值
def outer(num):
    def bminum(sumbim):
        weight=data["身高(cm)"]
        height=data["体重(kg)"]
        sumbim=weight/(height/100)**2
        return num+sumbim
    return bminum

将该行数据添加上去：

代码：

# 调用函数
bimdata=data["体质指数"]
data["体质指数"]=data[["体质指数"]].apply(outer(bimdata))
data

运行结果:

编写函数计算bmi数值 outer(num)；然后再使用apply的方法将自定义的函数应用到"体质指数"这一列。然后计算出该列的值之后进行赋值。

data[“体质指数”]=data[[“体质指数”]].apply(outer(bimdata)) 97622)]

编写函数计算bmi数值 outer(num) ；然后再使用apply的方法将自定义的函数应用到"体质指数"这一列。然后计算出该列的值之后进行赋值。

data[“体质指数”]=data[[“体质指数”]].apply(outer(bimdata))

到此这篇关于Python数据分析处理运动员信息的分组与聚合的文章就介绍到这了,更多相关Python数据分析处理内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

python使用wxpy实现微信消息防撤回脚本
这篇文章主要为大家详细介绍了python使用wxpy实现微信消息防撤回脚本，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2019-04-04
Python实现将DNA序列存储为tfr文件并读取流程介绍
为什么要在实验过程中存储文件，因为有些算法的内容存在一些重复计算的步骤，这些步骤往往消耗很大一部分时间，在有大量参数的情况时，需要在多次不同参数的情况下重复试验，因此可以考虑将一些不涉及参数运算的部分结果存入文件中
2022-09-09
pytorch单元测试的实现示例
单元测试是一种软件测试方法,本文主要介绍了pytorch单元测试的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
2024-04-04
使用WingPro 7 设置Python路径的方法
Python使用称为Python Path的搜索路径来查找使用import语句导入代码的模块。这篇文章主要介绍了使用WingPro 7 设置Python路径的方法,需要的朋友可以参考下
2019-07-07
Python线程之同步机制实际应用场景举例说明
这篇文章主要给大家分享的是Python线程之同步机制实际应用场景举例说明，银行转账小栗子供大家参考学习，希望对你有一定的帮助
2022-02-02
浅谈Python中re.match()和re.search()的使用及区别
这篇文章主要介绍了浅谈Python中re.match()和re.search()的使用及区别，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-04-04
Scrapy框架使用的基本知识
今天小编就为大家分享一篇关于Scrapy框架使用的基本知识，小编觉得内容挺不错的，现在分享给大家，具有很好的参考价值，需要的朋友一起跟随小编来看看吧
2018-10-10
使用Python和OpenCV实现动态背景的画中画效果
这篇文章将通过一个详细的Python脚本,使用OpenCV库来为视频添加动态背景,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
2024-11-11
用Python的Flask框架结合MySQL写一个内存监控程序
这篇文章主要介绍了用Python的Flask框架结合MySQL些一个内存监控程序的例子,并且能将结果作简单的图形化显示,需要的朋友可以参考下
2015-11-11
使用python模块plotdigitizer抠取论文图片中的数据实例详解
这篇文章主要介绍了使用python模块plotdigitizer抠取论文图片中的数据，本文通过实例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
2021-03-03