Python数据分析处理(三)--运动员信息的分组与聚合

 更新时间:2022年01月25日 13:12:06   作者:a Fang  
这篇文章主要介绍了Python数据清洗与处理 运动员信息的分组与聚合,根据Python数据清洗与处理 的相关资料展开运动员信息的分组与聚合的文章内容,需要的朋友可以参考一下

3.1 数据的爬取

代码:

import pandas as pd
f = open('运动员信息表.csv')
data=pd.read_csv(f,skiprows=0,header=0)
print(data)

运行结果:

首先使用pd.read_csv(f,skiprows=0,header=0)进行数据的读取,并且将数据转换成为dataframe的格式给对象,做初始化,方便后面进行数据的分析。

3.2统计男篮、女篮运动员的平均年龄、身高、体重

代码:

sex=data[["年龄(岁)","身高(cm)","体重(kg)"]].groupby(data["性别"])

print(sex.mean())

运行结果:

首先我们先把数据提取出来做个分组,先把"年龄(岁)",“身高(cm)”,"体重(kg)"这三行数据提取出来再根据性别进行分组。

sex=data[["年龄(岁)","身高(cm)","体重(kg)"]].groupby(data["性别"])


然后再调用mean()求平均值,求出男篮、女篮运动员的平均年龄、身高、体重。

3.3统计男篮运动员年龄、身高、体重的极差值

代码:

sex=data[["年龄(岁)","身高(cm)","体重(kg)"]].groupby(data["性别"])
basketball_male=dict([x for x in sex])['男']
basketball_male
#求极差
def range_data_group(arr):
    return arr.max()-arr.min()
#进行每列不同的聚合
basketball_male.agg({
"年龄(岁)":range_data_group,"身高(cm)":range_data_group,"体重(kg)":range_data_group
})

运行结果:

首先提取数据:

单行循环提取数据,dict([x for x in sex])在循环体内的语句只有一行的情况的下,可以简化for循环的书写。定义一个函数def range_data_group(arr):求极差;

极差的求法:使用最大值减去最小值。就得到极差。

agg()函数:DataFrame.agg(*func*,*axis = 0*,* args*,*** kwargs* )*

func : 函数,函数名称,函数列表,字典{‘行名/列名’,‘函数名’}

使用指定轴上的一个或多个操作进行聚合。

需要注意聚合函数操作始终是在轴(默认是列轴,也可设置行轴)上执行,不同于 numpy聚合函数

最后我们可以得到三列数据:分别对应"年龄(岁)",“身高(cm)”,“体重(kg)”。

3.4 统计男篮运动员的体质指数

3.4.1添加体重指数

代码:

data["体质指数"]=0
data

运行结果:

添加一行体重指数:data[“体质指数”]=0

3.4.2计算bmi值并添加数据

代码:

# 计算bmi数值
def outer(num):
    def bminum(sumbim):
        weight=data["身高(cm)"]
        height=data["体重(kg)"]
        sumbim=weight/(height/100)**2
        return num+sumbim
    return bminum

将该行数据添加上去:

代码:

# 调用函数
bimdata=data["体质指数"]
data["体质指数"]=data[["体质指数"]].apply(outer(bimdata))
data

运行结果:

编写函数计算bmi数值 outer(num);然后再使用apply的方法将自定义的函数应用到"体质指数"这一列。然后计算出该列的值之后进行赋值。

data[“体质指数”]=data[[“体质指数”]].apply(outer(bimdata))
97622)]

编写函数计算bmi数值 outer(num) ;然后再使用apply的方法将自定义的函数应用到"体质指数"这一列。然后计算出该列的值之后进行赋值。

data[“体质指数”]=data[[“体质指数”]].apply(outer(bimdata))

到此这篇关于Python数据分析处理 运动员信息的分组与聚合的文章就介绍到这了,更多相关Python数据分析处理 内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 获取django框架orm query执行的sql语句实现方法分析

    获取django框架orm query执行的sql语句实现方法分析

    这篇文章主要介绍了获取django框架orm query执行的sql语句实现方法,结合实例形式分析了Django框架中orm query执行的sql语句获取方法相关实现技巧,需要的朋友可以参考下
    2019-06-06
  • Python中struct模块对字节流/二进制流的操作教程

    Python中struct模块对字节流/二进制流的操作教程

    最近在学习python网络编程这一块,在写简单的socket通信代码时,遇到了struct这个模块的使用,当时不太清楚这到底有和作用,后来查阅了相关资料大概了解了,这篇文章就主要介绍了Python中struct模块对字节流/二进制流的操作,需要的朋友可以参考借鉴。
    2017-01-01
  • Pycharm在创建py文件时,自动添加文件头注释的实例

    Pycharm在创建py文件时,自动添加文件头注释的实例

    今天小编就为大家分享一篇Pycharm在创建py文件时,自动添加文件头注释的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-05-05
  • Python max函数中key的用法及原理解析

    Python max函数中key的用法及原理解析

    最近有童鞋向小编求助怎么样找到字符串中出现字数最多的字符呢,其实最简单的处理方法是使用max函数,max()函数用于获得给定的可迭代对象中的最大值,关于Python max函数key用法跟随小编一起通过本文学习下吧
    2021-06-06
  • Tensorflow加载预训练模型和保存模型的实例

    Tensorflow加载预训练模型和保存模型的实例

    今天小编就为大家分享一篇Tensorflow加载预训练模型和保存模型的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-07-07
  • Python opencv操作深入详解

    Python opencv操作深入详解

    这篇文章主要介绍了Python opencv操作深入详解,文中整理的比较详细,有感兴趣的同学可以学习下
    2021-03-03
  • Python3监控疫情的完整代码

    Python3监控疫情的完整代码

    这篇文章主要介绍了Python3监控疫情的完整代码,代码简单易懂,非常不错具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-02-02
  • python实现猜数字游戏(无重复数字)示例分享

    python实现猜数字游戏(无重复数字)示例分享

    这篇文章主要介绍了python实现猜数字游戏(无重复数字)示例,需要的朋友可以参考下
    2014-03-03
  • Python图形用户界面与游戏开发实例详解

    Python图形用户界面与游戏开发实例详解

    GUI是图形用户界面的缩写,图形化的用户界面对使用过计算机的人来说应该都不陌生,下面这篇文章主要给大家介绍了关于Python图形用户界面与游戏开发的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-09-09
  • 使用Python对Access读写操作

    使用Python对Access读写操作

    学习Python的过程中,我们会遇到Access的读写问题,这时我们可以利用win32.client模块的COM组件访问功能,通过ADODB操作Access的文件。下面跟着小编一起来看下吧
    2017-03-03

最新评论