Python技巧分享之groupby基础用法详解

 更新时间:2022年10月26日 08:52:52   作者:Python数据挖掘  
python中groupby函数主要的作用是进行数据的分组以及分组后地组内运算!本文将通过一些示例和大家详细讲讲groupby的基础用法,需要的可以参考一下

模拟数据

import pandas as pd
import numpy as np
employees = ["小明","小周","小孙","小王","小张"]   # 5位员工
time = ["上半年", "下半年"]


df=pd.DataFrame({
    "employees":np.random.choice(employees,10),  # 在员工中重复选择10次
    # 另一种写法
    #"employees":[employees[x] for x in np.random.randint(0,len(employees),10)],  
    "time":np.random.choice(time,10),
    "salary":np.random.randint(800,1000,10),  # 800-1000之间的薪资选择10个数值
    "score":np.random.randint(6,12,10)  # 6-11的分数选择10个
})

df

groupby+单个字段+单个聚合

求解每个人的总薪资金额:

total_salary = df.groupby("employees")["salary"].sum().reset_index()
total_salary

使用agg也能够实现上面的效果:

df.groupby("employees").agg({"salary":"sum"}).reset_index()

df.groupby("employees").agg({"salary":np.sum}).reset_index()

groupby+单个字段+多个聚合

求解每个人的总薪资金额和薪资的平均数

方法1:使用groupby+merge

mean_salary = df.groupby("employees")["salary"].mean().reset_index()
mean_salary

然后将上面的两个结果进行组合;在合并之前为了字段的名字更加的直观,我们重命名下:

total_salary.rename(columns={"employees":"total_salary"})
mean_salary.columns = ["employees","mean_salary"]
total_mean = total_salary.merge(mean_salary)
total_mean

方法2:使用groupby+agg

total_mean = df.groupby("employees")\
            .agg(total_salary=("salary", "sum"), 
                 mean_salary=("salary", "mean"))\
            .reset_index()
total_mean

groupby+多个字段+单个聚合

针对多个字段的同时聚合:

df.groupby(["employees","time"])["salary"].sum().reset_index()

# 使用agg来实现

df.groupby(["employees","time"]).agg({"salary":"sum"}).reset_index()

groupby+多个字段+多个聚合

使用的方法是:

agg(’新列名‘=(’原列名‘, ’统计函数/方法‘))

df.groupby(["employees","time"])\
            .agg(total_salary=("salary", "sum"), 
                mean_salary=("salary", "mean"),
                total_score=("score", "sum") 
                )\
            .reset_index()

到此这篇关于Python技巧分享之groupby基础用法详解的文章就介绍到这了,更多相关Python groupby用法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 教你利用Python+Turtle绘制简易版爱心表白

    教你利用Python+Turtle绘制简易版爱心表白

    这篇文章主要介绍了教你利用Python+Turtle绘制简易版爱心表白,文中有非常详细的代码示例,对想要和男朋友或者女朋友表白的小伙伴们有很大帮助哟,需要的朋友可以参考下
    2021-04-04
  • python shutil.move移动文件或目录方式

    python shutil.move移动文件或目录方式

    `shutil.move()`函数可以移动文件或目录,移动目录时,如果目标目录不存在,会创建该目录并将源目录内容移动到新目录;如果目标目录存在,则将源目录移动到目标目录下,移动文件时,如果目标路径是目录,则将文件移动到该目录下并重命名
    2024-12-12
  • 用Python实现批量生成法务函代码

    用Python实现批量生成法务函代码

    大家好,本篇文章主要讲的是用Python实现批量生成法务函代码,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下
    2022-02-02
  • python实现差分隐私Laplace机制详解

    python实现差分隐私Laplace机制详解

    今天小编就为大家分享一篇python实现差分隐私Laplace机制详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-11-11
  • Python实现带图形界面的炸金花游戏

    Python实现带图形界面的炸金花游戏

    诈金花又叫三张牌,是在全国广泛流传的一种民间多人纸牌游戏,它具有独特的比牌规则。本文将通过Python语言实现带图形界面的诈金花游戏,需要的可以参考一下
    2022-12-12
  • Python-Web框架flask使用示例教程

    Python-Web框架flask使用示例教程

    这篇文章主要介绍了Python-Web框架flask使用示例代码,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-07-07
  • 对Python3使运行暂停的方法详解

    对Python3使运行暂停的方法详解

    今天小编就为大家分享一篇对Python3使运行暂停的方法详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-02-02
  • 使用python将时间转换为指定的格式方法

    使用python将时间转换为指定的格式方法

    今天小编就为大家分享一篇使用python将时间转换为指定的格式方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-11-11
  • 如何使用Flask-Migrate拓展数据库表结构

    如何使用Flask-Migrate拓展数据库表结构

    这篇文章主要介绍了如何使用Flask-Migrate拓展数据库表结构,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-07-07
  • python和JavaScript哪个容易上手

    python和JavaScript哪个容易上手

    在本篇文章里小编给大家分享的是一篇关于python和JavaScript哪个容易上手的相关知识点文章,有兴趣的朋友们可以学习下。
    2020-06-06

最新评论