Pandas实现(pivot_table函数)数据透视表方式

 更新时间:2024年09月10日 16:26:21   作者:呀~吼  
pandas的pivot_table()函数非常强大,主要用于创建数据透视表,重要参数包括index、values、columns和aggfunc,index用于设置行索引,类似于SQL中的group by,values用于进行聚合计算的数据选择,columns参数可设置列层次,非必须

Pandas (pivot_table函数)数据透视表

使用pandas中的pivot_table()实现数据透视表。

语法格式如下:

pd.pivot_table(data,values=None,index=None,
			   columns=None,aggfunc='mean',fill_value=None,margins=False,dropna=True,
			   margins_name='All')

pd.pivot_table()有四个最重要的参数index、values、columns、aggfunc。

四个最重要参数解析

index

  • 相当于SQL里的group by用于分组的字段,相当于行索引。
  • index也是层次字段,要通过透视表获取什么信息就按照相应的顺序设置字段。
pd.pivot_table(data,index=['列名1','列名2'])

values

  • 相当于SQL里对列进行聚合计算
  • 对需要的计算数据进行筛选
pd.pivot_table(data,index=['列名1','列名2'],values=['计算列名1','计算列名2','计算列名3'])

columns

  • columns类似index可以设置列层次字段
  • 它不是一个必要参数,作为一种分割数据的可选方式
pd.pivot_table(data,index=['列名1','列名2'],
				values=['计算列名1','计算列名2','计算列名3'],columns=['列名3'])

aggfunc

  • aggfunc参数可以设置对数据聚合时进行的函数操作。
  • 对于aggfunc参数,操作的是values后面的值,而不是columns后面的值。
  • 分别对values参数中的每一列都进行求和与求平均值。
pd.pivot_table(data,index=['列名1','列名2'],
				values=['计算列名1','计算列名2','计算列名3'],aggfunc=[np.sum,np.mean])

fill_value:当数据为空时,填充的指定值。fill_value=0 

注意

  • aggfunc也可以使用dict类型,这样可以指定values中每一列的聚合函数。
  • 如果dict中的内容与values不匹配时,以dict中为准。
table=pd.pivot_table(data,index=['列名1','列名2'],columns=['列名3'],
					values=['计算列名1','计算列名2','计算列名3'],
					aggfunc={'计算列名1':np.mean,'计算列名2':[min, max, np.mean]},fill_value=0)

结果就是’计算列名2’求min,max和mean,'计算列名1’求mean,而’计算列名3’没有显示。

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Python使用sqlalchemy模块连接数据库操作示例

    Python使用sqlalchemy模块连接数据库操作示例

    这篇文章主要介绍了Python使用sqlalchemy模块连接数据库操作,结合实例形式分析了sqlalchemy模块的安装及连接、调用数据库相关操作技巧,需要的朋友可以参考下
    2019-03-03
  • 人脸检测——基于Flask和PaddleHub

    人脸检测——基于Flask和PaddleHub

    这篇文章详细介绍了基于Flask和PaddleHub来进行人脸检测,想详细了解的朋友可以参考阅读
    2023-03-03
  • 简要讲解Python编程中线程的创建与锁的使用

    简要讲解Python编程中线程的创建与锁的使用

    这篇文章主要介绍了简要讲解Python编程中线程的创建与锁的使用,Python中虽然有GIL的存在,但依然是能够创建多个线程来交替使用的,需要的朋友可以参考下
    2016-02-02
  • VSCode中Python环境配置、创建虚拟环境及pip的一些常用命令

    VSCode中Python环境配置、创建虚拟环境及pip的一些常用命令

    这篇文章主要给大家介绍了关于VSCode中Python环境配置、创建虚拟环境及pip的一些常用命令,Python环境的创建是在VSCode中很常见的一个需求,特别是当我们需要开发或者调试多个Python项目时,使用虚拟环境是一种好的方式,需要的朋友可以参考下
    2023-10-10
  • python实现布隆过滤器及原理解析

    python实现布隆过滤器及原理解析

    布隆过滤器( BloomFilter )是一种数据结构,比较巧妙的概率型数据结构(probabilistic data structure),特点是高效地插入和查询,可以用来告诉你 “某样东西一定不存在或者可能存在”。这篇文章主要介绍了python实现布隆过滤器 ,需要的朋友可以参考下
    2019-12-12
  • Python time.time()方法

    Python time.time()方法

    这篇文章主要介绍了详解Python中time.time()方法的使用的教程,是Python入门学习中的基础知识,需要的朋友可以参考下,希望能给你带来帮助
    2021-08-08
  • TensorFlow和Numpy矩阵操作中axis理解及axis=-1的解释

    TensorFlow和Numpy矩阵操作中axis理解及axis=-1的解释

    在调用numpy库中的concatenate()时,有遇到axis=-1/1/0的情况,下面这篇文章主要给大家介绍了关于TensorFlow和Numpy矩阵操作中axis理解及axis=-1解释的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-03-03
  • python缺失值填充方法示例代码

    python缺失值填充方法示例代码

    常见的数据缺失填充方式分为很多种,比如删除法、均值法、回归法、KNN、MICE、EM等,下面这篇文章主要给大家介绍了关于python缺失值填充方法的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下
    2022-12-12
  • python计算一个序列的平均值的方法

    python计算一个序列的平均值的方法

    这篇文章主要介绍了python计算一个序列的平均值的方法,涉及Python递归遍历与数学计算的相关技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-07-07
  • python selenium如何防止被浏览器检测

    python selenium如何防止被浏览器检测

    随着浏览器安全策略的不断完善,如何有效地防止Selenium在自动化测试过程中被浏览器检测到,成为了开发者们面临的一个新的挑战,下面小编来和大家探讨一下Selenium在防止被浏览器检测方面的技巧吧
    2025-05-05

最新评论