pandas应用实例之pivot函数详解

 更新时间:2022年07月04日 15:38:16   作者:superY25  
最近在做基于python的数据分析工作,引用第三方数据分析库pandas,所以下面这篇文章主要给大家介绍了关于pandas应用实例之pivot函数的相关资料,文中通过图文介绍的非常详细,需要的朋友可以参考下

1、pivot函数的定义

pivot(index=None,columns=None,values=None) -> DataFrame

2、pivot函数的说明

通过给定的索引(index)和列(column)的值重新生一个DataFrame对象。

根据列值对数据进行整形(生成一个“透视”表)。从指定的索引/列中使用唯一的值来形成结果数据帧的轴。此函数不支持数据聚合,多个值将导致列中的多索引。

3、pivo函数的参数

index:指定一列做为生成DataFrame对象的索引,如果为空则默认为原来的索引。

columns:指定一列的值作为列名,必须传值。

values:指定一列作为生成DataFrame对象的值。可以为空。

4、pivot函数实例

df = pd.DataFrame({'foo': ['one', 'one', 'one', 'two', 'two', 'two'],
                    'bar': ['A', 'B', 'C', 'A', 'B', 'C'],
                    'baz': [1, 2, 3, 4, 5, 6],
                    'zoo': ['x', 'y', 'z', 'q', 'w', 't']})

# 指定foo的值为新dataframe的index,bar的值为columns,dataframe中对应的值为baz
df.pivot(index='foo', columns='bar', values='baz')

# 没有指定value,列名最外层保留原来的列,如下结果baz和zoo为原dataframe中的列名,新指定的列名bar在里层(暂时这么理解)。
df.pivot(index='foo', columns='bar')

# 可以通过索引的方式取指定的列数据
df.pivot(index='foo', columns='bar')['baz']

# 可以指定多个values
df.pivot(index='foo', columns='bar', values=['baz', 'zoo'])

# 指定多个columns
df.pivot(index='foo', columns=['bar','baz'], values=['zoo'])

# 指定多个index
df.pivot(index=['foo','bar'], columns='baz', values='zoo')

# 指定多个index可以通过index名取当个index的数据
df.pivot(index=['foo','bar'], columns='baz', values='zoo').loc["one",:]

# 这两行代码运行将会报错。
# 报错提示:ValueError: Index contains duplicate entries, cannot reshape
# 意思是指定的索引one有两个列bar=A冲突了。
df = pd.DataFrame({"foo": ['one', 'one', 'two', 'two'],
                   "bar": ['A', 'A', 'B', 'C'],
                   "baz": [1, 2, 3, 4]})
df.pivot(index='foo', columns='bar', values='baz')

5、pivot函数在实际工作中解决的案例

现在要上图中的不同code之间从2020-11-16到2020-11-18三天内num序列数的相关性。

首先,dataframe对象可以直接调用函数corr()计算不同列之间的相关性,所以现在需要将原始的dataframe对象转换成以code为列,date为索引,num为值的dataframe。
第一种比较笨的方法就是循环,此方法不但代码量较多而且在数据量很大时会比较耗时。不建议使用。

grouped = df.groupby(by=["code"])
df_num = pd.DataFrame()
for name,group in grouped:
    d = pd.Series(data=group["num"].values,name=name)
    df_num = pd.concat([df_num,d],axis=1)

df_close

第二种方法就是使用pivot函数,一行代码解决,运行快速。

df_num = df.pivot(index='date',columns='code',values='num')

想要的形式的dataframe生成了就可以直接调用corr()函数直接求出code之间的相关性了

# 计算列之间的相关性
df_num.corr()

总结

到此这篇关于pandas应用实例之pivot函数的文章就介绍到这了,更多相关pandas pivot函数内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python之生产者消费者模型实现详解

    python之生产者消费者模型实现详解

    这篇文章主要介绍了python之生产者消费者模型实现详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-07-07
  • Python3.x和Python2.x的区别介绍

    Python3.x和Python2.x的区别介绍

    python3.x与python2.x区别很大,这里搜索了一些相关内容,记录在此,供自己学习参考,有需要的朋友不妨看看
    2013-02-02
  • python for循环如何实现控制步长

    python for循环如何实现控制步长

    这篇文章主要介绍了python for循环如何实现控制步长,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-05-05
  • Python3实现统计单词表中每个字母出现频率的方法示例

    Python3实现统计单词表中每个字母出现频率的方法示例

    这篇文章主要介绍了Python3实现统计单词表中每个字母出现频率的方法,涉及Python针对文件的读取、遍历、统计等相关操作技巧,需要的朋友可以参考下
    2019-01-01
  • python动态加载技术解析

    python动态加载技术解析

    这篇文章主要介绍了python动态加载技术解析,说简单点就是,如果开发者发现自己的代码有bug,那么他可以在不关闭原来代码的基础之上,动态替换模块替换方法一般用reload来完成,需要的朋友可以参考下
    2023-07-07
  • django轻松使用富文本编辑器CKEditor的方法

    django轻松使用富文本编辑器CKEditor的方法

    最近由于需要在django admin中使用到富文本编辑器,由于我比较喜欢CKEditor富文本编辑器,于是就有了这篇文章,下面这篇文章主要给大家介绍了在django中轻松使用富文本编辑器CKEditor的方法,需要的朋友可以参考下。
    2017-03-03
  • 可视化工具PyVista多线程显示多窗口的实例代码

    可视化工具PyVista多线程显示多窗口的实例代码

    这篇文章主要介绍了可视化工具PyVista多线程显示多窗口,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-04-04
  • 分享Python字符串关键点

    分享Python字符串关键点

    字符串是 Python 中最常用的数据类型。我们可以使用引号来创建字符串,通过本篇文章给大家分享python字符串关键点相关资料,感兴趣的朋友一起学习吧
    2015-12-12
  • 在python中对变量判断是否为None的三种方法总结

    在python中对变量判断是否为None的三种方法总结

    今天小编就为大家分享一篇在python中对变量判断是否为None的三种方法总结,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • pytorch保存和加载模型的方法及如何load部分参数

    pytorch保存和加载模型的方法及如何load部分参数

    本文总结了pytorch中保存和加载模型的方法,以及在保存的模型文件与新定义的模型的参数不一一对应时,我们该如何加载模型参数,对pytorch保存和加载模型相关知识感兴趣的朋友一起看看吧
    2024-03-03

最新评论