pd.DataFrame中的几种索引变换的实现

更新时间：2022年06月16日 11:11:49 作者：小数志

本文主要介绍了pd.DataFrame中的几种索引变换的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

导读：pandas中最常用的数据结构是DataFrame，而DataFrame相较于嵌套list或者二维numpy数组更好用的原因之一在于其提供了行索引和列名。本文主要介绍行索引的几种变换方式，包括rename与reindex、index.map、set_index与reset_index、stack与unstack等。

惯例开局一张图

01 索引简介与样例数据

Series和DataFrame是pandas中的主要数据结构类型（老版本中曾有三维数据结构Panel，是DataFrame的容器，后被取消），而二者相较于传统的数组或list而言，最大的便利之处在于其提供了索引，DataFrame中还有列标签名，这些都使得在操作一行或一列数据中非常方便，包括在数据访问、数据处理转换等。关于索引的详细介绍可参考前文：python数据科学系列：pandas入门详细教程。

这里，为了便于后文举例解释，给出基本的DataFrame样例数据如下：

后文将以此作为操作对象，针对索引的几种常用变换进行介绍。

注：这里的索引应广义的理解为既包扩行索引，也包括列标签。

02 reindex和rename

学习pandas之初，reindex和rename容易使人混淆的一组接口，就其具体功能来看：

reindex执行的是索引重组操作，接收一组标签序列作为新索引，既适用于行索引也适用于列标签名，重组之后索引数量可能发生变化，索引名为传入标签序列
rename执行的是索引重命名操作，接收一个字典映射或一个变换函数，也均适用于行列索引，重命名之后索引数量不发生改变，索引名可能发生变化

另外二者执行功能和接收参数的套路也是很为相近的，均支持两种变换方式：

一种是变换内容+axis指定作用轴（可选0/1或index/columns）；
另一种是直接用index/columns关键字指定作用轴

具体而言，reindex执行索引重组操作，以新接收的一组标签序列作为索引，当原DataFrame中存在该索引时则提取相应行或列，否则赋值为空或填充指定值。对于前面介绍的示例数据df，以重组行索引为例，两种可选方式为：

注意到原df中行索引为[1, 3, 5]，而新重组的目标索引为[1, 2, 3]，其中[1, 3]为已有索引直接提取，[2, 4]在原df中不存在，所以填充空值；同时，原df中索引[5]由于不在指定索引中，所以遭舍弃。进一步地，由于重组后可能存在空值，reindex提供了填充空值的可选参数fill_value和method，二者用法与fillna方法一致，前者用于指定固定值填充，后者用于指定填充策略，例如：

rename用法套路与reindex很为相近，但执行功能完全不同，主要用于执行索引重命名操作，接收一个字典或一个重命名规则的函数类型，示例如下：

03 index.map

针对DataFrame中的数据，pandas中提供了一对功能有些相近的接口：map和apply，以及applymap，其中map仅可用于DataFrame中的一列（也即即Series），可接收字典或函数完成单列数据的变换；apply既可用于一列（即Series）也可用于多列（即DataFrame），但仅可接收函数作为参数，当作用于Series时对每个元素进行变换，作用于DataFrame时对其中的每一行或每一列进行变换；而applymap则仅可作用于DataFrame，且作用对象是对DataFrame中的每个元素进行变换。也就是说，三者的最大不同在于作用范围以及变换方式的不同。

实际上，apply和map还有一个细微区别在于：同样是可作用于单列对象，apply适用于索引这种特殊的单列，而map则不适用。所以，对索引执行变换的另一种可选方式是用map函数，其具体操作方式与DataFrame常规map操作一致，接收一个函数作为参数即可：

04 set_index与reset_index

set_index和reset_index是一对互逆的操作，其中前者用于置位索引——将DataFrame中某一列设置为索引，同时丢弃原索引；而reset_index用于复位索引——将索引加入到数据中作为一列或直接丢弃，可选drop参数。二者是非常常用的一组操作，例如在执行groupby操作后一般会得到一个series类型，此时增加一个reset_index操作即可实现series转换为DataFrame。当然转换的操作不止这一种。

05 stack与unstack

这也是一对互逆的操作，其中stack原义表示堆叠，实现将所有列标签堆叠到行索引中；unstack即解堆，用于将复合行索引中的一个维度索引平铺到列标签中。实际上，二者的操作即是SQL中经典的行转列与列转行，也即在长表与宽表之间转换。

当然，实现unstack操作的方式还有pivot，此处不再展开。

到此这篇关于pd.DataFrame中的几种索引变换的实现的文章就介绍到这了,更多相关pd.DataFrame 索引变换内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

Python使用XPath解析HTML的方法详解
XPath是一种用于选择XML文档中节点的语言，它可以通过路径表达式来定位节点。本文将介绍Python中使用XPath解析HTML文档的方法和技巧，需要的可以参考下
2023-05-05
Python使用文件操作实现一个XX信息管理系统的示例
这篇文章主要介绍了Python使用文件操作实现一个XX信息管理系统的示例，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-07-07
python绘制已知点的坐标的直线实例
今天小编就为大家分享一篇python绘制已知点的坐标的直线实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-07-07
Python文件如何读取read()函数
这篇文章主要介绍了Python文件如何读取read()函数问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2024-02-02
pytorch中关于backward的几个要点说明
这篇文章主要介绍了pytorch中关于backward的几个要点说明，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2023-02-02
pandas apply多线程实现代码
这篇文章主要介绍了pandas apply多线程实现代码，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-08-08
python抓取京东商城手机列表url实例代码
python抓取京东商城手机列表url实例分享，大家参考使用吧
2013-12-12
Python使用Marshmallow轻松实现序列化和反序列化
这篇文章主要为大家详细介绍了Python如何使用Marshmallow轻松实现序列化和反序列化,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下
2025-03-03
python删除本地夹里重复文件的方法
这篇文章主要为大家详细介绍了python删除本地夹里重复文件的方法，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-05-05
Python字典和集合讲解
这篇文章主要给大家假关节的是Python字典和集合，字典是Python内置的数据结构之一，是一个无序的序列；而集合是python语言提供的内置数据结构，没有value的字典，集合类型与其他类型最大的区别在于，它不包含重复元素。想具体了解有关python字典与集合，请看下面文章内容
2021-10-10