pandas中DataFrame重置索引的几种方法

更新时间：2021年05月24日 14:20:31 作者：Jayson

在pandas中，经常对数据进行处理而导致数据索引顺序混乱，从而影响数据读取、插入等，所以小编总结了几种索引重置的方法，需要的朋友们下面随着小编来一起学习学习吧

在pandas中，经常对数据进行处理而导致数据索引顺序混乱，从而影响数据读取、插入等。

小笔总结了以下几种重置索引的方法：

import pandas as pd
import numpy as np

df = pd.DataFrame(np.arange(20).reshape((5, 4)),columns=['a', 'b', 'c', 'd'])
#得到df：
     a    b    c    d
0    0    1    2    3
1    4    5    6    7
2    8    9    10   11
3    12   13   14   15
4    16   17   18   19

# 对其重排顺序，得到索引顺序倒序的数据
df2 = df.sort_values('a', ascending=False)
# 得到df2：
     a    b     c     d
4    16   17    18    19
3    12   13    14    15
2    8    9     10    11
1    4    5     6     7
0    0    1     2     3

下面对df2重置索引，使其索引从0开始

法一：

简单粗暴：

df2.index = range(len(df2))

# 输出df2：
     a     b     c     d
0    16    17    18    19
1    12    13    14    15
2    8     9     10    11
3    4     5     6     7
4    0     1     2     3

法二：

df2 = df2.reset_index(drop=True)  # drop=True表示删除原索引，不然会在数据表格中新生成一列'index'数据
# 输出df2：
     a     b     c     d
0    16    17    18    19
1    12    13    14    15
2    8     9     10    11
3    4     5     6     7
4    0     1     2     3

法三：

df2 = df2.reindex(labels=range(len(df))  #labels是第一个参数，可以省略
# 输出df2
     a     b     c     d
0    16    17    18    19
1    12    13    14    15
2    8     9     10    11
3    4     5     6     7
4    0     1     2     3

# 注：df = df.reindex(index=[])，在原数据结构上新建行（index是新索引，若新建数据索引在原数据中存在，则引用原有数据），默认用NaN填充(使用fill_value=0 来修改填充值自定义，此处我设置的是0)。
# df = df.reindex(columns=[])，在原数据结构上新建列，方法与新建行一样

法四：

df2 = df2.set_index(keys=['a', 'c'])  # 将原数据a, c列的数据作为索引。
# drop=True，默认，是将数据作为索引后，在表格中删除原数据
# append=False，默认，是将新设置的索引设置为内层索引，原索引是外层索引

# 输出df2，注意a,c列是索引:
            b     d
a     c        
16    18    17    19
12    14    13    15
8     10    9     11
4     6     5     7
0     2     1     3

到此这篇关于pandas中DataFrame重置索引的几种方法的文章就介绍到这了,更多相关pandas DataFrame重置索引内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

python实战项目scrapy管道学习爬取在行高手数据
这篇文章主要为介绍了python实战项目scrapy管道学习拿在行练手爬虫项目，爬取在行高手数据，本篇博客的重点为scrapy管道pipelines的应用，学习时请重点关注
2021-11-11
基于python判断字符串括号是否闭合{}[]()
这篇文章主要介绍了基于python判断字符串括号是否闭合{}[](),文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-09-09
python读取TXT到数组及列表去重后按原来顺序排序的方法
这篇文章主要介绍了python读取TXT到数组及列表去重后按原来顺序排序的方法,涉及Python操作txt文件、列表去重及排序的相关技巧,需要的朋友可以参考下
2015-06-06
Python常见的几种数据加密方式
这篇文章主要分享的是Python常见的几种数据加密方式，主要包括线性散列算法（签名算法）MD5，sha1、对称性加密算法 AES DES、非对称性加密算法 RSA，具体详细内容介绍，需要的小伙伴可以参考一下
2022-06-06
Python中使用Selenium环境安装的方法步骤
这篇文章主要介绍了Python中使用Selenium环境安装的方法步骤，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2021-02-02
flask 使用 flask_apscheduler 做定时循环任务的实现
这篇文章主要介绍了flask 使用 flask_apscheduler 做定时循环任务的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2019-12-12
解决python报错MemoryError的问题
今天小编就为大家分享一篇解决python报错MemoryError的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-06-06
解读NumPy数组与Python列表的比较
在Python中处理数值数据时,可以选择使用Python列表或NumPy数组,Python列表灵活,可存储不同类型元素,但在大数据处理上可能较慢,NumPy数组固定类型,内存连续存储,执行数组操作如加法、乘法等更高效,尤其在大数据集处理上具有明显的性能和内存使用优势
2024-10-10
Python项目管理工具Rye的工作原理
在开发Python项目时，有时会在一台电脑上，同时存在多个python项目，而且每个项目的python版本和依赖可能都不一样，此时需要使用python项目管理工具来进行管理，rye是一个python项目管理工具，本文简单介绍rye的工作原理
2023-07-07
Python VTK映射三维模型表面距离
这篇文章主要介绍了Python VTK映射三维模型表面距离，通过如何使用VTK读取图片计算两个三维模型(stl)的表面距离，并将其距离值映射到模型上展开主题,需要的朋友可以参考一下
2022-04-04

pandas中DataFrame重置索引的几种方法

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具