pandas中按行或列的值对数据排序的实现

 更新时间:2023年02月27日 09:25:36   作者:宁萌Julie  
本文主要介绍了pandas中按行或列的值对数据排序的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

在处理表格型数据时,常会用到排序,比如,按某一行或列的值对表格排序,要怎么做呢?

这就要用到 pandas 中的 sort_values() 函数。

一、 按列的值对数据排序

先来看最常见的情况。

1.按某一列的值对数据排序

以下面的数据为例。

import pandas as pd
df_col = pd.DataFrame({'Name':['Paul','Richard', 'Betty',  'Philip','Anna'],
        'course1':[85,83,90,84,85],
        'course2':[90,82,79,71,86],
        'sport':['basketball', 'Volleyball', 'football', 'Basketball','baseball']},
         index=[1,2,3,4,5])  
df_col
Namecourse1course2sport
1Paul8590basketball
2Richard8382Volleyball
3Betty9079football
4Philip8471Basketball
5Anna8586baseball

在 sort_values() 函数中设置 by='列名',即可以按这一列值的顺序重新排列行。

df_sort=df_col.sort_values(by='course2')
df_sort
Namecourse1course2sport
4Philip8471Basketball
3Betty9079football
2Richard8382Volleyball
5Anna8586baseball
1Paul8590basketball

如以上结果所示,默认是升序排列。还可以做降序排列,在 sort_values() 函数中设置 ascending=False 即可。例如:

df_sort=df_col.sort_values(by='course2',ascending=False)
df_sort
Namecourse1course2sport
1Paul8590basketball
5Anna8586baseball
2Richard8382Volleyball
3Betty9079football
4Philip8471Basketball

2. 按多列的值对数据排序

您是否遇到过这种情况:要排序的某一列数据有相同的值,此时结果会怎么样呢?我们来看下面的例子。

df_sort=df_col.sort_values(by='course1')
df_sort
Namecourse1course2sport
2Richard8382Volleyball
4Philip8471Basketball
1Paul8590basketball
5Anna8586baseball
3Betty9079football

从结果看到,“course1” 有两个相同的值 85,此时会依据 index 的先后顺序排列。

那如果不想按 index 顺序,想要自己设定相同值的排序方式,应该怎么做呢?

可以设置第二列,对于第一列的相同值,参照第二列的值排序。例如:

df_sort=df_col.sort_values(by=['course1','course2'])
df_sort
Namecourse1course2sport
2Richard8382Volleyball
4Philip8471Basketball
5Anna8586baseball
1Paul8590basketball
3Betty9079football

可以看到,by 参数中的第二列 “course2” 只在第一列 “course1” 中有相同值时起作用,因此只有 “Anna” 和 “Paul” 所在的这两行数据位置互换,其它行位置不变。

3. key 参数:设置排序时的数据变换函数

在实际中还可能会遇到这种情况,数据中大小写都有,比如例子数据的 “sport” 列。按这一列对数据排序,结果如下:

df_sort=df_col.sort_values(by=['sport'])
df_sort
Namecourse1course2sport
4Philip8471Basketball
2Richard8382Volleyball
5Anna8586baseball
1Paul8590basketball
3Betty9079football

看结果发现,大写字母排在小写字母前面,因此 “Volleyball” 所在行排在 “baseball” 所在行前面,但这并不是我们想要的排序结果。那应该怎么做,才能按字母顺序排序呢?

可以设置 sort_values() 函数的 key 参数。

df_sort=df_col.sort_values(by=['sport'],key=lambda col:col.str.lower())
df_sort
Namecourse1course2sport
5Anna8586baseball
1Paul8590basketball
4Philip8471Basketball
3Betty9079football
2Richard8382Volleyball

此时的排序结果就是按字母顺序排列。

4. 修改原数据

前面介绍的操作中,每次都生成了一个新的数据 df_sort,并没有改变原数据。

df_col
Namecourse1course2sport
1Paul8590basketball
2Richard8382Volleyball
3Betty9079football
4Philip8471Basketball
5Anna8586baseball

但是,有时可能数据太大,而原数据后续不再使用。为了节省空间,想直接在原数据上改动。应该怎么办呢?

只要在 sort_values() 函数中设置 inplace=True。

df_col.sort_values(by='course2',inplace=True)
df_col
Namecourse1course2sport
4Philip8471Basketball
3Betty9079football
2Richard8382Volleyball
5Anna8586baseball
1Paul8590basketball

二、 按行的值对数据排序

需要注意的是,这种情况只适用于各列数据类型相同的情况,例如下面例子中的数据,每一列数据都是数值型。而前面例子的数据既有数值型,又有字符型,无法按行的值排序。

df_row = pd.DataFrame({
        'course1':[91,85,90,84,92],
        'course2':[72,81,76,71,79],
        'course3':[93,85,88,94,86]},
         index=['Paul','Richard', 'Betty',  'Philip','Anna'])
df_row
course1course2course3
Paul917293
Richard858185
Betty907688
Philip847194
Anna927986

按行的值排序时,设置 by 参数为某行的 index 名,并且 axis=1。

df_sort=df_row.sort_values(by='Anna',axis=1)
df_sort
course2course3course1
Paul729391
Richard818585
Betty768890
Philip719484
Anna798692

按行值排序在 sort_values() 函数中设置 ascending, key, inplace 等参数的方式都与前面介绍的按列值排序相同。这里仅以按多行的值对数据排序为例。

df_sort=df_row.sort_values(by=['Richard','Paul'],axis=1,ascending=False)
df_sort
course3course1course2
Paul939172
Richard858581
Betty889076
Philip948471
Anna869279

参考

1.https://www.geeksforgeeks.org/sort-rows-or-columns-in-pandas-dataframe-based-on-values/#courses

2.https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.sort_values.html

到此这篇关于pandas中按行或列的值对数据排序的实现的文章就介绍到这了,更多相关pandas 按行或列的值对数据排序内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 深入理解python Matplotlib库的高级特性

    深入理解python Matplotlib库的高级特性

    Matplotlib是一款极其强大的Python数据可视化库,这篇文章中,我们将深入讨论 Matplotlib 的一些高级特性,包括对象导向接口、自定义颜色映射和样式、动态图形等,感兴趣的小伙伴跟着小编一起来探讨吧
    2023-07-07
  • python 判断linux进程,并杀死进程的实现方法

    python 判断linux进程,并杀死进程的实现方法

    今天小编就为大家分享一篇python 判断linux进程,并杀死进程的实现方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07
  • Python OpenCV图像颜色变换示例

    Python OpenCV图像颜色变换示例

    大家好,本篇文章主要讲的是Python OpenCV图像颜色变换示例,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下
    2022-01-01
  • 关于Python Socket编程的要点详解

    关于Python Socket编程的要点详解

    Socket是网络编程的一个抽象概念,通常我们用一个Socket表示“打开了一个网络链接”,而打开一个Socket需要知道目标计算机的IP地址和端口号,再指定协议类型即可,这篇文章主要给大家介绍了关于Python Socket编程的相关资料,需要的朋友可以参考下
    2021-08-08
  • 关于tf.TFRecordReader()函数的用法解析

    关于tf.TFRecordReader()函数的用法解析

    今天小编就为大家分享一篇关于tf.TFRecordReader()函数的用法解析,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02
  • Python之str操作方法(详解)

    Python之str操作方法(详解)

    下面小编就为大家带来一篇Python之str操作方法(详解)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-06-06
  • Django后端接收嵌套Json数据及解析详解

    Django后端接收嵌套Json数据及解析详解

    这篇文章主要介绍了Django后端接收嵌套Json数据及解析详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-07-07
  • Python综合应用名片管理系统案例详解

    Python综合应用名片管理系统案例详解

    这篇文章主要介绍了Python综合应用名片管理系统,结合具体案例形式详细分析了Python名片管理系统相关步骤、原理、实现方法与操作注意事项,需要的朋友可以参考下
    2020-01-01
  • Python五种下划线详解

    Python五种下划线详解

    这篇文章主要介绍了Python下划线5种含义实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2021-10-10
  • Python实现链表反转的方法分析【迭代法与递归法】

    Python实现链表反转的方法分析【迭代法与递归法】

    这篇文章主要介绍了Python实现链表反转的方法,结合实例形式分析了Python迭代法与递归法实现链表反转的相关操作技巧与注意事项,需要的朋友可以参考下
    2020-02-02

最新评论