python如何实现排序,并标上序号

 更新时间:2022年06月10日 10:35:59   作者:Jepson2017  
这篇文章主要介绍了python如何实现排序,并标上序号,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

python排序并标上序号

需求:利用python实现排序功能

测试数据:data.csv

"id","date","amount"
"1","2019-02-08","6214.23"
"1","2019-02-08","6247.32"
"1","2019-02-09","85.63"
"2","2019-02-14","943.18"
"2","2019-02-15","369.76"
"2","2019-02-18","795.15"
"2","2019-02-19","715.65"
"2","2019-02-21","537.71"
"2","2019-02-24","1037.71"
"3","2019-02-09","967.36"
"3","2019-02-10","85.69"
"3","2019-02-12","769.85"
"3","2019-02-13","943.86"
"3","2019-02-19","843.86"
"3","2019-02-11","85.69"
"3","2019-02-14","843.86"
"1","2019-02-10","985.63"
"1","2019-02-09","285.63"
"1","2019-02-11","1285.63"

第一种常见排序: 将上面数据按照amount字段进行排序

import pandas as pd
filename="data.csv"
df=pd.read_csv(filename)
#增加一个rank排序字段
df['rank']=df['amount'].rank(ascending=0, method='first')

说明:ascending :1 表示升序,0表示降序

method:此参数的作用是,当遇到两个值相同时,排序处理的方式。可以取的值有 first、max、min、dense

(1)method =‘first’ 时

表示排序时,序号不会重复且是连续的,遇到相同的值时,会按照数据的先后顺序标序号,如下图:

df['rank']=df['amount'].rank(ascending=0, method='first')
print(df)

(2)method='min’时

表示排序时,遇到相同的值时,后面数的序号与最先出现的数的序号保持一致,如下图,843.86值重复两次,排名均为9,且排序中没有序号10(序号不连续)

df['rank']=df['amount'].rank(ascending=0, method='min')
print(df)

(3)method='max’时

表示排序时,遇到相同的值时,后面数的序号与最后出现的数的序号保持一致,如下图,843.86值重复两次,排名均为10,且排序中没有序号9(序号不连续)

df['rank']=df['amount'].rank(ascending=0, method='max')
print(df)

(4)method='dense’时

表示排序时,遇到相同的值时,重复值序号保持一致,如下图,843.86值重复两次,排名均为9,且下一个数序号为10,序号保持连续

df['rank']=df['amount'].rank(ascending=0, method='dense')
print(df)

第二种常见排序:组内排序 ,将上面数据根据id分组,并按照amount字段进行组内排序

df['rank']=df['amount'].groupby(df['id']).rank(ascending=0, method='dense')
#对结果按照id和rank进行升序排列
data=df.sort_values(by=['id','rank'],ascending=(1,1))

Python常见排序算法汇总

所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。排序算法,就是如何使得记录按照要求排列的方法。

排序的稳定性

经过某种排序后,如果两个记录序号同等,且两者在原无序记录中的先后秩序依然保持不变,则称所使用的排序方法是稳定的,反之是不稳定的。

内排序和外排序

  • 内排序:排序过程中,待排序的所有记录全部放在内存中
  • 外排序:排序过程中,使用到了外部存储。

通常讨论的都是内排序。

影响内排序算法性能的三个因素:

  • 时间复杂度:即时间性能,高效率的排序算法应该是具有尽可能少的关键字比较次数和记录的移动次数
  • 空间复杂度:主要是执行算法所需要的辅助空间,越少越好。
  • 算法复杂性。主要是指代码的复杂性。

Python常用排序算法

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • opencv3/C++图像像素操作详解

    opencv3/C++图像像素操作详解

    今天小编就为大家分享一篇opencv3/C++图像像素操作详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • python安装numpy&安装matplotlib& scipy的教程

    python安装numpy&安装matplotlib& scipy的教程

    下面小编就为大家带来一篇python安装numpy&安装matplotlib& scipy的教程。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-11-11
  • Python实现自动生成请假条

    Python实现自动生成请假条

    这篇文章主要为大家详细介绍了如何实现用Python来批量生成请假条,这回既学了东西又做了事情,两不误!感兴趣的小伙伴可以跟随小编一起学习一下
    2022-12-12
  • Python判断变量是否是None写法代码实例

    Python判断变量是否是None写法代码实例

    这篇文章主要介绍了Python判断变量是否是None写法代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-10-10
  • Python3+SQLAlchemy+Sqlite3实现ORM教程

    Python3+SQLAlchemy+Sqlite3实现ORM教程

    这篇文章主要介绍了Python3+SQLAlchemy+Sqlite3实现ORM教程,需要的朋友可以参考下
    2021-02-02
  • Python中OTSU算法的原理与实现详解

    Python中OTSU算法的原理与实现详解

    OTSU算法是大津展之提出的阈值分割方法,又叫最大类间方差法,本文主要为大家详细介绍了OTSU算法的原理与Python实现,感兴趣的小伙伴可以了解下
    2023-12-12
  • Python 中的 global 标识对变量作用域的影响

    Python 中的 global 标识对变量作用域的影响

    global 标识用于在函数内部,修改全局变量的值。这篇文章主要介绍了Python 的 global 标识对变量作用域的影响,需要的朋友可以参考下
    2019-08-08
  • Python  PYQT界面点击按钮随机变色功能

    Python  PYQT界面点击按钮随机变色功能

    遇到这样的需求写一个pyqt界面,要求界面有一个按钮,每次点击这个按钮,就会生成一个10以内的随机数,当随机数出现的时候,界面底色要变成对应的颜色,同时要求随机数会在界面中展示出来,并且按钮和数字的颜色不会改变,下面给大家分享源代码,一起看看吧
    2024-08-08
  • Ruby使用eventmachine为HTTP服务器添加文件下载功能

    Ruby使用eventmachine为HTTP服务器添加文件下载功能

    这篇文章主要介绍了Ruby使用eventmachine为HTTP服务器添加文件下载功能的实例,同时作者也分享了Windows上eventmachine安装报错问题的解决方法,需要的朋友可以参考下
    2016-04-04
  • python 数据分析实现长宽格式的转换

    python 数据分析实现长宽格式的转换

    这篇文章主要介绍了python 数据分析实现长宽格式的转换,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-05-05

最新评论