python3多重排序处理多数据的示例详解

 更新时间:2024年07月24日 11:15:55   作者:码农研究僧  
Python3的多重排序通常指的是对数据集合按照两个或多个人数属性进行排序的过程,这可以通过将多个排序关键字作为元组传递给内置的sorted()函数或者是使用列表推导式结合lambda函数完成,本文详细分析了python3多重排序处理多数据,需要的朋友可以参考下

前言

主要讲解多种方式的处理,以实际的Demo为主

方法优点缺点
内置 sorted() 函数与 lambda 表达式简单易用,代码简洁
适合处理较小的数据集
对于大型数据集,性能可能不如专用的库高效
operator 模块提高可读性,尤其是在复杂键提取的情况下仍然是基于 sorted() 的实现,对于大型数据集,性能有限
pandas 库高效处理大型数据集
提供丰富的数据操作功能
需要学习和掌握 pandas 库的使用
numpy 库高效处理数值数据
适用于大型数值数据集
对于非数值数据(如字符串),可能不如 pandas 方便

1. 内置 sorted() 函数与 lambda 表达式

提供一个键函数来实现多重排序

键函数可以是一个 lambda 表达式,用来返回一个元组,元组中的每个元素按照优先级进行排序

data = [
    {'name': 'Alice', 'age': 30, 'score': 88},
    {'name': 'Bob', 'age': 25, 'score': 92},
    {'name': 'Charlie', 'age': 30, 'score': 95},
    {'name': 'David', 'age': 25, 'score': 85}
]

# 按 age 和 score 排序,age 升序,score 降序
sorted_data = sorted(data, key=lambda x: (x['age'], -x['score']))

print(sorted_data)

截图大致如下:

sorted() 函数不仅可以处理数字数据,还可以处理字符串和其他非数字数据

通过 lambda 表达式,可以指定任意的排序逻辑

data = [
    {'name': 'Alice', 'department': 'HR', 'role': 'Manager'},
    {'name': 'Bob', 'department': 'Engineering', 'role': 'Developer'},
    {'name': 'Charlie', 'department': 'HR', 'role': 'Assistant'},
    {'name': 'David', 'department': 'Engineering', 'role': 'Manager'}
]

# 按 department 和 role 排序
sorted_data = sorted(data, key=lambda x: (x['department'], x['role']))

print(sorted_data)

数据先按 department 字段排序,再按 role 字段排序

2. operator 模块

from operator import itemgetter

data = [
    {'name': 'Alice', 'age': 30, 'score': 88},
    {'name': 'Bob', 'age': 25, 'score': 92},
    {'name': 'Charlie', 'age': 30, 'score': 95},
    {'name': 'David', 'age': 25, 'score': 85}
]

# 按 age 和 score 排序,age 升序,score 降序
sorted_data = sorted(data, key=itemgetter('age', 'score'), reverse=True)
# 注意:要实现 age 升序,score 降序,我们需要稍作调整
sorted_data = sorted(sorted_data, key=itemgetter('age'))

print(sorted_data)

operator 模块中的 itemgetter 函数也适用于非数字数据的排序

from operator import itemgetter

data = [
    {'name': 'Alice', 'department': 'HR', 'role': 'Manager'},
    {'name': 'Bob', 'department': 'Engineering', 'role': 'Developer'},
    {'name': 'Charlie', 'department': 'HR', 'role': 'Assistant'},
    {'name': 'David', 'department': 'Engineering', 'role': 'Manager'}
]

# 按 department 和 role 排序
sorted_data = sorted(data, key=itemgetter('department', 'role'))

print(sorted_data)

3. pandas 库

大型数据集,使用 pandas 库可以更高效地进行多重排序

import pandas as pd

data = [
    {'name': 'Alice', 'age': 30, 'score': 88},
    {'name': 'Bob', 'age': 25, 'score': 92},
    {'name': 'Charlie', 'age': 30, 'score': 95},
    {'name': 'David', 'age': 25, 'score': 85}
]

df = pd.DataFrame(data)

# 按 age 升序和 score 降序排序
sorted_df = df.sort_values(by=['age', 'score'], ascending=[True, False])

print(sorted_df)

同样可处理非数字

import pandas as pd

data = [
    {'name': 'Alice', 'department': 'HR', 'role': 'Manager'},
    {'name': 'Bob', 'department': 'Engineering', 'role': 'Developer'},
    {'name': 'Charlie', 'department': 'HR', 'role': 'Assistant'},
    {'name': 'David', 'department': 'Engineering', 'role': 'Manager'}
]

df = pd.DataFrame(data)

# 按 department 和 role 排序
sorted_df = df.sort_values(by=['department', 'role'])

print(sorted_df)

4. numpy 库

适用于数值数据

import numpy as np

data = np.array([
    ('Alice', 30, 88),
    ('Bob', 25, 92),
    ('Charlie', 30, 95),
    ('David', 25, 85)
], dtype=[('name', 'U10'), ('age', 'i4'), ('score', 'i4')])

# 按 age 升序和 score 降序排序
sorted_data = np.sort(data, order=['age', 'score'])[::-1]
sorted_data = np.sort(sorted_data, order=['age'])

print(sorted_data)

5. 自定义

某些情况下,可能需要更复杂的排序逻辑,可以定义自定义排序函数并将其传递给 sorted() 函数

data = [
    {'name': 'Alice', 'department': 'HR', 'role': 'Manager'},
    {'name': 'Bob', 'department': 'Engineering', 'role': 'Developer'},
    {'name': 'Charlie', 'department': 'HR', 'role': 'Assistant'},
    {'name': 'David', 'department': 'Engineering', 'role': 'Manager'}
]

# 自定义排序函数
def custom_sort(item):
    return (item['department'], item['role'])

# 按 department 和 role 排序
sorted_data = sorted(data, key=custom_sort)

print(sorted_data)

截图如下:

到此这篇关于python3多重排序处理多数据的示例详解的文章就介绍到这了,更多相关python3多重排序处理多数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 基于python编写的五个拿来就能用的炫酷表白代码分享

    基于python编写的五个拿来就能用的炫酷表白代码分享

    七夕快到了,所以本文小编将给给大家介绍五种拿来就能用的炫酷表白代码,无限弹窗表白,爱心发射,心动表白,玫瑰花等表白代码,需要的小伙伴快来试试吧
    2023-08-08
  • 浅谈使用Python变量时要避免的3个错误

    浅谈使用Python变量时要避免的3个错误

    这篇文章主要介绍了浅谈使用Python变量时要避免的3个错误,还是比较不错的,涉及部分代码分析,以及字典的创建等相关内容,需要的朋友可以参考下。
    2017-10-10
  • matplotlib 生成的图像中无法显示中文字符的解决方法

    matplotlib 生成的图像中无法显示中文字符的解决方法

    这篇文章主要介绍了matplotlib 生成的图像中无法显示中文字符的解决方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-06-06
  • JavaScript中常见的闭包陷阱及解决方案

    JavaScript中常见的闭包陷阱及解决方案

    闭包是 JavaScript 中一个强大而常用的特性,它允许函数访问其外部作用域的变量,即使外部函数已经执行完毕, 然而,闭包的使用也可能引发一些常见的陷阱,本文将深入探讨这些闭包陷阱,并提供相应的解决方案,需要的朋友可以参考下
    2025-05-05
  • Python的Flask框架中web表单的教程

    Python的Flask框架中web表单的教程

    这篇文章主要介绍了Python的Flask框架中web表单的教程,表单是学习各个web框架中的基础知识,需要的朋友可以参考下
    2015-04-04
  • Python坐标轴操作及设置代码实例

    Python坐标轴操作及设置代码实例

    这篇文章主要介绍了Python坐标轴操作及设置代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-06-06
  • Gradio构建交互式Python应用使用示例详解

    Gradio构建交互式Python应用使用示例详解

    这篇文章主要为大家介绍了Gradio构建交互式Python应用使用示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-12-12
  • Pandas中字符串处理的核心方法与正则匹配实战教学

    Pandas中字符串处理的核心方法与正则匹配实战教学

    本文介绍了Pandas中字符串处理的核心方法,重点讲解了str访问器的常用操作技巧,包括字符串分割、拼接、替换与提取等,同时深入讲解了正则表达式的基础语法及其在Pandas中的应用,希望帮助大家掌握高效处理文本数据的技能
    2026-05-05
  • python爬虫开发之selenium模块详细使用方法与实例全解

    python爬虫开发之selenium模块详细使用方法与实例全解

    这篇文章主要介绍了python爬虫开发之selenium模块详细使用方法与实例全解,selenium模块详细在爬虫开发中主要用来解决JavaScript渲染问题需要的朋友可以参考下
    2020-03-03
  • Python中Pytest测试框架的fixture使用详解

    Python中Pytest测试框架的fixture使用详解

    这篇文章主要介绍了Python中Pytest测试框架的fixture使用详解,Pytest的fixture的目的是提供一个测试的基线,在此基线基础上,可以更可靠的进行重复测试,需要的朋友可以参考下
    2023-08-08

最新评论