Python中的heapq模块解析

 更新时间:2023年09月13日 10:48:10   作者:Yake1965  
这篇文章主要介绍了Python中的heapq模块解析,heapq模块是Python标准库中的一个模块,用于实现堆队列(heapq)数据结构,它提供了一种方便的方式来实现堆排序等算法,需要的朋友可以参考下

heapq堆队列算法

这个模块提供了堆队列算法的实现,也称为优先队列算法。

堆是一个二叉树,每个父节点的值 ≤ \le ≤ 所有孩子节点的值。 用数组实现:从零开始计数,对于所有的 k ,都有 heap[k] ≤ \le ≤ heap[2k+1] 和 heap[k] ≤ \le ≤ heap[2k+2]。 最小的元素总是在根结点:heap[0]。

heapq.heapify(x) # 将list x 转换成堆,原地,线性时间内。
heapq.heappush(heap, item) # 将 item 的值加入 heap 中,保持堆的不变性。
heapq.heappop(heap) 
#弹出并返回 heap 的最小的元素,保持堆的不变性。如果堆为空,抛出 IndexError 。使用 heap[0] ,可以只访问最小的元素而不弹出它。
heapq.heappushpop(heap, item) 
#将 item 放入堆中,然后弹出并返回 heap 的最小元素。该组合操作比先调用 heappush() 再调用 heappop() 运行起来更有效率。
heapq.heapreplace(heap, item) 
#弹出并返回 heap 中最小的一项,同时推入新的 item。堆的大小不变。如果堆为空则引发 IndexError。

这个单步骤操作比 heappop() 加 heappush() 更高效,并且在使用固定大小的堆时更为适宜。 pop/push 组合总是会从堆中返回一个元素并将其替换为 item。

返回的值可能会比添加的 item 更大。 如果不希望如此,可考虑改用 heappushpop()。 它的 push/pop 组合会返回两个值中较小的一个,将较大的值留在堆中。

该模块还提供了三个基于堆的通用功能函数。

heapq.merge(*iterables, key=None, reverse=False)
#将多个已排序的输入合并为一个已排序的输出(例如,合并来自多个日志文件的带时间戳的条目)。 返回已排序值的 iterator。

类似于 sorted(itertools.chain(*iterables)) 但返回一个可迭代对象,不会一次性地将数据全部放入内存,并假定每个输入流都是已排序的(从小到大)。

具有两个可选参数,它们都必须指定为关键字参数。

key 指定带有单个参数的 key function,用于从每个输入元素中提取比较键。 默认值为 None (直接比较元素)。

reverse 为一个布尔值。 如果设为 True,则输入元素将按比较结果逆序进行合并。 要达成与 sorted(itertools.chain(*iterables), reverse=True) 类似的行为,所有可迭代对象必须是已从大到小排序的。

heapq.nlargest(n, iterable, key=None)
#从 iterable 所定义的数据集中返回前 n 个最大元素组成的列表。 如果提供了 key 则其应指定一个单参数的函数,用于从 iterable 的每个元素中提取比较键 (例如 key=str.lower)。 等价于: sorted(iterable, key=key, reverse=True)[:n]。
heapq.nsmallest(n, iterable, key=None)
#从 iterable 所定义的数据集中返回前 n 个最小元素组成的列表。 如果提供了 key 则其应指定一个单参数的函数,用于从 iterable 的每个元素中提取比较键 (例如 key=str.lower)。 等价于: sorted(iterable, key=key)[:n]。

后两个函数在 n 值较小时性能最好。 对于更大的值,使用 sorted() 函数会更有效率。 此外,当 n==1 时,使用内置的 min() 和 max() 函数会更有效率。 如果需要重复使用这些函数,请考虑将可迭代对象转为真正的堆。

一、heapq 创建堆

import heapq 
array = [10, 17, 50, 7, 30, 24, 27, 45, 15, 5, 36, 21]
heap = []
for num in array:
    heapq.heappush(heap, num)
print("array:", array)
print("heap: ", heap)
heapq.heapify(array)
print("array:", array)
# array: [10, 17, 50, 7, 30, 24, 27, 45, 15, 5, 36, 21]
# heap:  [5, 7, 21, 15, 10, 24, 27, 45, 17, 30, 36, 50]
# array: [5, 7, 21, 10, 17, 24, 27, 45, 15, 30, 36, 50]

heapq 中创建堆的方法有两种:

  1. heappush(heap, num),先创建一个空堆,然后将数据一个一个地添加到堆中。
  2. heapify(array),直接将数据列表调整成一个小顶堆。

二、堆排序

可以通过将所有值推入堆中然后每次弹出一个最小值项来实现。

def heapsort(iterable):
    h = []
    for value in iterable:
        heappush(h, value)
    return [heappop(h) for i in range(len(h))]
heapsort([1, 3, 5, 7, 9, 2, 4, 6, 8, 0])

这类似于 sorted(iterable),但与 sorted() 不同的是这个实现是不稳定的

堆元素可以为元组。 这适用于将比较值(例如任务优先级)与跟踪的主记录进行赋值的场合:

 h = []
 heappush(h, (5, 'write code'))
 heappush(h, (7, 'release product'))
 heappush(h, (1, 'write spec'))
 heappush(h, (3, 'create tests'))
 heappop(h)
(1, 'write spec')

先将待排序列表中的数据添加到堆中,构造一个小顶堆,打印第一个数据,可以确认它是最小值。然后依次将堆顶的值取出,添加到一个新的列表中,直到堆中的数据取完,新列表就是排序后的列表。

heappop(heap),将堆顶的数据出堆,并将堆中剩余的数据构造成新的小顶堆。

三、获取堆中的最小值或最大值

array = [10, 17, 50, 7, 30, 24, 27, 45, 15, 5, 36, 21]
heapq.heapify(array)
print(heapq.nlargest(2, array))
print(heapq.nsmallest(3, array))

四、使用heapq合并两个有序列表

array_a = [10, 7, 15, 8]
array_b = [17, 3, 8, 20, 13]
array_merge = heapq.merge(sorted(array_a), sorted(array_b))
print("merge result:", list(array_merge))

五、heapq 替换数据的方法

array_c = [10, 7, 15, 8]
heapq.heapify(array_c)
print("before:", array_c)
# 先 push 再 pop
item = heapq.heappushpop(array_c, 5)
print("after: ", array_c)
print(item)
array_d = [10, 7, 15, 8]
heapq.heapify(array_d)
print("before:", array_d)
# 先 pop 再 push
item = heapq.heapreplace(array_d, 5)
print("after: ", array_d)
print(item)

到此这篇关于Python中的heapq模块解析的文章就介绍到这了,更多相关heapq模块解析内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python 对xml解析的示例

    python 对xml解析的示例

    这篇文章主要介绍了python 如何对xml解析,帮助大家更好的理解和学习使用python,感兴趣的朋友可以了解下
    2021-02-02
  • Python 数据库操作 SQLAlchemy的示例代码

    Python 数据库操作 SQLAlchemy的示例代码

    这篇文章主要介绍了Python 数据库操作 SQLAlchemy的示例代码,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-02-02
  • 在pycharm中使用git版本管理以及同步github的方法

    在pycharm中使用git版本管理以及同步github的方法

    今天小编就为大家分享一篇在pycharm中使用git版本管理以及同步github的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • Python for循环与getitem的关系详解

    Python for循环与getitem的关系详解

    这篇文章主要介绍了Python for循环与getitem的关系详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-01-01
  • Python将文件映射到内存使用mmap.mmap()函数方式

    Python将文件映射到内存使用mmap.mmap()函数方式

    这篇文章主要介绍了Python将文件映射到内存使用mmap.mmap()函数方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-02-02
  • Python实现平行坐标图的绘制(plotly)方式

    Python实现平行坐标图的绘制(plotly)方式

    今天小编就为大家分享一篇Python实现平行坐标图的绘制(plotly)方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-11-11
  • 对django 2.x版本中models.ForeignKey()外键说明介绍

    对django 2.x版本中models.ForeignKey()外键说明介绍

    这篇文章主要介绍了对django 2.x版本中models.ForeignKey()外键说明介绍,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • 彻底搞懂 python 中文乱码问题(深入分析)

    彻底搞懂 python 中文乱码问题(深入分析)

    现在有的小伙伴为了躲避中文乱码的问题甚至代码中不使用中文,注释和提示都用英文,我曾经也这样干过,但这并不是解决问题,而是逃避问题,今天我们一起彻底解决 Python 中文乱码的问题
    2020-02-02
  • Django模型修改及数据迁移实现解析

    Django模型修改及数据迁移实现解析

    这篇文章主要介绍了Django模型修改及数据迁移实现解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-08-08
  • Python ORM框架Peewee用法详解

    Python ORM框架Peewee用法详解

    这篇文章主要介绍了Python ORM框架Peewee用法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-04-04

最新评论