python 如何在list中找Topk的数值和索引

 更新时间:2021年05月20日 09:57:30   作者:lwgkzl  
这篇文章主要介绍了python 如何在list中找Topk的数值和索引的操作,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

需求:

对于一个python list 或者numpy数组,我需要找到这个list中最大的K个数及其对应的下标。

解决方式:

1. 可以构造字典通过排序解决,不过代码量较多。

2. 使用heapq库,可以直接获取最大值的下标和数值。

import heapq
a = [4,2,6,1,9,9]
 
# 获取下标, 输出为[4, 5, 2]
heapq.nlargest(3, range(len(a)), a.__getitem__)
 
# 获取数值, 输出为[9, 9, 6]
heapq.nlargest(3,a)

如果要取最小的数,使用 nsmallest即可

补充:Python 利用中间值求TopK 算法

算法思想

首先我们要思考,我要做什么?解决什么问题?

TopK问题,找出一组数据中的前K个最大值或者最小值,这个数据是否重复?要做去重处理?

ok 我们明确我们做什么了 ,那介绍的python处理的topK 算法过程是怎么样的呢?

如果用排序那就没必要引入topK 了,当数据强大的时候选取TopK 可以省略很多排序的计算,至于有多优化自己去思考下,就比如排列组合的C,A的区别,一个是抽取,一个是抽取并排列…

以下以找出TopK 的最大值为例,最小值的可以自己修改一下下就可以

介绍的算法思想是利用中间值,将数列分为三部分 ,

【比中间值大的列表】,中间值,【比中间值小的列表】

那么我们当比较

【比中间值大的列表】的个数 == k

的时候就可以得出前K个最大值了,因此

重点就是找出这个中间值

如何找出中间值

以列表的第一个数开始为中间值,拆分为三部分

if 【比中间值大的列表】的个数 == k:return 中间值 #程序出口,结束。

if 【比中间值大的列表】的个数 < k :

·····继续在【比中间值小的列表】找

·····K - 【比中间值大的列表】的个数 -1 个数

(为什么要减一,1是前一次的中间值,分的三部分,前部分后部分都没有包含中间值,因此…)

if 【比中间值大的列表】的个数 > k :

…也就是说比中间值大的列表比K还大,那就在这个列表中继续找就行

结合代码和注释看

如果要找最小值,只需要改一下就ok ,还可以设置一个布尔值的输入,来做前K个最大值最小值

#2019 11 04
#author 半斤地瓜烧
#TopK 算法,找出序列中前K个最大值的
#输入一个seq
# 输出以seq[0]为中间值 划分的三个部分,中间值,比这个值大的seq ,比这个值小的seq,
# 即splitNum,theBig,theSmall
def Split_Seq(seq):
    splitNum = seq[0]
    seq = seq[1:]#两个部分都不包含中间值,因此切片去除seq[0]
    theBig = [x for x in seq if x >= splitNum]
    theSmall = [x for x in seq if x < splitNum]
    return splitNum,theBig,theSmall
#找出中间值
def topKNum(seq,k):
    splitNum, theBig, theSmall = Split_Seq(seq)
    theBigLen = len(theBig)
    
    if  k == theBigLen:
        return splitNum#出口,返回这个中间值,
    # 为什么不直接返回thebig?因为存在递归的原因thebig 不是在初始的seq找出来的
    #需要重新Split,即可,读者自己思考
    # 大值的列表中还未够K个数的情况,
    if k > theBigLen:
        return topKNum(theSmall,k-theBigLen-1)
    # 大值的列表中大于K个数的情况
    return topKNum(theBig,k)
#由中间值找出TopK个值,<list>
def getTopK(seq,k):
    
    return [i for i in seq if i > topKNum(seq, k)]
if __name__ == '__main__':
    alist = [7, 3, 5, 1,885,234,2211,222,22, 2, 11, 2, 115]
    print("===为了验证,引入排序观看===", sorted(alist,reverse= True))
    print(getTopK(alist, 3))

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • pandas表连接 索引上的合并方法

    pandas表连接 索引上的合并方法

    今天小编就为大家分享一篇pandas表连接 索引上的合并方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06
  • python利用百度AI实现文字识别功能

    python利用百度AI实现文字识别功能

    这篇文章主要为大家详细介绍了python利用百度AI实现文字识别,主要涉及通用文字识别、网络图片文字识别、身份证识别等文字识别功能,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-11-11
  • Python设计模式之工厂方法模式实例详解

    Python设计模式之工厂方法模式实例详解

    这篇文章主要介绍了Python设计模式之工厂方法模式,结合实例形式较为详细的分析了工厂方法模式的概念、原理、用法及相关操作技巧,需要的朋友可以参考下
    2019-01-01
  • 使用pandas或numpy处理数据中的空值(np.isnan()/pd.isnull())

    使用pandas或numpy处理数据中的空值(np.isnan()/pd.isnull())

    这篇文章主要介绍了使用pandas或numpy处理数据中的空值(np.isnan()/pd.isnull()),具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-05-05
  • 详解sklearn Preprocessing 数据预处理功能

    详解sklearn Preprocessing 数据预处理功能

    这篇文章主要介绍了sklearn Preprocessing 数据预处理功能,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-08-08
  • 使用python matplotlib画折线图实例代码

    使用python matplotlib画折线图实例代码

    Matplotlib是一个Python工具箱,用于科学计算的数据可视化,下面这篇文章主要给大家介绍了关于如何使用python matplotlib画折线图的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-04-04
  • python中abs&map&reduce简介

    python中abs&map&reduce简介

    map与reduce是两个十分常用的Python内置函数,它们与Hadoop中的MapReduce在某些方面有一定的相似之处。
    2018-02-02
  • python使用turtle库绘制奥运五环

    python使用turtle库绘制奥运五环

    turtle也叫海龟,是turtle绘图体系的python实现,这篇文章主要介绍了python使用turtle库绘制奥运五环,本文通过实例代码给大家介绍的非常详细,需要的朋友可以参考下
    2020-02-02
  • Django+Vue实现文件上传下载的项目实践

    Django+Vue实现文件上传下载的项目实践

    本文主要介绍了Django+Vue实现文件上传下载的项目实践,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-06-06
  • Python的Tornado框架实现异步非阻塞访问数据库的示例

    Python的Tornado框架实现异步非阻塞访问数据库的示例

    Tornado框架的异步非阻塞特性是其最大的亮点,这里我们将立足于基础来介绍一种简单的Python的Tornado框架实现异步非阻塞访问数据库的示例:
    2016-06-06

最新评论