Python之random.sample()和numpy.random.choice()的优缺点说明

 更新时间:2023年06月14日 16:54:08   作者:Javy Wang  
这篇文章主要介绍了Python之random.sample()和numpy.random.choice()的优缺点说明,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

对比

python中random.sample()方法可以随机地从指定列表中提取出N个不同的元素,列表的维数没有限制

有文章指出:在实践中发现,当N的值比较大的时候,该方法执行速度很慢。

可以用numpy random模块中的choice方法来提升随机提取的效率。

有问题,从该文章看不出来random.sample方法比choice方法慢多少,我自己仿真倒是发现random.sample方法比choice方法快的多,后面会举例说明

numpy.random.choice() 对抽样对象有要求,必须是整数或者一维数组(列表),不能对超过一维的数据进行抽样,这是其缺点。

random.sample() 和 numpy.random.choice() 的优点都是可以指定抽样的个数,一次性从列表中不重复地抽样出指定个数的元素,其中 random.sample()默认就是不重复抽样(不放回的抽样),而numpy.random.choice()默认是可以重复抽样,要想不重复地抽样,需要设置replace参数为False,用法如下:

补充

前面说random.sample方法比choice方法快的多,下面附图为证。

更新

有博友留言说,numpy.random.choice()与 random.sample() 两者适合的情况不同,建议增加抽样数量再试试,下面是逐步增加抽样数量后的结果。

列表元素为100000个,抽样个数为9。

抽样个数为1000。

抽样个数为10000。

抽样个数为50000。

从以上实验来看,numpy.random.choice()抽样方法的时间几乎不会随着抽样数量的变化而变化,而random.sample() 会随着抽样数量的增加而增加。

所以当数量较少的时候,random.sample() 用时非常少,而numpy.random.choice()则很长;当抽样数量很大的时候,numpy.random.choice()几乎不变,而random.sample() 用时变长。

简单绘制一下测试结果,如下所示

从图上可以看到,numpy.random.choice()的用时确实保持不变,而random.sample() 用时会随着抽样比例的增加而线性增长。

总结

从对象类型上看,random.sample方法比numpy.random.choice方法适用范围广。

从速度上看,当抽样数量小的时候,random.sample方法比numpy.random.choice方法快很多;当抽样数量很大的时候,random.sample方法就不如numpy.random.choice方法了。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • 最新tensorflow与pytorch环境搭建的实现步骤

    最新tensorflow与pytorch环境搭建的实现步骤

    深度学习相关的热门框架主要为Tensorflow和Pytorch,本文主要介绍了搭建最新tensorflow与pytorch环境,具有一定的参考价值,感兴趣的可以了解一下
    2024-04-04
  • 关于Pyinstaller打包eel和pygame需要注意的坑

    关于Pyinstaller打包eel和pygame需要注意的坑

    这篇文章主要介绍了关于Pyinstaller打包eel和pygame需要注意的坑,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-02-02
  • Python利用Spire.PDF for Python库抽取PDF文档文本

    Python利用Spire.PDF for Python库抽取PDF文档文本

    在当今数字化的世界中,PDF无疑是最普遍的文档格式之一,无论是报告、合同、发票还是学术论文,PDF都承载着海量的信息,本文将深入探讨如何利用Spire.PDF for Python库,高效、准确地从PDF文档中提取文本,需要的朋友可以参考下
    2026-02-02
  • python使用MkDocs自动生成文档的操作方法

    python使用MkDocs自动生成文档的操作方法

    python代码注释风格有很多,比较主流的有 reStructuredText风格、numpy风格、Google风格,自动生成文档的工具也有很多,常见的有:Pydocs,Sphinx和MkDocs,本文给大家介绍了python使用MkDocs自动生成文档的操作方法,需要的朋友可以参考下
    2024-06-06
  • python中pip安装、升级包使用及说明

    python中pip安装、升级包使用及说明

    文章主要介绍了在Centos和Ubuntu系统中使用pip进行包管理的操作,包括查看、安装、升级、卸载包,指定版本号安装,一次性安装多个包等操作,并提供了相关命令和注意事项
    2026-05-05
  • 关于Python中 循环器 itertools的介绍

    关于Python中 循环器 itertools的介绍

    循环器是对象的容器,包含有多个对象。通过调用循环器的next()方法 (__next__()方法,在Python 3.x中),循环器将依次返回一个对象。直到所有的对象遍历穷尽,循环器将举出StopIteration错误。这篇文章将对此做一个详细介绍,感兴趣的小伙伴请参考下面文字内容
    2021-09-09
  • python小程序基于Jupyter实现天气查询的方法

    python小程序基于Jupyter实现天气查询的方法

    这篇文章主要介绍了python小程序基于Jupyter实现天气查询的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-03-03
  • python tkinter界面居中显示的方法

    python tkinter界面居中显示的方法

    今天小编就为大家分享一篇python tkinter界面居中显示的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-10-10
  • python 列表、字典和集合的添加和删除操作

    python 列表、字典和集合的添加和删除操作

    今天小编就为大家分享一篇python 列表、字典和集合的添加和删除操作,有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • Pandas实现Dataframe的合并

    Pandas实现Dataframe的合并

    我们知道,在使用pandas处理数据的时候,往往会需要合并两个或者多个DataFrame的操作,那么本文就来介绍一下Pandas实现Dataframe的合并,感兴趣的可以了解一下
    2021-06-06

最新评论