浅析pandas随机排列与随机抽样
随机排列
利用 numpy.random.permutation() 函数,可以返回一个序列的随机排列。将此随机排列作为 take() 函数的参数,通过应用 take() 函数就可实现按此随机排列来调整 Series 对象或 DataFrame 对象各行的顺序。
其示例代码 example1.py 如下:
import numpy as np import pandas as pd #创建DataFrame df = pd.DataFrame(np.arange(12).reshape(4,3)) print(df) 0 1 2 0 0 1 2 1 3 4 5 2 6 7 8 3 9 10 11 #创建随机排列 order = np.random.permutation(4) #通过随机排列调整DataFrame各行顺序 newDf = df.take(order) print(newDf) 0 1 2 2 6 7 8 3 9 10 11 0 0 1 2 1 3 4 5
随机抽样
随机抽样是指随机从数据中按照一定的行数或者比例抽取数据。随机抽样的函数如下:
numpy.random.randint(start,end,size)
函数中的参数说明如下:
- start:随机数的开始值;
- end:随机数的终止值;
- size:抽样个数。
通过 numpy.random.randint() 函数产生随机抽样的数据,通过应用 take() 函数就可实现随机抽取 Series 对象或 DataFrame 对象中的数据。其示例代码 example2.py 如下
import numpy as np import pandas as pd #创建DataFrame df = pd.DataFrame(np.arange(12).reshape(4,3)) print(df) 0 1 2 0 0 1 2 1 3 4 5 2 6 7 8 3 9 10 11 #随机抽样 order = np.random.randint(0,len(df),size=3) #通过随机抽样抽取DataFrame中的行 newDf = df.take(order) print(newDf) 0 1 2 0 0 1 2 1 3 4 5 1 3 4 5
以上就是详解pandas随机排列与随机抽样的详细内容,更多关于pandas随机排列与随机抽样的资料请关注脚本之家其它相关文章!
相关文章
python GUI库图形界面开发之PyQt5开发环境配置与基础使用
这篇文章主要介绍了python GUI库图形界面开发之PyQt5开发环境配置与基础使用,需要的朋友可以参考下2020-02-02
Python Django安装配置模板系统及使用实战全面详解
本文首先介绍了Django模板系统的基础知识,接着探讨了如何安装和配置Django模板系统,然后深入解析了Django模板的基本结构、标签和过滤器的用法,阐述了如何在模板中展示模型数据,最后使用一个实际项目的例子来演示如何在实际开发中使用Django模板系统2023-09-09


最新评论