浅析pandas随机排列与随机抽样

时间:2021-05-23

随机排列

利用 numpy.random.permutation() 函数,可以返回一个序列的随机排列。将此随机排列作为 take() 函数的参数,通过应用 take() 函数就可实现按此随机排列来调整 Series 对象或 DataFrame 对象各行的顺序。
其示例代码 example1.py 如下:

import numpy as npimport pandas as pd#创建DataFramedf = pd.DataFrame(np.arange(12).reshape(4,3))print(df) 0 1 20 0 1 21 3 4 52 6 7 83 9 10 11#创建随机排列order = np.random.permutation(4)#通过随机排列调整DataFrame各行顺序newDf = df.take(order)print(newDf) 0 1 22 6 7 83 9 10 110 0 1 21 3 4 5

随机抽样

随机抽样是指随机从数据中按照一定的行数或者比例抽取数据。随机抽样的函数如下:

numpy.random.randint(start,end,size)

函数中的参数说明如下:

  • start:随机数的开始值;
  • end:随机数的终止值;
  • size:抽样个数。

通过 numpy.random.randint() 函数产生随机抽样的数据,通过应用 take() 函数就可实现随机抽取 Series 对象或 DataFrame 对象中的数据。其示例代码 example2.py 如下

import numpy as npimport pandas as pd#创建DataFramedf = pd.DataFrame(np.arange(12).reshape(4,3))print(df)0 1 20 0 1 21 3 4 52 6 7 83 9 10 11#随机抽样order = np.random.randint(0,len(df),size=3)#通过随机抽样抽取DataFrame中的行newDf = df.take(order)print(newDf)0 1 20 0 1 21 3 4 51 3 4 5

以上就是详解pandas随机排列与随机抽样的详细内容,更多关于pandas随机排列与随机抽样的资料请关注其它相关文章!

声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。

相关文章