基本信息
文件名称:Python数据分析基础与应用(微课版)课件 8.2 Pandas随机抽样.pptx
文件大小:234.82 KB
总页数:5 页
更新时间:2025-06-20
总字数:约小于1千字
文档摘要
Python数据分析基础与应用模块8Pandas时间序列操作与应用
8.2Pandas随机抽样
在Pandas中,如果想要对数据集进行随机抽样,需要使用sample()函数。sample()函数的语法格式如下:DataFrame.sample(n=None,frac=None,replace=False,weights=None,random_state=None,axis=None)
该函数参数说明如下所示:?n:表示要抽取的行数。?frac:表示抽取的比例,例如frac=0.5,代表抽取总体数据的50%。?replace:布尔类型参数,表示是否以有放回抽样的方式进行选择,默认值为False,取出数据后不再放回。?weights:为可选参数,代表每个样本的权重值,参数值是字符串或者数组。?random_state:为可选参数,控制随机状态,默认值为None,表示随机数据不会重复;若该参数的值设置为1则表示会取得重复数据。?axis:表示在哪个方向上抽取数据,axis=1表示列方向抽取数据,axis=0表示行方向抽取数据。该函数返回与数据集类型相同的新对象,相当于numpy.random.choice()。
快乐学习高效学习祝学习进步!