R语言如何实现数据抽样

2024-10-19 21:04:34

1、读取数据集。这里以一个简单的数据集为例。stu_data屏顿幂垂=data.frame(group=c("1班"荑樊综鲶,"2班","2班","1班","1班","2班","1班","2班"),age=c(">18","16-18","<16","16-18","16-18","16-18","16-18","16-18"),sex=c("F","M","F","F","M","M","F","M"),score=c(100,92,91,88,81,80,75,66))stu_data

R语言如何实现数据抽样

3、有放回随机抽样。sample2=sample(nrow(stu_data),6,replace=T) #有放回地随机抽样data2=stu_data[sample2,] #得到抽样数据集data2#查看抽样数据集由于是有放回地,所以存在部分重复样本。重复的数据会有".1"、".2"等后缀标记,显示这条数据是重复抽了几次。

R语言如何实现数据抽样

5、各层概率不相等的系统抽样。sample4=strata(stu_data,stratanames="group",size=c(1,3),method="systematic",pik=stu_data$score) #分层抽样中method选择系统抽样,pik为各层中个样本的抽样概率sample4 #查看抽样结果getdata(stu_data,sample4) #获取抽样数据集从结果中可以看出,score取值越大的,被抽到的概率越高。

R语言如何实现数据抽样
猜你喜欢