必刷大题18统计与统计分析
(分值:60分)
1.(13分)某地用简单随机抽样的方法抽取15个村进行验收调查,调查得到一组样本数据(xi,yi)(i=1,2,…,15),其中xi和yi分别表示第i个村中村户的年平均收入(单位:万元)和产业资金投入数量(单位:万元),并计算得到15Σi=1xi=15,15Σi=1yi=750,15Σi=1(xi?x)2=0.82,15
(1)试估计该地被调查村的村户年平均收入;(4分)
(2)根据样本数据,求该地被调查村中村户年平均收入与产业资金投入数量的样本相关系数;(精确到0.01)(4分)
(3)根据现有统计资料,各被调查村产业资金投入差异很大.为了准确地进行验收,请给出一种你认为更合理的抽样方法,并说明理由.(5分)
解(1)该地被调查村的村户年平均收入的估计值为11515Σi=1xi=1
(2)样本相关系数为
r=15Σi=1(xi?x
(3)采用按比例分配的分层随机抽样,理由如下:
由(2)知被调查村的村户年平均收入与该村的产业投入资金有很强的正相关性,
由于各被调查村产业资金投入差异很大,因此被调查村的村户年平均收入差异也很大,
所以采用按比例分配的分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地更准确的验收估计.
2.(15分)某学校为提高学生对《红楼梦》的了解,举办了“我知红楼”知识竞赛,现从所有答卷卷面成绩中随机抽取100份作为样本,将样本数据(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],并作出如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;(3分)
(2)求样本数据的第62百分位数;(6分)
(3)已知样本数据落在[50,60)的平均数是52,方差是6;落在[60,70)的平均数是64,方差是3.求这两组数据的总平均数x和总方差s2.(6分)
解(1)由(0.005+0.010+0.020+a+0.025+0.010)×10=1,
解得a=0.030.
(2)因为(0.005+0.010+0.020)×10=0.35,
(0.005+0.010+0.020+0.030)×10=0.65,
所以样本数据的第62百分位数在[70,80)内,
可得70+0.62?0.350.3×10=79
所以样本数据的第62百分位数为79.
(3)样本数据落在[50,60)的个数为0.1×100=10,
落在[60,70)的个数为0.2×100=20,
总平均数x=1010+20×52+2010+20×
总方差s2=1010+20[6+(52-60)2]+2010+20[3+(64-60)2
3.(15分)(2024·咸阳模拟)为探究某药物对小鼠的生长抑制作用,将10只小鼠均分为两组:对照组(不加药物)和实验组(加药物),测得10只小鼠的体重(单位:g)如下:
对照组:20.120.120.520.320.5
实验组:20.019.919.820.120.2
对照组和实验组的小鼠体重的样本平均数分别记为x和y,样本方差分别记为s12和
(1)求x,y,s12,
(2)判断该药物对小鼠的生长是否有显著的抑制作用(若x-y≥2s1
解(1)x=20.1+20.1+20.5+20.3+20.55=20.3
s12=15×[(20.1-20.3)2+(20.1-20.3)2+(20.5-20.3)2+(20.3-20.3)2+(20.5-20.3)2]=
y=20.0+19.9+19.8+20.1+20.25=20.0
s22=15×[(20.0-20.0)2+(19.9-20.0)2+(19.8-20.0)2+(20.1-20.0)2+(20.2-20.0)2]
(2)由(1)得x-y=0.3,(x-y)2=0.09,2s12+s2
则(20.052)2=4×0.052=0.2080.09,
所以x-y2s1
所以该药物对小鼠的生长没有显著的抑制作用.
4.(17分)(2025·海口模拟)制定适合自己的学习计划并在学习过程中根据自己的实际情况有效地安排和调整学习方法是一种有效的学习策略.某教师为研究学生制定学习计划并坚持实施和数学成绩之间的关系,得到如下数据:
成绩120分
成绩≤120分
合计
制定学习计划并坚持实施
14
6
20
没有制定学习计划
2
28
30
合计
16
34
50
(1)依据小概率值α=0.001的独立性检验,能否认为“制定学习计划并坚持实施”和“数学成绩高于120分”有关联?(5分)
(2)若该校高三年级每月进行一次月考,该校学生小明在高三开学初认真制定了学习计划,其中一项要求自己每天要把错题至少重做一遍,做对为止.以下为小明坚