必刷大题18统计与统计分析
(分值:60分)
1.(13分)某地用简单随机抽样的方法抽取15个村进行验收调查,调查得到一组样本数据(xi,yi)(i=1,2,…,15),其中xi和yi分别表示第i个村中村户的年平均收入(单位:万元)和产业资金投入数量(单位:万元),并计算得到15Σi=1xi=15,15Σi=1yi=750,15Σi=1(xi?x)2=0.82,15
(1)试估计该地被调查村的村户年平均收入;(4分)
(2)根据样本数据,求该地被调查村中村户年平均收入与产业资金投入数量的样本相关系数;(精确到0.01)(4分)
(3)根据现有统计资料,各被调查村产业资金投入差异很大.为了准确地进行验收,请给出一种你认为更合理的抽样方法,并说明理由.(5分)
2.(15分)某学校为提高学生对《红楼梦》的了解,举办了“我知红楼”知识竞赛,现从所有答卷卷面成绩中随机抽取100份作为样本,将样本数据(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],并作出如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;(3分)
(2)求样本数据的第62百分位数;(6分)
(3)已知样本数据落在[50,60)的平均数是52,方差是6;落在[60,70)的平均数是64,方差是3.求这两组数据的总平均数x和总方差s2.(6分)
3.(15分)(2024·咸阳模拟)为探究某药物对小鼠的生长抑制作用,将10只小鼠均分为两组:对照组(不加药物)和实验组(加药物),测得10只小鼠的体重(单位:g)如下:
对照组:20.120.120.520.320.5
实验组:20.019.919.820.120.2
对照组和实验组的小鼠体重的样本平均数分别记为x和y,样本方差分别记为s12和
(1)求x,y,s12,
(2)判断该药物对小鼠的生长是否有显著的抑制作用(若x-y≥2s1
4.(17分)(2025·海口模拟)制定适合自己的学习计划并在学习过程中根据自己的实际情况有效地安排和调整学习方法是一种有效的学习策略.某教师为研究学生制定学习计划并坚持实施和数学成绩之间的关系,得到如下数据:
成绩120分
成绩≤120分
合计
制定学习计划并坚持实施
14
6
20
没有制定学习计划
2
28
30
合计
16
34
50
(1)依据小概率值α=0.001的独立性检验,能否认为“制定学习计划并坚持实施”和“数学成绩高于120分”有关联?(5分)
(2)若该校高三年级每月进行一次月考,该校学生小明在高三开学初认真制定了学习计划,其中一项要求自己每天要把错题至少重做一遍,做对为止.以下为小明坚持实施计划的月份和他在学校数学月考成绩的校内名次数据:
月考时间
11月初
12月初
次年1月初
次年2月初
次年3月初
时间代码x
1
2
3
4
5
月考校内名次y
881
857
729
569
475
①求月考校内名次y与时间代码x的经验回归方程y^=b^x+
②该校老师给出了该校上一年学生高考(6月初考试)数学成绩在校内的名次和在全省名次的部分数据:
校内名次w
5
100
200
300
全省名次u
20
257
666
2780
利用数据分析软件,得出了两个回归模型和决定系数R2:
模型A
模型B
u^=9.5w
u^=28
R2≈0.7927
R2≈0.9973
在以上两个模型中选择“较好”模型(说明理由),并结合问题①的经验回归方程,依据“较好”模型预测小明如果能坚持实施学习计划,他在次年高考中数学成绩的全省名次(名次均保留整数).(6分)
参考数据及公式:e2.272≈9.7,e2.432≈11.4,e0.672≈2.0,5Σi=1xiyi=9
χ2=n(ad?bc)2(a+b)(
α
0.05
0.01
0.005
0.001
xα
3.841
6.635
7.879
10.828
b^=nΣi=1(xi?x)(
答案精析
1.解(1)该地被调查村的村户年平均收入的估计值为11515Σi=1xi=1
(2)样本相关系数为
r=15Σ
35.30.82×1670
(3)采用按比例分配的分层随机抽样,理由如下:
由(2)知被调查村的村户年平均收入与该村的产业投入资金有很强的正相关性,
由于各被调查村产业资金投入差异很大,因此被调查村的村户年平均收入差异也很大,
所以采用按比例分配的分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地更准确的验收估计.
2.解(1)由(0.005+0.010+0.020+a+0.025+0.010)×10=1,
解得a=0.030.
(2)因为(0.005+0.010+0.020)×10=0.35,
(