必刷大题18统计与统计分析
分值:60分
1.(13分)某地用简单随机抽样的方法抽取15个村进行验收调查,调查得到一组样本数据(xi,yi)(i=1,2,…,15),其中xi和yi分别表示第i个村中村户的年平均收入(单位:万元)和产业资金投入数量(单位:万元),并计算得到15∑i=1xi=15,15∑i=1yi=750,15∑i=1(xi?x)2=0.82,15
(1)试估计该地被调查村的村户年平均收入;(3分)
(2)根据样本数据,求该地被调查村中村户年平均收入与产业资金投入数量的样本相关系数;(精确到0.01)(5分)
(3)根据现有统计资料,各被调查村产业资金投入差异很大.为了准确地进行验收,请给出一种你认为更合理的抽样方法,并说明理由.(5分)
2.(15分)某学校为提高学生对《红楼梦》的了解,举办了“我知红楼”知识竞赛,现从所有答卷卷面成绩中随机抽取100份作为样本,将样本数据(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],并作出如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;(3分)
(2)求样本数据的第62百分位数;(6分)
(3)已知样本数据落在[50,60)的平均数是52,方差是6;落在[60,70)的平均数是64,方差是3.求这两组数据的总平均数x和总方差s2.(6分)
3.(15分)某校高一年级有男生200人,女生100人.为了解该校全体高一学生的身高信息,按性别比例进行分层随机抽样,抽取总样本量为30的样本,并观测样本的指标值(单位:cm),计算得男生样本的身高平均数为169,方差为39.下表是抽取的女生样本的数据:
抽取次序
1
2
3
4
5
6
7
8
9
10
身高
155
158
156
157
160
161
159
162
169
163
记抽取的第i个女生的身高为xi(i=1,2,3,…,10),样本平均数x=160,方差s2=15.
参考数据:15≈3.9,1592=25281,1692=28561.
(1)若用女生样本的身高频率分布情况代替该校高一女生总体的身高频率分布情况,试估计该校高一女生身高在[160,165]范围内的人数;(4分)
(2)用总样本的平均数和标准差分别估计该校高一学生总体身高的平均数μ和标准差σ,求μ,σ的值;(5分)
(3)如果女生样本数据在(x-2s,x+2s)之外的数据称为离群值,试剔除离群值后,计算剩余女生样本身高的平均数与方差.(6分)
4.(17分)西藏隆子县玉麦乡位于喜马拉雅山脉南麓,地处边疆,山陡路险,交通闭塞.党的十八大以来,该地区政府部门大力开发旅游等产业,建设幸福家园,实现农旅融合,以创建国家全域旅游示范区为牵引,构建“农业+文创+旅游”发展模式,真正把农村建设成为“望得见山、看得见水、记得住乡愁”的美丽乡村,在新政策的影响下,游客越来越多.当地旅游局统计了玉麦乡景区2023年1月份到5月份的接待游客人数y(单位:万人),统计结果如下:
月份x
1
2
3
4
5
接待游客人数y(单位:万人)
1.2
1.8
2.5
3.2
3.8
(1)求样本相关系数r的值,当r0.75时,线性相关程度为较强,请说明月份x与接待游客人数y之间线性关系的强弱;若线性相关,求出y关于x的经验回归方程;(9分)
(2)为打造群众满意的旅游区,该地旅游部门对所推出的报团游和自助游项目进行了深入调查,下表是从接待游客中随机抽取的30位游客的满意度调查表,请将下述2×2列联表补充完整,并依据小概率值α=0.05的独立性检验,分析游客对本地景区的满意度是否与报团游或自助游有关联.(8分)
报团游
自助游
合计
满意
3
18
不满意
5
合计
10
30
附:经验回归方程y^=b^x+a^的斜率及截距的最小二乘估计公式分别为b^=n∑i=1(xi?
附表:
α
0.10
0.05
0.010
0.001
xα
2.706
3.841
6.635
10.828
答案精析
1.解(1)该地被调查村的村户年平均收入的估计值为11515∑i=1xi=1
(2)样本相关系数为
r=15∑i=1(
(3)采用按比例分配的分层随机抽样,理由如下:
由(2)知被调查村的村户年平均收入与该村的产业投入资金有很强的正相关性,
由于各被调查村产业资金投入差异很大,因此被调查村的村户年平均收入差异也很大,
所以采用按比例分配的分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地更准确的验收估计.
2.解(1)由(0.005+0.010+0.020+a+0.025+0.010)×10=1,
解得a=0.030.
(2)因为(0.005+0.010+0.020)×10=0.