基本信息
文件名称:第九章 必刷大题18 统计与统计分析.docx
文件大小:49.91 KB
总页数:5 页
更新时间:2025-06-12
总字数:约3.04千字
文档摘要

必刷大题18统计与统计分析

[分值:60分]

1.(13分)某地用简单随机抽样的方法抽取15个村进行验收调查,调查得到一组样本数据(xi,yi)(i=1,2,…,15),其中xi和yi分别表示第i个村中村户的年平均收入(单位:万元)和产业资金投入数量(单位:万元),并计算得到15∑i=1xi=15,15∑i=1yi=750,15∑i=1(xi?x)2=0.82,15

(1)试估计该地被调查村的村户年平均收入;(3分)

(2)根据样本数据,求该地被调查村中村户年平均收入与产业资金投入数量的样本相关系数;(精确到0.01)(5分)

(3)根据现有统计资料,各被调查村产业资金投入差异很大.为了准确地进行验收,请给出一种你认为更合理的抽样方法,并说明理由.(5分)

解(1)该地被调查村的村户年平均收入的估计值为11515∑i=1xi=1

(2)样本相关系数为

r=15∑i=1(

(3)采用按比例分配的分层随机抽样,理由如下:

由(2)知被调查村的村户年平均收入与该村的产业投入资金有很强的正相关性,

由于各被调查村产业资金投入差异很大,因此被调查村的村户年平均收入差异也很大,

所以采用按比例分配的分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地更准确的验收估计.

2.(15分)某学校为提高学生对《红楼梦》的了解,举办了“我知红楼”知识竞赛,现从所有答卷卷面成绩中随机抽取100份作为样本,将样本数据(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],并作出如图所示的频率分布直方图.

(1)求频率分布直方图中a的值;(3分)

(2)求样本数据的第62百分位数;(6分)

(3)已知样本数据落在[50,60)的平均数是52,方差是6;落在[60,70)的平均数是64,方差是3.求这两组数据的总平均数x和总方差s2.(6分)

解(1)由(0.005+0.010+0.020+a+0.025+0.010)×10=1,

解得a=0.030.

(2)因为(0.005+0.010+0.020)×10=0.35,

(0.005+0.010+0.020+0.030)×10=0.65,

所以样本数据的第62百分位数在[70,80)内,

可得70+0.62?0.350.3×10=79

所以样本数据的第62百分位数为79.

(3)样本数据落在[50,60)的个数为0.1×100=10,

落在[60,70)的个数为0.2×100=20,

总平均数x=1010+20×52+20

总方差s2=1010+20[6+(52-60)2]+2010+20[3+(64-60)2

3.(15分)某校高一年级有男生200人,女生100人.为了解该校全体高一学生的身高信息,按性别比例进行分层随机抽样,抽取总样本量为30的样本,并观测样本的指标值(单位:cm),计算得男生样本的身高平均数为169,方差为39.下表是抽取的女生样本的数据:

抽取次序

1

2

3

4

5

6

7

8

9

10

身高

155

158

156

157

160

161

159

162

169

163

记抽取的第i个女生的身高为xi(i=1,2,3,…,10),样本平均数x=160,方差s2=15.

参考数据:15≈3.9,1592=25281,1692=28561.

(1)若用女生样本的身高频率分布情况代替该校高一女生总体的身高频率分布情况,试估计该校高一女生身高在[160,165]范围内的人数;(4分)

(2)用总样本的平均数和标准差分别估计该校高一学生总体身高的平均数μ和标准差σ,求μ,σ的值;(5分)

(3)如果女生样本数据在(x-2s,x+2s)之外的数据称为离群值,试剔除离群值后,计算剩余女生样本身高的平均数与方差.(6分)

解(1)因为女生样本中,身高在[160,165]范围内的频率为410

故该校高一女生身高在[160,165]范围内的人数估计为100×25

(2)记总样本的平均数为X,标准差为S,

由题意,设男生样本(20人)的身高平均数为

y=169,方差为sy2

女生样本(10人)的身高平均数为

x=160,方差s2=15,

则X=20

S2=23[39+(169-166)2]+13[15+(160-166)

=23×48+13×

故μ≈166,σ≈S2

(3)由x=160,s=15,则(x-2s,x+2s),

即(160-215,160+215),

约为(152.2,167.8),由样本数据知,169?(160-215,160+215),为离群值,

剔除169后,女生样本(9人)的身高平均数为

x=19(160×10-169)

由s2=110(10∑i=1xi2-10x2)=110(