§9.3一元线性回归模型及其应用
课标要求1.了解样本相关系数的统计含义.2.了解最小二乘法原理,掌握一元线性回归模型参数的最小二乘估计方法.3.针对实际问题,会用一元线性回归模型进行预测.
1.变量的相关关系
(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)相关关系的分类:正相关和负相关.
(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
2.样本相关系数
(1)r=nΣ
(2)当r0时,称成对样本数据正相关;当r0时,称成对样本数据负相关.
(3)|r|≤1;当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.
3.一元线性回归模型
(1)我们将y^=b^x+a^称为Y
其中b
(2)残差:观测值减去预测值所得的差称为残差.
1.判断下列结论是否正确.(请在括号中打“√”或“×”)
(1)相关关系是一种非确定性关系.(√)
(2)散点图是判断两个变量相关关系的一种重要方法和手段.(√)
(3)经验回归直线y^=b^x+a^至少经过(x1,y1),(x2,y2),…,(xn,yn)中的一个点.(
(4)样本相关系数越小,成对样本数据的线性相关程度越弱.(×)
2.(多选)下列说法正确的是()
A.若两个具有线性相关关系的变量的相关性越强,则样本相关系数r的值越接近于1
B.当r=1时,两变量呈函数关系
C.当经验回归方程为y^=0.3-0.7x时,变量x和y
D.在经验回归方程y^=0.4+0.5x中,当x每增加1个单位时,相应观测值y
答案BC
解析若两个具有线性相关关系的变量的相关性越强,则样本相关系数r的绝对值越接近于1,故A错误;当样本相关系数r=1时,两变量呈确定的函数关系,故B正确;因为斜率小于0,所以变量x和y负相关,故C正确;在经验回归方程y^=0.4+0.5x中,当x每增加1个单位时,相应观测值y
3.(2024·茂名模拟)已知变量x和y的统计数据如表:
x
1
2
3
4
5
y
6
6
7
8
8
根据上表可得经验回归方程y^=0.6x+a^,据此可以预测当x=8时,
A.8.5 B.9 C.9.5 D.10
答案D
解析依题意知,x=1+2+3+4+55=3
y=6+6+7+8+85=7
于是7=0.6×3+a^,解得a
即y^=0.6x
当x=8时,y^=0.6×
4.色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品,已知该产品的色度y和色差x之间满足线性相关关系,且y^=0.8x-1.8,现有一对测量数据为(33,25.2),则该数据的残差为.
答案0.6
解析将x=33代入y^=0.8x
可得y^=0.8×
故数据(33,25.2)的残差为25.2-24.6=0.6.
1.经验回归直线过点(x,y).
2.求b^时,常用公式b^=
3.回归分析是基于成对样本观测数据进行估计或推断,得出的结论都可能犯错误.
题型一成对数据的相关性
例1(1)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是()
A.r4r20r1r3
B.r2r40r3r1
C.r2r40r1r3
D.r4r20r3r1
答案B
解析由散点图可知,样本相关系数r2,r4所在散点图的两个变量呈负相关,r1,r3所在散点图的两个变量呈正相关,所以r1,r3都为正数,r2,r4都为负数.r1,r2所在散点图点的分布近似在一条直线上,线性相关性比较强,样本相关系数的绝对值接近1,而r3,r4所在散点图点的分布比较分散,线性相关性比较弱,则r2r4,r1r3,综上所得,r2r40r3r1.
(2)(2024·石家庄模拟)某校为了解本校高一男生身高和体重的相关关系,在该校高一年级随机抽取了7名男生,测量了他们的身高和体重得下表:
身高x(单位:cm)
167
173
175
177
178
180
181
体重y(单位:kg)
90
54
59
64
67
72
76
由表格制作成如图所示的散点图:
由最小二乘法计算得到经验回归直线l1的方程为y^=b^1x+a^1,其样本相关系数为r1;经过残差分析,点(167,90)对应残差过大,把它去掉后,再用剩下的6组数据计算得到经验回归直线l2的方程为y^=b^
A.b^1b^2,a^1a
B.b^1b^2,a^1a
C.b^1b^2,a^1a
D.b^1b^2,a^1a
答案A
解析身高的平均数为167+173+175+177+178+180+1817=12317
因为点(167