§9.3一元线性回归模型及其应用
课标要求1.了解样本相关系数的统计含义.2.了解最小二乘法原理,掌握一元线性回归模型参数的最小二乘估计方法.3.针对实际问题,会用一元线性回归模型进行预测.
1.变量的相关关系
(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)相关关系的分类:和.
(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在附近,我们就称这两个变量线性相关.
2.样本相关系数
(1)r=nΣ
(2)当r0时,称成对样本数据;当r0时,称成对样本数据.
(3)|r|≤1;当|r|越接近1时,成对样本数据的线性相关程度越;当|r|越接近0时,成对样本数据的线性相关程度越.
3.一元线性回归模型
(1)我们将y^=b^x+a^
其中b
(2)残差:减去所得的差称为残差.
1.判断下列结论是否正确.(请在括号中打“√”或“×”)
(1)相关关系是一种非确定性关系.()
(2)散点图是判断两个变量相关关系的一种重要方法和手段.()
(3)经验回归直线y^=b^x+a^至少经过(x1,y1),(x2,y2),…,(xn,yn)
(4)样本相关系数越小,成对样本数据的线性相关程度越弱.()
2.(多选)下列说法正确的是()
A.若两个具有线性相关关系的变量的相关性越强,则样本相关系数r的值越接近于1
B.当r=1时,两变量呈函数关系
C.当经验回归方程为y^=0.3-0.7x时,变量x和y
D.在经验回归方程y^=0.4+0.5x中,当x每增加1个单位时,相应观测值y一定增加0.5
3.(2024·茂名模拟)已知变量x和y的统计数据如表:
x
1
2
3
4
5
y
6
6
7
8
8
根据上表可得经验回归方程y^=0.6x+a^,据此可以预测当x=8时,y约等于(
A.8.5 B.9 C.9.5 D.10
4.色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品,已知该产品的色度y和色差x之间满足线性相关关系,且y^=0.8x-1.8,现有一对测量数据为(33,25.2),则该数据的残差为
1.经验回归直线过点(x,y).
2.求b^时,常用公式b
3.回归分析是基于成对样本观测数据进行估计或推断,得出的结论都可能犯错误.
题型一成对数据的相关性
例1(1)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是()
A.r4r20r1r3 B.r2r40r3r1
C.r2r40r1r3 D.r4r20r3r1
(2)(2024·石家庄模拟)某校为了解本校高一男生身高和体重的相关关系,在该校高一年级随机抽取了7名男生,测量了他们的身高和体重得下表:
身高x
(单位:cm)
167
173
175
177
178
180
181
体重y
(单位:kg)
90
54
59
64
67
72
76
由表格制作成如图所示的散点图:
由最小二乘法计算得到经验回归直线l1的方程为y^=b^1x+a^1,其样本相关系数为r1;经过残差分析,点(167,90)对应残差过大,把它去掉后,再用剩下的6组数据计算得到经验回归直线l2的方程为y^=b^
A.b^1b^2,a^1a
B.b^1b^2,a^1a
C.b^1b^2,a^1a
D.b^1b^2,a^1a
思维升华判定两个变量相关性的方法
(1)画散点图:若点的分布从左下角到右上角,则两个变量正相关;若点的分布从左上角到右下角,则两个变量负相关.
(2)样本相关系数:当r0时,正相关;当r0时,负相关;|r|越接近1,线性相关性越强.
(3)经验回归方程:当b^0时,正相关;当b^0
跟踪训练1(多选)下列有关回归分析的结论中,正确的有()
A.若经验回归方程为y^=5+2x,则变量y与x
B.运用最小二乘法求得的经验回归直线一定经过点(x,y)
C.若r1表示变量x与y之间的样本相关系数,r2表示变量u与v之间的样本相关系数,且r1=0.837,r2=-0.957,则x与y之间的线性相关性强于u与v之间的线性相关性
D.若散点图中所有点都在直线y=0.93x-3.6上,则样本相关系数r=0.93
题型二回归模型
命题点1一元线性回归模型
例2根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩的使用量x(千克)之间对应数据的散点图如图所示.
(1)从散点图可以看出,可用线性回归模型拟合y与x的关系,请计算样本相关系数r并判断它们的相关程度;
(2)求y关于x的经验回归方程y^=b^x+a
附:r=nΣ
b^=n
命题点2非线性回