第3节变量间的相关关系及回归模型
【课标要求】(1)了解样本相关系数的统计含义,会通过相关系数比较多组成对数据的相关性;(2)了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法;(3)针对实际问题,会用一元线性回归模型进行预测.
知识点一成对数据的相关性
1.变量的相关关系
(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系;
(2)相关关系的分类:和;
(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在附近,我们就称这两个变量线性相关.
提醒注意相关关系与函数关系的区别:函数关系是一种确定的关系,而相关关系是一种非确定的关系.
2.样本相关系数
(1)样本相关系数r=∑i
(2)样本相关系数r的性质
①当r>0时,称成对样本数据相关;当r<0时,称成对样本数据相关;当r=0时,称成对样本数据间没有线性相关关系;
②样本相关系数r的取值范围为.当|r|越接近1时,成对样本数据的线性相关程度越;当|r|越接近0时,成对样本数据的线性相关程度越.
(2022·全国乙卷理19题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i
1
2
3
4
5
6
7
8
9
10
总和
根部横截
面积xi
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量yi
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
并计算得∑i=110xi2=0.038,∑i=110yi2=1.6158,
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数r=∑i=1n(xi-
规律方法
样本相关系数r的统计含义及应用
(1)由r的正、负可判断成对样本数据中两相关变量是正相关还是负相关;
(2)可根据|r|的大小从量的角度判断成对样本数据是否具有线性相关性,进而可知能否用经验回归方程进行分析和预测;
(3)当|r|≤0.25时,即便求得了经验回归方程也没有任何统计意义.
练1(1)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
(2)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是()
A.r2<r4<0<r3<r1
B.r4<r2<0<r1<r3
C.r4<r2<0<r3<r1
D.r2<r4<0<r1<r3
知识点二一元线性回归模型
1.经验回归直线:从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做经验回归直线.
2.经验回归方程为y=bx+a,其中b=∑i=1n(xi-x)(
3.通过求Q=∑i=1n(yi-bxi-a)2的最小值而得到经验回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小
结论(1)经验回归直线一定过点(x,y);
(2)y与x正相关的充要条件是b>0,y与x负相关的充要条件是b<0;
(3)当x增大一个单位时,y增大b个单位.
某饮料店为了推广“秋天的第一杯奶茶”,需了解一天的平均气温与奶茶销量之间的关系,为此记录了周一至周五的平均气温x(℃)与奶茶销量y(杯)的数据,如表所示:
x
9
11
12
10
8
y
23
26
30
25
21
(1)画出散点图;
(2)根据上表提供的数据,求出y关于x的经验回归方程y=bx+a;
(3)试根据(2)中求出的经验回归方程,预测平均气温约为20℃时该饮料店的奶茶销量.
规律方法
线性回归分析问题的解题策略
(1)利用最小二乘估计公式,求出回归系数b;
(2)利用经验回归直线过样本点的中心求系数a;
(3)写出经验回归方程,并利用经验回归方程进行预测.
练2(1)已知变量x与y,且观测数据如下表(其中6.5>a>4>b>1,