基本信息
文件名称:第3节 变量间的相关关系及回归模型.docx
文件大小:477.55 KB
总页数:14 页
更新时间:2025-06-13
总字数:约1.19万字
文档摘要

第3节变量间的相关关系及回归模型

【课标要求】(1)了解样本相关系数的统计含义,会通过相关系数比较多组成对数据的相关性;(2)了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法;(3)针对实际问题,会用一元线性回归模型进行预测.

知识点一成对数据的相关性

1.变量的相关关系

(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系;

(2)相关关系的分类:正相关和负相关;

(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.

提醒注意相关关系与函数关系的区别:函数关系是一种确定的关系,而相关关系是一种非确定的关系.

2.样本相关系数

(1)样本相关系数r=∑i

(2)样本相关系数r的性质

①当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关;当r=0时,称成对样本数据间没有线性相关关系;

②样本相关系数r的取值范围为[-1,1].当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.

(2022·全国乙卷理19题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:

样本号i

1

2

3

4

5

6

7

8

9

10

总和

根部横截面积xi

0.04

0.06

0.04

0.08

0.08

0.05

0.05

0.07

0.07

0.06

0.6

材积量yi

0.25

0.40

0.22

0.54

0.51

0.34

0.36

0.46

0.42

0.40

3.9

并计算得∑i=110xi2=0.038,∑i=110yi2=1.6158,

(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;

(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);

(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.

附:相关系数r=∑i=1n(xi-

解:(1)估计该林区这种树木平均一棵的根部横截面积x=∑i=110xi10=

估计该林区这种树木平均一棵的材积量y=∑i=110yi10=

(2)∑i=110(xi-x)(yi-y)=∑i=110xiyi-10xy

∑i=110(xi-x)2=∑i=110xi2-10

∑i=110(yi-y)2=∑i=110yi2-10(y

所以∑i=110(xi-x)2∑i=110(yi-y

所以样本相关系数r=∑i=110(xi-

(3)设该林区这种树木的总材积量的估计值为Ym3,由题意可知,该种树木的材积量与其根部横截面积近似成正比,所以3.90

所以Y=186×3.90.6=1209,即该林区这种树木的总材积量的估计值为

规律方法

样本相关系数r的统计含义及应用

(1)由r的正、负可判断成对样本数据中两相关变量是正相关还是负相关;

(2)可根据|r|的大小从量的角度判断成对样本数据是否具有线性相关性,进而可知能否用经验回归方程进行分析和预测;

(3)当|r|≤0.25时,即便求得了经验回归方程也没有任何统计意义.

练1(1)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是(C)

A.x与y正相关,x与z负相关

B.x与y正相关,x与z正相关

C.x与y负相关,x与z负相关

D.x与y负相关,x与z正相关

(2)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是(A)

A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3

C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3

解析:(1)因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=by+a,b>0,则z=by+a=-0.1bx+b+a,故x与z负相关.

(2)由散点图知图(1)与图(3)是正相关,故r1>0,r3>0,图(2)与图(4)是负相关,故r2<0,r4<0,且图(1)与图(2)的样本点集中在一条直线附近,因此r2<r4<0<r3<r1.

知识点二一元线性回归模型

1.经验回归直线:从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做经验回归直线.

2.经验回归方程为y=b