第一章统计案例
残差
对于样本点的随机误差的估计值为,称为相应于点的残差.(,…,)
残差图
利用图形来分析残差特性,作图时纵坐_________,横坐标可以选为_______,或_________,或体重估计值等,这样作出的图形称为残差图
残差
图法
残差点比较均匀地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的宽度越窄,说明模型拟合精度_______
残差平
方和
残差平方和为_____________,残差平方和越_______,模型拟合效果越好
相关指
数R2
,表示_____变量对______变量变化的贡献率,R2越接近于1,表示回归的效果越好
1.1.1回归分析的基本思想及其初步应用(2)
【学习目标】
1.会用残差分析判断线性回归模型的拟合效果;掌握建立回归模型的步骤;
2.通过对典型案例的探究,了解回归分析的基本思想方法和初步应用.
【新知自学】
知识回顾:
1、线性回归模型中,其中、为未知参数,其估计值,
,称为______________.
残差分析:
残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适。
残差平方和越小,模型拟合效果越好.
新知梳理:
1、相关指数
我们可以用相关指数R2来刻画回归的效果,其计算公式是:
(1)越大,残差平方和越小,即模型的拟合效果_________;越小,残差平方和越大,即模型的拟合效果越差。
(2)表示______变量对于预报变量变化的贡献率,表示随机误差对于预报变量变化的贡献率.越接近于______,表示回归的效果越好.
(3)在线性回归模型中,的取值范围为____________.
对点练习
1、两个变量相关性越强,相关系数()
A.越接近于B.越接近于1
C.越接近于-1D.绝对值越接近1
刻画回归效果的方式
对点练习
2、若一组观测值…
之间满足…),若
恒为,则为.
3、建立回归模型的基本步骤
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).
(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程).
(4)按一定规则(如最小二乘法)估计回归方程中的参数.
(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大或残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等.
【合作探究】
典例精析:
x
5
10
15
20
25
30
y
7.25
8.12
8.95
9.90
10.9
11.8
【例1】为研究重量(单位:克)对弹簧长度(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:
(1)作出散点图并求线性回归方程;
(2)求出;
(3)进行残差分析.
变式练习:
已知某种商品的价格(元)与需求量(件)之间的关系有如下一组数据:
14
16
18
20
22
12
10
7
5
3
求对的回归直线方程,并说明回归模型拟合效果的好坏.
规律总结:
作残差分析时,一般从以下几个方面予以说明:(1)散点图;(2)相关指数;(3)残差图中的异常点和样本点的带状分布区域的宽窄.
【课堂小结】
【当堂达标】
1、关于回归分析,下列说法错误的是()
A.在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定
B.线性相关系数可以是正的也可以是负的
C.在回归分析中,如果r2=1或r=±1,说明x与y之间完全线性相关
D.样本相关系数r∈(-1,1)
2、在建立两个变量与的回归模型中,分别选择了4个不同的模型,它们的相关指数如下,其中拟合最好的模型是()
A.模型1的相关指数为0.98
B.模型2的相关指数为0.80
C.模型3的相关指数为0.50
D.模型4的相关指数为0.25
3、在一次抽样调查中测得样本的5个样本点,数值如下表:
x
0.25
0.5
1
2
4
y
16
12
5
2
1
试建立y与x之间的回归方程.
【课时作业】
1、关于变量与之间的回归直线方程叙述正确的是()
A.表示与之间的一种确定性关系
B.表示与之间的相关关系
C.表示与之间的最真实的关系
D.表示与之间真实关系的一种效果最好的拟合
2、下列现象的线性相关程度最高的是()
A.某商店的职工人数与商品销售额之间的相关系数为0.87
B.流通费用率与商业利润率之间的相关系数为-0.94
C.商品销售额与商业利润率之间的相关系数为0.51
D.商品销售额与流通费用率之间的相关系数为0.81
3、有