8.2一元线性回归模型及其应用(单元教学设计)
一、【单元目标】
(1)结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义.
(2)了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法.
(3)掌握残差分析的方法,理解决定系数的意义,会使用相关的统计软件.
(4)针对实际问题,会用一元线性回归模型进行预测.
二、【单元知识结构框架】
三、【学情分析】
学生已掌握函数、导数、概率统计等基础知识,为学习一元线性回归模型奠定了基础.学生具备一定的抽象思维能力和数学运算能力,但面对新的统计模型可能存在理解上的困难.学生需要具备良好的逻辑思维和分析问题的能力,以便将实际问题转化为数学模型.
四、【教学设计思路/过程】
课时安排:约3课时
教学重点:一元线性回归模型的含义;用最小二乘法估计回归模型参数的方法;残差分析和决定系数的意义;一元线性回归模型的应用.
教学难点:对随机误差的理解;最小二乘原理与方法;参数的意义及参数估计公式的推导;残差变量的解释与分析;模型的应用及优度的判断.
教学方法/过程:
五、【教学问题诊断分析】
环节一、情景引入,温故知新
情景:通过前面的学习我们已经知道,根据成对样本数据的散点图和样本相关系数,可以推断两个变量是否存在相关关系、是正相关还是负相关,以及线性相关程度的强弱等,那么当两个变量线性相关时,我们如何利用成对样本数据建立统计模型进行预测?
环节二、抽象概念,内涵辨析
1.一元线性回归模型
生活经验告诉我们,儿子的身高与父亲的身高具有正相关的关系,为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如表所示:
编号
1
2
3
4
5
6
7
父亲身高/cm
174
170
173
169
182
172
180
儿子身高/cm
176
176
170
170
185
176
178
编号
8
9
10
11
12
13
14
父亲身高/cm
172
168
166
182
173
164
180
儿子身高/cm
174
170
168
178
172
165
182
我们画出散点图(课本105页图8.2-1)并通过计算得到样本相关系数r≈0.886.
问题1:由样本相关系数可以得到什么结论?
【破解方法】由散点图的分布趋势表明儿子的身高与父亲的身高线性相关,通过样本相关系数可知儿子的身高与父亲的身高正线性相关,且相关程度较高.
问题2:这两个变量之间的关系可以用函数模型来刻画吗?
【破解方法】不能.因为这两个变量之间不是函数关系,也就不能用函数模型刻画.
【归纳新知】
一元线性回归模型
我们称为关于的一元线性回归模型,其中称为因变量或响应变量,称为自变量或解释变量;和为模型的末知参数,称为截距参数,称为斜率参数;是与之间的随机误差.
2.最小二乘法和经验回归方程
问题3:在一元线性回归模型中,表达式刻画了变量Y与x之间的线性相关关系,其中参数a和b未知,确定参数a和b的原则是什么?
【破解方法】使表示成对样本数据的各散点在整体上与一条适当的直线尽可能地接近.
问题4:下列确定直线的四种方法中最具有可行性的是哪一个?
方法(1):先画出一条直线,测量出各点到直线的距离,然后移动直线,到达一个使距离和最小的位置,测量出此时的斜率和截距,就得到一条直线.
方法(2):可以在散点图中选两点画一条直线,使得直线两侧点的个数基本相同,把这条直线作为所求直线.
方法(3):在散点图中多取几对点,确定出几条直线的方程,再分别求出这些直线的斜率、截距的平均数,将这两个平均数作为所求直线的斜率和截距.
方法(4):我们可以考虑使各组数据的随机误差e的和最小来确定直线的斜率和截距.
【破解方法】方法(1),(2),(3)虽然有一定道理,但是比较难操作,方法(4)可以利用点到直线的距离来刻画散点与该直线的接近程度,然后利用所有距离之和刻画所有样本观测数据与该直线的接近程度.
问题5:对于一组具有线性相关关系的数据利用“残差”平方和最小这个标准,估计一元线性回归模型的参数和你能推导出参数和估计值的公式吗?
【破解方法】教师首先引导学生将问题数学化:“残差”平方和为其中是已知的成对样本数据由和决定,即它是和的函数,所以问题的本质是求和的值,使最小.接着,师生合作解决这个问题,得出参数估计公式,可让学生阅读教科书中相关部分,并尝试自己进行公式推导.最后,教师给出最小二乘法的概念.若是参数的最小二乘估计,将称为关于的经验回归方程,也称经验回归函数或经验回归公式,其图形为经验回归直线.这种求经验回归方程的方法叫做最小二乘法.对于基础较好的学生,可以要求他们课后思考如何求的最小值问题.
【归纳新知】
线性回归方程与最小二乘法
回归直线方程过样本点的中心,是回归直线方程最常用的一