基本信息
文件名称:第七相关分析和回归分析.ppt
文件大小:3.15 MB
总页数:65 页
更新时间:2025-06-29
总字数:约7.51千字
文档摘要

一元线性回归模型(概念要点)?对于只涉及一个自变量的简单线性回归模型可表示为模型中,y是x的线性函数(部分)加上误差项线性部分反映了由于x的变化而引起的y的变化误差项?是随机变量反映了除x和y之间的线性关系之外的随机因素对y的影响是不能由x和y之间的线性关系所解释的变异性?0和?1称为模型的参数第30页,共65页,星期日,2025年,2月5日一元线性回归模型(基本假定)1、误差项ε是一个期望值为0的随机变量,即E(ε)=0。对于一个给定的x值,y的期望值为E(y)=a+bx2、对于所有的x值,ε的方差σ2都相同3、误差项ε是一个服从正态分布的随机变量,且相互独立。即ε~N(0,σ2)独立性意味着对于一个特定的x值,它所对应的ε与其他x值所对应的ε不相关对于一个特定的x值,它所对应的y值与其他x所对应的y值也不相关第31页,共65页,星期日,2025年,2月5日回归方程(概念要点)1、描述y的平均值或期望值如何依赖于x的方程称为回归方程2、简单线性回归方程的形式如下E(y)=a+bx方程的图示是一条直线,因此也称为直线回归方程a是回归直线在y轴上的截距,是当x=0时y的期望值b是直线的斜率,称为回归系数,表示当x每变动一个单位时,y的平均变动值第32页,共65页,星期日,2025年,2月5日三、简单线性回归(一元线性回归方程)的建立(拟合)一元回归方程建立的前提条件1、r的绝对值大于0.62、有线性关系参数a和b的最小二乘法估计第33页,共65页,星期日,2025年,2月5日最小二乘法(图示)xy(xn,yn)(x1,y1)?????????(x2,y2)(xi,yi)}ei=yi-yi^第34页,共65页,星期日,2025年,2月5日最小二乘法(公式推导见课本359页)

(和的计算公式)?根据最小二乘法的要求,可得求解和的标准方程如下第35页,共65页,星期日,2025年,2月5日估计方程的求法(实例)例:根据前例中的数据,配合人均消费金额对人均国民收入的回归方程根据求解公式得第36页,共65页,星期日,2025年,2月5日估计方程人均消费金额y对人均国民收入x的回归方程为y=54.22286+0.52638x^第37页,共65页,星期日,2025年,2月5日估计方程的求法

(Excel的输出结果)第38页,共65页,星期日,2025年,2月5日四、线性回归方程拟合优度的测定(判定系数、估计标准误差)1、因变量y的取值是不同的,y取值的这种波动称为变差。变差来源于两个方面由于自变量x的取值不同造成的除x以外的其他因素(如x对y的非线性影响、测量误差等)的影响2、对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差来表示总变差的分解第39页,共65页,星期日,2025年,2月5日离差平方和的分解(图示)离差分解图第40页,共65页,星期日,2025年,2月5日离差平方和的分解(三个平方和的关系)2、两端平方后求和有1、从图上看有SST=SSR+SSE总变差平方和(SST){回归平方和(SSR){残差平方和(SSE){第41页,共65页,星期日,2025年,2月5日变差平方和的分解(三个平方和的意义)1、总平方和(SST)反映因变量的n个观察值与其均值的总离差2、回归平方和(SSR)反映自变量x的变化对因变量y取值变化的影响,或者说,是由于x与y之间的线性关系引起的y的取值变化,也称为可解释的平方和3、剩余平方和(SSE)反映除x以外的其他因素对y取值的影响,也称为不可解释的平方和第42页,共65页,星期日,2025年,2月5日判定系数r21、反映回归直线的拟合程度取值范围在[0,1]之间r2?1,说明回归方程拟合的越好;r2?0,说明回归方程拟合的越差判定系数等于相关系数的平方,即r2=(r)2(证明见课本357页第43页,共65页,星期日,2025年,2月5日估计标准误差Sy1、反映实际观察值在回归直线周围的分散状况2、从另一个角度说明了回归直线的拟合程度3