第1页,共28页,星期日,2025年,2月5日第一章一元线性回归模型以下设x为自变量(普通变量)Y为因变量(随机变量).现给定x的n个值x1,…,xn,观察Y得到相应的n个值y1,…,yn,(xi,yi)i=1,2,…,n称为样本点.以(xi,yi)为坐标在平面直角坐标系中描点,所得到的这张图便称之为散点图.第2页,共28页,星期日,2025年,2月5日第3页,共28页,星期日,2025年,2月5日§1.1模型的建立及其假定条件例如:研究某市可支配收入X对人均消费支出Y的影响。建立如下理论回归模型:Yi=?0+?1Xi+εi其中:Yi——被解释变量;Xi——解释变量;εI——随机误差项;?0,?1—回归系数随机变量εi包含:回归模型中省略的变量;确定数学模型的误差;测量误差一、一元线性回归模型第4页,共28页,星期日,2025年,2月5日XY80100120140160180200220240260556579801021101201351371506070849310711513613714515265749095110120140140155175708094103116130144152165178758598108118135145157175180-88-113125140-160189185---115---162-191户数5657665765总支出32546244570767875068510439661211假设调查了某社区所有居民,他们的人均可支配收入和消费支出数据如下:第5页,共28页,星期日,2025年,2月5日YX5510012014016080描出散点图发现:随着收入的增加,消费“平均地说”也在增加,且Y的条件均值均落在一根正斜率的直线上。这条直线称为总体回归线。第6页,共28页,星期日,2025年,2月5日二、随机误差项εi的假定条件为了估计总体回归模型中的参数,需对随机误差项作出如下假定:假定1:零期望假定:E(εi)=0。假定2:同方差性假定:Var(εi)=?2。假定4:εi服从正态分布,即εi?N(0,?2)。假定3:无序列相关假定:Cov(εi,εj)=0,(i?j)。前三个条件称为G-M条件第7页,共28页,星期日,2025年,2月5日§1.2一元线性回归模型的参数估计普通最小二乘法(OrdinaryLeastSquares)OLS回归直线的性质OLSE的性质第8页,共28页,星期日,2025年,2月5日一、普通最小二乘法对于所研究的问题,通常真实的回归直线E(Yi|Xi)=?0+?1Xi是观测不到的。可以通过收集样本来对真实的回归直线做出估计。经验回归直线:其中:为Yi的估计值(拟合值);为?0,?1的估计值;如果观测值到这条直线的纵向距离(真实值与估计值的偏差)用ei表示(称为残差),则经验回归模型为:(ei为εi的估计值)第9页,共28页,星期日,2025年,2月5日注意:分清4个式子的关系(4)经验(估计的)回归直线:(1)理论(真实的)回归模型:(3)经验(估计的)回归模型:(2)理论(真实的)回归直线:第10页,共28页,星期日,2025年,2月5日对于参数的估计采用最小二乘估计法、最小二乘法的原则是以“残差平方和最小”确定直线位置(即估计参数)。(Q为残差平方和)Q===则通过Q最小确定这条直线,即确定,以为变量,把它们看作是Q的函数,就变成了一个求极值的问题,可以通过求导数得到。求Q对两个待估参数的偏导数:==0==0正规方程组即第11页,共28页,星期日,2025年,2月5日根据以上两个偏导方程得以下正规方程(Normalequation):第12页,共28页,星期日,2025年,2月5日若记则第13页,共28页,星期日,2025年,2月5日二、OLS回归直线的性质(1)估计的回归直线过点