第1页,共12页,星期日,2025年,2月5日多元线性回归模型多元线性回归是一元线性回归的逻辑推广。当影响变量Y的主要因素有k个时,可以建立起的总体回归模型为Y=?0+?1X1+?2X2+…+?kX+?同样可以通过最小二乘法求出回归系数的估计值。b1,b2,…bk第2页,共12页,星期日,2025年,2月5日系数的解释(以二元的情况为例)1、常数a依然是Y的截距,即当X1和X2同时为零时Y的估计值。2、b是多元回归分析中的净回归系数。b1测定的是当X2保持固定时,X1每变化一个单位时Y所发生的变化;b2测定的是当X1保持固定时,X2每变化一个单位时Y所发生的变化第3页,共12页,星期日,2025年,2月5日多重共线性问题1、如果自变量之间高度相关,则我们在进行多元回归分析时可能会得到一些奇怪的结果。如在一元回归时,回归系数为正,而在二元回归时,回归系数却为负。2、这时的净回归系数是不可靠的。因为当自变量间呈高度相关时,我们很难区分出每一个变量的单独的影响。3、解决的办法是抛弃其中一个变量,或是对变量作一些变换,如用相对数代替绝对数等。第4页,共12页,星期日,2025年,2月5日4、某一共线性变量是否应当删去,一个经验规则是:如果删除一个变量后,Rc2减少甚微,那么就应删除那个变量。另一等价规则是,如果某一个变量的净回归系数的t统计量小于1,那就删去这个变量。5、如果计算一个回归方程的主要目的在于取得因变量的推算值,那么各个净回归系数的可靠性是不大重要的。如果回归分析的目的是要精确地测定每个自变量对因变量的单独影响,那么,各个净回归系数的可靠性显然是重要的。多重共线性问题第5页,共12页,星期日,2025年,2月5日模型的检验1、回归系数的显著性检验查t分布表,自由度为n-k-1,在有多个自变量时,某个回归系数通不过,可能是这个系数对应的自变量对因变量的影响不显著,也可能是多重共线性所致。2、回归方程的显著性检验H0:?1=?2=…=?k=0H1:?j不同时为零第6页,共12页,星期日,2025年,2月5日3、拟合程度的测定多重决定系数R2受自变量个数的影响,自变量越多,R2越接近1。调整的决定系数定义为:模型的检验第7页,共12页,星期日,2025年,2月5日4、D-W检验与一元回归的方法相同。5、估计标准误差模型的检验第8页,共12页,星期日,2025年,2月5日虚拟变量技术如果我们想在模型中加入一些品质变量,可以采用虚拟变量。分析家庭食物支出额的影响因素中,考虑城市与非城市的差别。X2=1(城市),X2=0(非城市)变量的季节性差异。如旺季和非旺季,一年四季等。第9页,共12页,星期日,2025年,2月5日