基本信息
文件名称:统计学第三章多元回归分析.ppt
文件大小:22.18 MB
总页数:63 页
更新时间:2025-06-13
总字数:约9.43千字
文档摘要

*****考试成绩性别X75男096女168男051男078女181女172男069男088女193男062男076女145男075女165女195女1在回归中引进虚拟变量

(例题分析)【例】建立考试分数与性别之间的线性回归方程,并解释回归系数的含义第60页,共63页,星期日,2025年,2月5日引进虚拟变量时,回归方程表示为E(y)=?0+?1x男(x=0):E(y)=?0—男学生考试成绩的期望值女(x=1):E(y)=?0+?1—女学生考试成绩的期望值注意:当指定虚拟变量0,1时?0总是代表与虚拟变量值0所对应的那个分类变量水平的平均值?1总是代表与虚拟变量值1所对应的那个分类变量水平的平均值与虚拟变量值0所对应的那个分类变量水平的平均值的差值,即平均值的差值=(?0+?1)-?0=?1虚拟自变量的回归(例题分析)第61页,共63页,星期日,2025年,2月5日考试成绩与性别的回归虚拟自变量的回归(例题分析)男学生考试分数的平均值女学生与男学生平均考试分数的差值第62页,共63页,星期日,2025年,2月5日虚拟自变量的回归

(考试成绩与性别的散点图)男女第63页,共63页,星期日,2025年,2月5日****************************线性关系检验通过后,对各个回归系数有选择地进行一次或多次检验究竟要对哪几个回归系数进行检验,通常需要在建立模型之前作出决定对回归系数检验的个数进行限制,以避免犯过多的第Ⅰ类错误(弃真错误)对每一个自变量都要单独进行检验应用t检验统计量回归系数的检验第28页,共63页,星期日,2025年,2月5日1.提出假设H0:(自变量xi与因变量y没有线性关系)H1:(自变量xi与因变量y有线性关系)2.计算检验的统计量t回归系数的检验(步骤)3.确定显著性水平?,并进行决策?t?t???,拒绝H0;?t?t???,不拒绝H0第29页,共63页,星期日,2025年,2月5日回归系数在(1-?)%置信水平下的置信区间为回归系数的推断(置信区间)回归系数的抽样标准差自由度第30页,共63页,星期日,2025年,2月5日第三节多重共线性及其处理一、多重共线性及其识别二、变量选择与逐步回归第31页,共63页,星期日,2025年,2月5日一、多重共线性及其识别第32页,共63页,星期日,2025年,2月5日1.回归模型中两个或两个以上的自变量彼此相关2.多重共线性带来的问题有可能会使回归的结果造成混乱,甚至会把分析引入歧途,F检验显著,t检验不显著可能对参数估计值的正负号产生影响,特别是各回归系数的正负号有可能同预期的正负号相反参数估计量的方差变大,参数检验有可能失效,有些回归系数通不过显著性检验多重共线性(multicollinearity)第33页,共63页,星期日,2025年,2月5日1.检测多重共线性的最简单的一种办法是计算模型中各对自变量之间的相关系数,并对各相关系数进行显著性检验若有一个或多个相关系数显著,就表示模型中所用的自变量之间相关,存在着多重共线性2.如果出现下列情况,暗示存在多重共线性(经验判断)模型中各对自变量之间显著相关当模型的线性关系检验(F检验)显著时,几乎所有回归系数的t检验却不显著回归系数的正负号与预期的相反多重共线性的识别第34页,共63页,星期日,2025年,2月5日1.将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关2.如果要在模型中保留所有的自变量,则应避免根据t统计量对单个参数进行检验对因变量值的推断(估计或预测)限定在自变量样本值的范围内多重共线性的处理第35页,共63页,星期日,2025年,2月5日1.在建立多元线性回归模型时,不要试图引入更多的自变量,除非确实有必要2.在社会科学的研究中,由于所使用的大多数数据都是非试验性质的,因此,在某些情况下,得到的结果往往并不令人满意,但这不一定是选择的模型不合适,而是数据的质量不好,或者是由于引入的自变量不合适提示第36页,共63页,星期日