计量经济模型中,虚拟变量可以发挥多方面的作用:比如,作为属性因素的代表,如性别、所有制等;可以作为某些非精确计量的数量因素的代表,如受教育程度、管理者素质等;作为某些偶然因素或政策因素的代表,如战争、灾害、改革前后等;实现分段回归,研究斜率、截距的变动,或比较两个回归模型的结构差异;作为时间序列分析中季节(月份)的代表;等等。第30页,共62页,星期日,2025年,2月5日在计量经济学中,把包含有虚拟变量的模型称为虚拟变量模型。常用的虚拟变量模型有三种类型:1.解释变量中只包含虚拟变量,作用是在假定其他因素都不变时,只研究分类变量是否使被解释变量表现出显著差异;2.解释变量中既含数值变量,又含虚拟变量,研究数值变量和虚拟变量同时对被解释变量的影响;3.被解释变量本身为虚拟变量的模型,即被解释变量本身取值为0或1的模型,适于对某社会经济现象进行“是”与“否”的判断研究。本节讨论前两种情形。第31页,共62页,星期日,2025年,2月5日二、虚拟解释变量的回归在计量经济模型中,加入虚拟解释变量的途径有两种基本类型:一是加法类型;二是乘法类型。不同的途径引入虚拟变量有不同的作用,加法方式引入虚拟变量改变的是模型的截距;乘法方式引入虚拟变量改变的是模型的斜率。(一)用虚拟变量表示不同截距的回归—加法类型以加法类型引入虚拟解释变量的模型,虚拟解释变量与其他解释变量是相加关系;从计量经济模型的意义看,其作用是改变了设定模型的截距水平。比如:第32页,共62页,星期日,2025年,2月5日例:研究性别与收入(yi)的关系:我们可以定义虚拟变量Di,Di=0时表示女性,Di=1时表示男性,即:对于线性回归模型(7.18),若假设H0:β1=0成立,则说明收入与性别将没有太大关系;若假设H0:β1=0不成立,则说明收入与性别有关。以加法类型引入虚拟变量时,分为两种情形:解释变量只有分类变量而无数值变量;解释变量既有数值变量又有分类变量。1.解释变量只有分类变量而无数值变量的回归第33页,共62页,星期日,2025年,2月5日例7-4研究学历与收入(yi)的关系:可以建立如下模型:第34页,共62页,星期日,2025年,2月5日表7-6为从某城市随机获取的10名职工的学历情况与最初参加工作时的起薪。试建立样本回归模型。起薪(元)教育(1=大学,0=非大学)起薪(元)教育(1=大学,0=非大学)2300150014002100250010011170013009001700220001001表7-6起薪与受教育程度数据第35页,共62页,星期日,2025年,2月5日由结果可知,对应的t检验值为2.3,在统计上显著,说明学历对收入有着显著的影响,即说明受教育水平不同的两类人群的起薪是不同的。由方程可得,大学毕业的起薪均值为2080元,而非大学毕业的起薪均值为1440元,前者比后者高出640元(的系数)。最小二乘估计结果:第36页,共62页,星期日,2025年,2月5日因为这种案例实际上是不同组别的均值比较,可以通过方差分析完成,这种情况的模型又被称为方差分析模型。该例的excel方差分析结果如表7-7:组观测数求和平均方差非大学572001440108000大学5104002080212000方差分析差异源SSdfMSFP-valueFcrit组间1024000110240006.40.0352655.317655组内12800008160000总计23040009表7-7excel方差分析输出结果第37页,共62页,星期日,2025年,2月5日2.解释变量同时包含常规数值变量和虚拟变量的回归例如,我们认为,某个企业工人的月工资(y)与工作岗位类型(分为一般岗位和特殊岗位)有关,也与工作年限(x)有关。回归模型如下:(7.19)其中岗位类型用虚拟变量表示:于是有第38页,共62页,星期日,2025年,2月5日因而可以看出(7.19)实际上是两条截距不同、斜率相同的直线的组合,如图7-4。这里斜率相同是在模型设定时隐含的假定。xy在的假