II
计量经济学,
第六章
虚拟变量回归
目录
第一节虚拟变量
第二节虚拟解释变量的回归
第三节用虚拟变量表示不同斜率
的回归——乘法类型
第四节虚拟被解释变量
第五节案例分析
虚拟变量
=++
一、虚拟变量的基本概念
定量因素是指那些可直接测度的数值型因素,如GDP、M2等。定性因素,或称为属性因素,是不能
直接测度的、说明某种属性或状态存在与否的非数值型因素,如男性或女性、城市居民或非城市居民、气
候条件正常或异常、政府经济政策不变或改变等。
在计量经济学的建模中,应当将定量因素和定性因素同时纳入模型之内。
为了在模型中反映定性因素,可以将定性因素转化为虚拟变量去表现。
虚拟变量,或称为属性变量、双值变量、类型变量、定性变量、二元型变量等,是人工构造的取值为
0和1的作为属性变量代表的变量,一般用字母D(或DUM,英文dummy的缩写)表示。属性因素通常具有
若干类型或水平,通常虚拟变量的取值为0和1,当虚拟变量取值为0,即D=0时,表示某种属性或状态不
出现或不存在,即不是某种类型;当虚拟变量取值为1,即D=1时,表示某种属性或状态出现或存在,即
是某种类型。
例如,构造政府经济政策人工变量,当经济政策不变
时,虚拟变量取值为0,当经济政策改变时,虚拟变量取
值为1。这种做法实际上是一种变换或映射,将不能精确
计量的定性因素的水平或状态变换为用0和1来定量描述。
二、虚拟变量的设置规则
1.虚拟变量数量的设置规则
虚拟变量数量的设置规则是:若定性因素有m个相互排斥的类型(或属性、水平),在有截距项的模
型中只能引入m-1个虚拟变量,否则会陷入“虚拟变量陷阱”,产生完全的多重共线性。在无截距项的模
型中,定性因素有m个相互排斥的类型时,引入m个虚拟变量不会导致完全多重共线性,这时虚拟变量参
数的估计结果,实际上是D=1时的样本均值。
例如,城镇居民和农村居民住房消费支出的模型可设定为:
=+++
12
其中,为居民的住房消费支出;为居民的可支配收入;为虚拟变量,=?1,城镇居民,
0,其他
即当=1时,为城镇居民;当=0时,为其他(农村居民)。这里,区分城镇居民和农村居民的
定性变量的类型有m=2个,按虚拟变量的设置规则应引入m-1=2-1=1个虚拟变量。
二、虚拟变量的设置规则
1.虚拟变量数量的设置规则
但是,如果引入m=2个虚假变量,即
2=?1,城镇居民,3=?1,农村居民
0,其他0,其他
则有
=++++
12233
这时,当2=1时有3=0;反之,当2=0时有3=1。即对于任何被调查的居民家庭都有2+
=1,和存在完全的共线性,无法利用OLS估计其参数,从而陷入“虚拟变量陷阱”