基本信息
文件名称:解释变量包含虚拟变量.ppt
文件大小:5.35 MB
总页数:34 页
更新时间:2025-11-22
总字数:约2.82千字
文档摘要

第1页,共34页,星期日,2025年,2月5日一、虚拟变量的基本含义许多经济变量是可以定量度量的,如:商品需求量、价格、收入、产量等。但也有一些影响经济变量的因素无法定量度量,如:职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等。为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”。第2页,共34页,星期日,2025年,2月5日这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量(dummyvariables),记为D。例如,反映文化程度的虚拟变量可取为:1,本科学历D=0,非本科学历第3页,共34页,星期日,2025年,2月5日一般地,在虚拟变量的设置中:基础类型、肯定类型取值为1;比较类型,否定类型取值为0。第4页,共34页,星期日,2025年,2月5日概念:同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析(analysis-ofvariance:ANOVA)模型。一个以性别为虚拟变量考察企业职工薪金的模型:其中:Yi为企业职工的薪金,Xi为工龄,Di=1,若是男性,Di=0,若是女性。第5页,共34页,星期日,2025年,2月5日二、虚拟变量的引入虚拟变量做为解释变量引入模型有两种基本方式:加法方式和乘法方式。上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式。在该模型中,如果仍假定E(?i)=0,则企业女职工的平均薪金为:1.加法方式第6页,共34页,星期日,2025年,2月5日企业男职工的平均薪金为:几何意义:假定?20,则两个函数有相同的斜率,但有不同的截距。意即,男女职工平均薪金对工龄的变化率是一样的,但两者的平均薪金水平相差?2。第7页,共34页,星期日,2025年,2月5日可以通过传统的回归检验,对?2的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。?0?2第8页,共34页,星期日,2025年,2月5日又例:在横截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。教育水平考虑三个层次:高中以下,高中,大学及其以上。这时需要引入两个虚拟变量:第9页,共34页,星期日,2025年,2月5日模型可设定如下:在E(?i)=0的初始假定下,高中以下、高中、大学及其以上教育水平下个人保健支出的函数:高中以下:第10页,共34页,星期日,2025年,2月5日高中:大学及其以上:假定?3?2,其几何意义:第11页,共34页,星期日,2025年,2月5日还可将多个虚拟变量引入模型中以考察多种“定性”因素的影响。如在上述职工薪金的例中,再引入代表学历的虚拟变量D2:本科及以上学历本科以下学历职工薪金的回归模型可设计为:第12页,共34页,星期日,2025年,2月5日女职工本科以下学历的平均薪金:女职工本科以上学历的平均薪金:于是,不同性别、不同学历职工的平均薪金分别为:男职工本科以下学历的平均薪金:男职工本科以上学历的平均薪金:第13页,共34页,星期日,2025年,2月5日2.乘法方式加法方式引入虚拟变量,考察:截距的不同。许多情况下:往往是斜率就有变化,或斜率、截距同时发生变化。斜率的变化可通过以乘法的方式引入虚拟变量来测度。第14页,共34页,星期日,2025年,2月5日例:根据消费理论,消费水平C主要取决于收入水平Y,但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。如,设消费模型可建立如下:第15页,共34页,星期日,2025年,2月5日这里,虚拟变量D以与X相乘的方式引入了模型中,从而可用来考察消费倾向的变化。假定E(?i)=0,上述模型所表示的函数可化为:正常年份:反常年份:第16页,共34页,星期日,2025年,2月5日