当前位置:文档之家› (VR虚拟现实)第八章虚拟解释变量回归

(VR虚拟现实)第八章虚拟解释变量回归

(VR虚拟现实)第八章虚拟解释变量回归
(VR虚拟现实)第八章虚拟解释变量回归

(VR虚拟现实)第八章虚拟解释变量回归

第八章虚拟变量回归

引子

男女大学生的消费真的有差异吗?

在校大学生的消费行为越来越受到社会的关注,学生家长也很关心自己的子女上大学究竟要准备多少花费。由共青团中央、全国学联共同发布的《2004中国大学生消费与生活形态研究报告》显示,当代大学生在消费结构方面呈现出多元化趋势。大学生除了日常生活费开支以外,还有人际交往消费、网络通讯消费、书报消费、衣着类消费、化妆品类消费、电脑类消费、旅游类消费、食品类消费、学习用品类消费、各种考证类等消费。大学生时尚化、个性化消费增多已成为趋势与潮流。不同性别大学生的消费结构有所不同,专科生、本科生、研究生的消费结构更有差异。有的记者调查发现,不同年级之间,男女同学之间,消费水平、消费结构、消费方式上都存在着差异。年级越高,消费水平也随之增长,随着阅历的增加,对自己形象的重视,精神享受的追求、学习的投入、配备手机电脑的需求也随之增长。同年级的男生的消费高于女生,虽然女生在化妆品、衣服饰品方面的投入明显高于男生。然而时代在变,对美的追求已不再限于女生,男生对于个人形象、装扮也已慢慢重视起来。此外男生在人际交往方面比女生投入了更多的"本钱"。请客吃饭、朋友聚会、节日送礼已不再罕见。所谓的"人情消费"已从社会向校园中扩张蔓延,而在乎"面子"的男同胞已成为追随这一潮流的"先驱"。高年级女生对于吃饭的投入相对较少,而在化妆品、服饰、零食方面的投入却增长不少。(注:来源于Solie教育网、网易教育频道、新华网等)为了研究男女大学生、不同层次大学生、不同年级大学生的消费结构是否有差异,需要将这些定性的因素引入计量模型,怎样才能在模型中有效地表示这些定性因素的作用呢?

第一节虚拟变量

一、虚拟变量的基本概念

在前面的分析中,被解释变量主要受到一些可以直接度量的变量影响,如收入、产出、商品需求量、价格、成本、资金、人数等。但现实经济生活中,影响被解释变量变动的因素,除了这些可以直接获得实际观测数据的定量变量外,还包括一些本质上为定性因素(或称属性因素)的影响,例如性别、种族、肤色、职业、季节、文化程度、战争、自然灾害、政府经济政策的变动等因素。在实际经济分析中,这些定性变量有时具有不可忽视的重要影响。例如,研究某个企业的销售水平,产业部门(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、管理者素质的高低等是值得经常考虑的影响因素,这些因素有共同的特征,即都是表示某种属性的,不能直接用数据精确描述的因素。因此,被解释变量的变动经常是定量因素和属性因素共同作用的结果。在计量经济模型中,应当同时包含定量和属性两种因素对被解释变量的影响作用。

定量因素是指那些可直接测度的数值型因素,如GDP、M2等。定性因素,或称为属性因素,是不能直接测度的、说明某种属性或状态存在与否的非数值型因素,如男性或女性、城市居民或非城市居民、气候条件正常或异常、政府经济政策不变与改革等。在计量经济学的建模中应当将定量因素和定性因素同时纳入模型之内。

为了在模型中反映定性因素,可以将定性因素转化为虚拟变量去表现。虚拟变量(或称为属性变量、双值变量、类型变量、定性变量、二元型变量等),是人工构造的取值为0和1的作为属性变量代表的变量,一般用字母D(或DUM,英文dummy的缩写)表示。属性因素通常具有若干类型或水平,通常虚拟变量的取值为0和1,当虚拟变量取值为0,即D=0时,表示某种属性或状态不出现或不存在,即不是某种类型;当虚拟变量取值为1,

即D=1时,表示某种属性或状态出现或存在,即是某种类型。例如,构造政府经济政策人工变量,当经济政策不变时,虚拟变量取值为0,当经济政策改变时,虚拟变量取值为1。这种做法实际上是一种变换或映射,将不能精确计量的定性因素的水平或状态变换为用0和1来定量描述。

二、虚拟变量的设置规则

在计量经济学模型中引入虚拟变量,可以使我们同时兼顾定量因素和定性因素的影响和作用。但是,在设置虚拟变量时应遵循一定的规则。

1、虚拟变量数量的设置规则

虚拟变量个数的设置规则是:若定性因素有m个相互排斥的类型(或属性、水平),在有截距项的模型中只能引入m-1个虚拟变量,否则会陷入所谓“虚拟变量陷阱”,产生完全的多重共线性。在无截距项的模型中,定性因素有m个相互排斥的类型时,引入m个虚拟变量不会导致完全多重共线性,不过这时虚拟变量参数的估计结果,实际上是D=1时的样本均值。

例如,城镇居民和农村居民住房消费支出的模型可设定为:

(8.1)

其中,为居民的住房消费支出,为居民的可支配收入,为虚拟变量,,即当时为城镇居民;当时为其他(农村居民)。这里区分城镇居民和农村居民的定性变量的类型有m=2个,按虚拟变量的设置规则应引入m-1=2-1=1个虚拟变量。

但是,如果引入了m=2个虚假变量:,,

则有:

(8.2)

这时,当=1时同时有=0;反之,当=0时有=1。即对于任何被调查的居民家庭都有+=1,

和存在完全的共线性,无法利用OLS估计其参数,从而陷入“虚拟变量陷阱”。由此,所谓的“虚拟变量陷阱”的实质是出现完全多重共线性。可见,虚拟变量有其积极作用的一面,也有不良影响的一面,引入的虚拟变量适当,则发挥了积极的作用,引入的虚拟变量过度,则会带来负面的影响。

2、虚拟变量的“0”和“1”的选取原则

虚拟变量取“1”或“0”的原则,应从分析问题的目的出发予以界定。从理论上讲,虚拟变量取“0”值通常代表为比较的基础类型;而虚拟变量取“1”值通常代表为被比较的类型。例如,引入政府经济政策的变动对被解释变量的影响时,由于此时的比较是在政府经济政策不变的基础上进行的,故虚拟变量确定为:

三、虚拟变量的作用

在计量经济模型中,虚拟变量可以发挥多方面的作用:

(1)可以作为属性因素的代表,如性别、所有制等;

(2)作为某些非精确计量的数量因素的代表,如受教育程度、管理者素质等;

(3)作为某些偶然因素或政策因素的代表,如战争、灾害、改革前后等;

(4)还可以作为时间序列分析中季节(月份)的代表;

(5)可以实现分段回归,研究斜率、截距的变动,或比较两个回归模型的结构差异。

在计量经济学中,把包含有虚拟变量的模型称为虚拟变量模型。常用的虚拟变量模型有三种类型:(1)解释变量中只包含虚拟变量,作用是在假定其他因素都不变时,只研究定性变量是否使被解释变量表现出显著差异;(2)解释变量中既含定量变量,又含虚拟变量,研究定量变量和虚拟变量同时对被解释变量的影响;(3)被解释变量本身为虚拟变量的模型,是被解释变量本身取值为0或1的模型,适于对某社会经济现象进行“是”与“否”

的判断研究。

特别要注意的是,定型或属性变量,通常由1个以上的虚拟变量描述。例如,分析考证区域这样一个定性因素的影响时,若将区域因素划分为东、中、西三种属性时,在有截距项的回归模型中,只能引人2个虚拟变量,而这两个虚拟变量只是描述了1个定性因素(区域因素),而不是2个定性因素。当然,当定性因素为性别因素时,1个虚拟变量就描述了1个定性因素。

第二节虚拟解释变量的回归

在计量经济模型中,加入虚拟解释变量的途径有两种基本类型:一是加法类型;二是乘法类型。不同的途径引入虚拟变量有不同的作用,加法方式引入虚拟变量改变的是截距;乘法方式引入虚拟变量改变的是斜率。

一、用虚拟变量表示不同截矩的回归——加法类型

以加法类型引入虚拟解释变量的模型,如(8.3)式那样,

(8.3)

在(8.3)所设定的计量经济模型中,虚拟解释变量与其他解释变量是相加关系。以加法形式引入虚拟解释变量,从计量经济模型的意义看,其作用是改变了设定模型的截距水平。

以加法方式引入虚拟变量时,分为四种情形:(1)解释变量只有一个分为两种相互排斥类型的定性变量而无定量变量;(2)解释变量包含一个定量变量和一个分为两种类型的定性变量;(3)解释变量包含一个定量变量和一个两种以上类型的定性变量;(4)解释变量包含一个定量变量和两个定性变量。

1、解释变量只有一个分为两种相互排斥类型的定性变量而无定量变量的回归

这种情况的模型又被称为方差分析模型,例如(8.4)式

(8.4)

其中,为居民的年可支配收入,为虚拟解释变量,=1代表城镇居民;=0代表非城镇居民。

(8.4)式的意义是,假设其他因素(包括文化程度、职业、性别等)保持不变的条件下,研究城镇居民和非城镇居民的收入是否存在差别。当满足古典假设时,由式(8.4)有:非城镇居民的年平均收入:(8.5)

城镇居民的年平均收入:(8.6)

即在(8.4)式中,截距项给出了非城镇居民的年平均可支配收入水平,而另一系数则表明城镇居民年平均可支配水平不同于非城镇居民年平均可支配收入的部分。由式(8.5)和(8.6)可知,虚拟解释变量的作用是改变设定模型的截距水平。

为了检验城镇居民和非城镇居民的年均可支配收入是否有显著差别,可构造假设H0:,即城镇与非城镇居民年均可支配收入无差别。对式(8.4)回归,依据估计值的t检验是否显著,可作出接受或不能接受H0假设的判断。

2、解释变量包含一个定量变量和一个分为两种类型定性变量的回归

例如(8.7)

模型(8.7)的意义在于描述收入和城乡差别对居民消费支出的影响。(8.7)式由一个定量解释变量X和一个分为两种类型的虚拟解释变量组成。注意这里一个定性变量具有两种类型,只使用了一个虚拟变量。当(8.7)式中的服从古典假定时,有:基础类型:(8.8)

比较类型:(8.9)

其中为差异截距系数。

(8.7)式可图示为8.1,表明非城镇居民与城镇居民两种类型收入函数的斜率相同(均为),而截距水平不同。这说明,城镇居民和非城镇居民在消费支出水平上,存在着规模为的差异,而由收入因素而产生的平均消费支出水平变化却是相同的。

Y

图8.1城镇农村居民消费支出水平的差异 1a

在的假设下,对参数估计值的检验,可以进行消费支出是否存在城乡差异的检验。

3、解释变量包含一个定量变量和一个两种以上类型的定性变量的回归

考虑以下模型:

(8.10)

其中:为年医疗保健费用支出,为居民的年可支配收入,

显然,模型(8.9)是描述居民的年医疗保健费用支出与居民可支配收入(定量变量)和受教育程度(定性变量)间的因果关系。这里,定性因素(受教育的程度)划分为三种类型;高中以下、高中、大专及大专以上。注意这里的定性变量有3种类型,依据虚拟变量设置规则引入了m-1=3-1=2个虚拟变量,而且一个定性变量多种类型时,虚拟变量可同时取值为0,但不能同时取值为1,因为同一定性变量的各种类型间“非此即彼”。

当式(8.10)服从古典假定时,有:

基础类型:高中以下教育:(8.11)

比较类型:高中教育:(8.12)

大专及大专以上:(8.13)

这表明,三种不同教育程度居民的医疗保健费用年均支出的起点水平(截距)不同,差异截距系数为和。对式(8.10)进行回归,检验和的t检验可以发现与比较基准组(高中以下教育水平)相比,另两种类型截距的差异在统计上是否存在显著差异。关于的联合假设检验,也可由方差分析或F检验完成。

4、解释变量包含一个定量变量和两个定性变量的回归

以加法形式引入虚拟解释变量的作法,很容易扩展到处理一个以上定性变量的情形。例如依据某地区家庭调查资料所建立的卷烟需求模型:

(8.14)

其中,为卷烟需求量,为居民可支配收入,和是虚拟解释变量,

一般认为,城镇居民的卷烟消费量高于非城镇居民,同时男性居民的吸烟量大于女性居民。为了分析城乡差别和性别差别对卷烟需求的影响,模型(8.14)以加法形式引入了两个虚拟解释变量。注意,这里有两个定性变量选用了两个虚拟变量去表示,这并不会出现“虚拟变量陷阱”,对比前面一个定性变量有三种类型时也用了两个虚拟变量,二者性质是不同的。而且注意这里的和是代表不同定性变量的虚拟变量,可以同时为0,也可同时为1,因为不同定性变量间并没有“非此即彼”的关系。

当式(8.14)满足古典假设时,有:

基础类型:农村女性居民:(8.15)

比较类型:农村男性居民:(8.16)

城镇女性居民:(8.17)

城镇男性居民:(8.18)

显然,模型(8.14)是以农村女性居民为基础类型,并假设各种类型居民的卷烟需求函数只是有不同的截距,相对于收入的斜率系数相同。用t检验分别检验和的统计显著性,可验证两个定性变量对截距是否有显著影响。

上述讨论的结果,可以推广到解释变量有多个定量变量和多个定性变量的情形。在推广过程中需要注意引入虚拟变量的个数应遵从前述的设置规则。例如,在考虑季节因素对冷饮销售量影响时,有春、夏、秋、冬四个类型的季节,依据设置规则,可引入m-1=4-1=3个虚拟解释变量。

二、用虚拟变量表示不同斜率的回归——乘法类型

以乘法形式引入虚拟解释变量,是在所设定的计量经济模型中,将虚拟解释变量与其他解释变量相乘作为解释变量,以表示模型中斜率系数的差异。以乘法形式引入虚拟解释变量的主要作用在于:①关于两个回归模型的比较;②因素间的交互影响分析;③提高模型对现实经济现象的描述精度。

1、回归模型的比较——结构变化检验

以加法方式引入虚拟解释变量,属性因素仅影响不同类型模型的平均水平,而不会影响不同类型模型的相对变化。但是在现实经济生活中,属性因素也可能影响模型的斜率系数发生变化。例如,随着可支配收入水平的提高,城乡居民的消费结构将出现较大的差异,这种差异会表现在定性因素对斜率的影响上。又如,研究我国改革开放前后储蓄——收入总量间关系是否发生了变化时,也存在着经济结构变化而导致模型斜率发生变化的问题。这类问题可归结于两个回归模型的比较。例如,在研究改革开放前后储蓄——收入总量关系时,所设定的模型为:

改革开放前:t=1950,1951,……,1977(8.19)

改革开放后:t=1978,1979,……,2004(8.20)

其中:Y为储蓄总额(亿元),X为收入总额(亿元),、为随机扰动项。如果我们分别对式(8.19)和式(8.20)在不同的时间区间内回归,则可能得到以下四种结果:(1),表明这两个回归模型是相同的,或称为重合回归;

(2),表明这两个回归模型仅在位置水平上(即截距水平上)存在差异,或称为平行回归;

(3),表明这两个回归模型具有相同的位置水平(或起点相同)而变化速率不等,或称为共点回归;

(4),表明这两个回归模型完全不相同,或称为不同的回归。

以上四种情形可用图示法描述(见图8.2):

收入

1

11λγ=

相关主题
文本预览
相关文档 最新文档