当前位置:文档之家› 计量经济学课件第八章 虚拟变量回归

计量经济学课件第八章 虚拟变量回归

计量经济学课件第八章 虚拟变量回归
计量经济学课件第八章 虚拟变量回归

计量经济学课件第八章虚拟变量回归

第八章虚拟变量回归

1 / 65

计量经济学课件第八章 虚拟变量回归

2 / 65

引子:男女大学生消费真有差异吗? 在对在校学生的消费行为进行的调查中,发现在校 生的消费行为呈现多元化的结构。人际交往消费、 手机类消费、衣着类消费、化妆品类消费、电脑类 消费、旅游类消费占有较大的比例;而食品类消费、 学习用品类消费不突显。

显然,男女生在消费上存在差异。为了了解男、女 生的消费支出结构差异,应当如何建立模型? 面临的问题:如何把男女生这样的非数量变量引

计量经济学课件第八章 虚拟变量回归

3 / 65

问题的一般性描述

在实际建模中,一些定性变量具有不可忽视的重要 影响。例如,研究某个企业的销售水平,产业属性 (制造业、零售业)、所有制(私营、非私营)、 地理位置(东、中、西部)、管理者的素质、不同 的收入水平等是值得考虑的重要影响因素,但这些 因素共同的特征是定性描述的。

如何对非定量因素进行回归分析?

采用“虚拟变量”对定性变量进行量化一种思路。

计量经济学课件第八章 虚拟变量回归

4 / 65

第八章 虚拟变量回归

本章主要讨论:

●虚拟变量

●虚拟解释变量的回归

●虚拟被解释变量的回归(选讲,不包括)

计量经济学课件第八章 虚拟变量回归 5 / 65

第一节 虚拟变量

本节基本内容: ●基本概念

●虚拟变量设置规则

计量经济学课件第八章 虚拟变量回归

6 / 65

一、基本概念

定量因素:可直接测度、数值性的因素。

定性因素:属性因素,表征某种属性存在与否的 非数值性的因素。

基本思想:

直接在回归模型中加入定性因素存在诸多的困难 (那些困难?),是否可将这些定性因素进行量 化,以达到定性因素能与定量因素有着相同作用 之目的。

计量经济学课件第八章 虚拟变量回归

7 / 65

虚拟变量的定义 计量经济学中,将取值为0和1的人工变量称为虚 拟变量。虚拟变量也称:哑元变量、定性变量等 等。通常用字母D 或加以表示(英文中虚拟

或者哑元的缩写)。

对定性变量的量化可采用虚拟变量的方式实现。

计量经济学课件第八章 虚拟变量回归 8 / 65

二、虚拟变量设置规则

虚拟变量的设置规则涉及三个方面:

1.“0”和“1”选取原则

2.属性(状态、水平)因素与设置虚拟变量 数量的关系

3.虚拟变量在回归分析中的角色以及作用等 方面的问题

计量经济学课件第八章 虚拟变量回归

9 / 65

“0”和“1”选取原则

● 虚拟变量取“1”或“0”的原则,应从分析问 题的目的出发予以界定。

● 从理论上讲,虚拟变量取“0”值通常代表比较 的基础类型;而虚拟变量取“1”值通常代表被 比较的类型。

“0”代表基期(比较的基础,参照物); “1”代表报告期(被比较的效应)。

计量经济学课件第八章 虚拟变量回归

10 / 65

例如,比较收入时考察性别的作用。当研究男性收入是否 高于女性时,是将女性作为比较的基础(参照物),故有 男性为“1”,女性为“0”。

例1

(1) ?1 男 ?

?0 女 1 改革开放以后 (2) D = 0 改革开放以前

1 天气阴?1 天气雨 (3) D 1 = ( ) D

2 = ?4 ?0 其 他0 其 他 问题:

为何只选0、1,选2、3、4行吗?为什么?

计量经济学·多元线性回归模型

计量经济学·多元线性回归模型

2006年 217656.6 77597.2 63376.86 2007年 268019.4 93563.6 73300.1 2008年 316751.7 100394.94 79526.53 2009年 345629.2 82029.69 68618.37 2010年 408903 107022.84 94699.3 2011年 484123.5 123240.56 113161.39 2012年 534123 129359.3 114801 2013年 588018.8 137131.4 121037.5 2014年 636138.7 143911.66 120422.84 数据来源:国家统计局 三、模型的检验及结果的解释、评价 (一)OLS 法的检验 相关系数: Y X1 X2 Y 1 0.9799919175967026 0.98352422945 0628 X1 0.97999191759 67026 1 0.99756527944 46187 X2 0.983524229450628 0.99756527944 46187 1 线性图: 100,000 200,000300,000400,000500,000600,000700,000Y X1 X2 估计参数: Dependent Variable: Y

Method: Least Squares Date: 12/14/15 Time: 14:47 Sample: 1985 2014 Included observations: 30 Variable Coefficient Std. Error t-Statistic Prob. C 3775.319359 326024 8769.9280467 183 0.4304846447 102545 0.67026006 64360232 X1 -0.91272630 85551189 1.9385186318 83585 -0.470837005 9194414 0.64153894 75333828 X2 5.522785592 51161 2.2548570541 42605 2.4492841275 08302 0.02108703 0146243 R-squared 0.967586049 4429319 Mean dependent var 173871.823 3333334 Adjusted R-squared 0.965185016 0683343 S.D. dependent var 187698.441 4104575 S.E. of regression 35022.22758 863741 Akaike info criterion 23.8599929 764685 Sum squared resid 3311702348 2.29852 Schwarz criterion 24.0001127 1463471 Log likelihood -354.899894 6470274 Hannan-Quinn criter. 23.9048184 8460881 F-statistic 402.9873385 683694 Durbin-Watson stat 0.54328498 36158895 Prob(F-statistic) 7.850214650 723685e-21 统计检验: (1)拟合优度:从上表可以得到R2=0.9675860494429319,修正后的可决系数R2=0.9651850160683343,这说明模型对样本的拟合很好。 (2)F检验:针对H0: (二)多重共线性的检验及修正 相关系数矩阵: X1 X2

计量经济学复习资料——虚拟变量

虚拟变量习题 一、 单项选择题 1、 若一个回归模型包含截距项,对一个具有m 个特征的质的因素需要引入的虚拟变量个数为 A.m-2 B.m-1 C.m D.m+1 2、 某商品需求函数为:Y i =β0+β1X i +μi ,其中Y 为需求量,X 为价格,为了考虑“性别”(男性、女性)和“地区”(东部、中部、西部)两个因素的影响,考虑引入虚拟变量,则应引入虚拟变量的个数为( ) A. 5 B. 4 C. 3 D. 2 3、 消费函数Y i =α0+α1D+β0X i +β1DX i +μi ,其中 虚拟变量D=???农村家庭城镇家庭 01,当统计检验表明下列哪项成立时,表示城镇家庭 与农村家庭有一样的消费行为( ) A. α1=0, β1=0 B. α1=0, β1≠0 C. α1≠0, β1=0 D. α1≠0, β1≠0 4、 根据样本资料建立某消费函数如下:?100.5055.350.45t t C D X =++,其中C 为消费,X 为收入,虚拟变量 1 D 0 ?=??城镇家庭 农村家庭,所有参数均检验显著,则城 镇家庭的消费函数 为 ( ) A 、?155.850.45t t C X =+ B 、?100.500.45t t C X =+ C 、?100.5055.35t t C X =+ D 、?100.9555.35t t C X =+ 5、 假设某需求函数为01i i i Y X ββμ=++,为了考虑“季节”因素(春、夏、秋、 冬四个不同的状态),引入4个虚拟变量形成截距变动模型,则模型的 ( ) A 、参数估计量将达到最大精度 B 、参数估计量是有偏估计量 C 、参数估计量是非一致估计量 D 、参数将无法估计 6、 对于模型01i i i Y X ββμ=++,为了考虑“地区”因素(北方、南方),引入2 个虚拟变量形成截距变动模型,则会产生 ( ) A 、序列的完全相关 B 、序列的不完全相关 C 、完全多重共线性 D 、不完全多重共线性

计量经济学实验报告(多元线性回归 自相关 )

实验报告 课程名称计量经济学 实验项目名称多元线性回归自相关 异方差多重共线性班级与班级代码 08国际商务1班实验室名称(或课室)实验楼910 专业国际商务 任课教师刘照德 学号: 043 姓名:张柳文 实验日期: 2011 年 06 月 23日 广东商学院教务处制

姓名张柳文实验报告成绩 评语: 指导教师(签名) 年月日说明:指导教师评分后,实验报告交院(系)办公室保存。

计量经济学实验报告 实验项目:多元线性回归、自相关、异方差、多重共线性 实验目的:掌握多元线性回归模型、自相关模型、异方差模型、多重共线性模型的估计和检验方法和处理方法 实验要求:选择方程进行多元线性回归;熟悉图形法检验和掌握D-W 检验,理解广义差分法变换和掌握迭代法;掌握Park或 Glejser检验,理解同方差性变换; 实验原理:普通最小二乘法图形检验法 D-W检验广义差分变换加权最小二乘法 Park检验等 实验步骤: 首先:选择数据 为了研究影响中国税收收入增长的主要原因,选择国内生产总值(GDP)、财政支出(ED)、商品零售价格指数(RPI)做为解释变量,对税收收入(Y)做多元线性回归。从《中国统计年鉴》2011中收集1978—2009年各项影响因素的数据。如下表所示: 中国税收收入及相关数据

实验一:多元线性回归 1、将数据导入后,分别对三个解释变量与被解释变量做散点图,选择两个变量作为group打开,在数据表“group”中点击view/graph/scatter/simple scatter,出现数据的散点图,分别如下图所示: 从散点图看,变量间不一定呈现线性关系,可以试着作线性回归。 2、进行因果关系检验

计量经济学实验教学案例实验9_虚拟变量

实验九虚拟变量 【实验目的】 掌握虚拟变量的设置方法。 【实验内容】 一、试根据表9-1的1998年我国城镇居民人均收入与彩电每百户拥有量的统计资料建立我国城镇居民彩电需求函数; 资料来源:据《中国统计年鉴1999》整理计算得到 二、试建立我国税收预测模型(数据见实验一); 资料来源:《中国统计年鉴1999》 三、试根据表9-2的资料用混合样本数据建立我国城镇居民消费函数。

资料来源:据《中国统计年鉴》1999-2000整理计算得到 【实验步骤】 一、我国城镇居民彩电需求函数 ⒈相关图分析; 键入命令:SCAT X Y ,则人均收入与彩电拥有量的相关图如9-1所示。 从相关图可以看出,前3个样本点(即低收入家庭)与后5个样本点(中、高收入)的拥有量存在较大差异,因此,为了反映“收入层次”这一定性因素的影响,设置虚拟变量如下: ?? ?=低收入家庭 中、高收入家庭 1D 图9-1 我国城镇居民人均收入与彩电拥有量相关图 ⒉构造虚拟变量; 方式1:使用DATA 命令直接输入; 方式2:使用SMPL 和GENR 命令直接定义。 DATA D1 GENR XD=X*D1 ⒊估计虚拟变量模型: LS Y C X D1 XD 再由t 检验值判断虚拟变量的引入方式,并写出各类家庭的需求函数。 按照以上步骤,虚拟变量模型的估计结果如图9-2所示。

图7-2 我国城镇居民彩电需求的估计 我国城镇居民彩电需求函数的估计结果为: i i i i XD D x y 0088.08731.310119.061.57?-++= =t (16.249)(9.028) (8.320) (-6.593) 2R =0.9964 2R =0.9937 F =366.374 S.E =1.066 虚拟变量的回归系数的t 检验都是显著的,且模型的拟合优度很高,说明我国城镇居民低收入家庭与中高收入家庭对彩电的消费需求,在截距和斜率上都存在着明显差异,所以以加法和乘法方式引入虚拟变量是合理的。低收入家庭与中高收入家庭各自的需求函数为: 低收入家庭: i i x y 0119.061.57?+= 中高收入家庭: ()()i i x y 0088.00119.08731.3161.57 ?-++=i x 003.048.89+= 由此可见我国城镇居民家庭现阶段彩电消费需求的特点:对于人均年收入在3300元以下的低收入家庭,需求量随着收入水平的提高而快速上升,人均年收入每增加1000元,百户拥有量将平均增加12台;对于人均年收入在4100元以上的中高收入家庭,虽然需求量随着收入水平的提高也在增加,但增速趋缓,人均年收入每增加1000元,百户拥有量只增加3台。事实上,现阶段我国城镇居民中国收入家庭的彩电普及率已达到百分之百,所以对彩电的消费需求处于更新换代阶段。 二、我国税收预测模型 要求:设置虚拟变量反映1996年税收政策的影响。 方法:取虚拟变量D1=1(1996年以后),D1=0(1996年以前)。 键入命令:GENR XD=X*D1 LS Y C X D1 XD 则模型估计的相关信息如图7-3所示。

计量经济学简单线性回归实验报告精编

实验报告 1. 实验目的随着中国经济的发展,居民的常住收入水平不断提高,粮食销售量也不断增长。研究粮食年销售量与人均收入之间的关系,对于探讨粮食年销售量的增长的规律性有重要的意义。 2. 模型设定 为了分析粮食年销售量与人均收入之间的关系,选择“粮食年销售量” 为被解释变量(用Y 表示),选择“人均收入”为解释变量(用X 表 示)。本次实验报告数据取自某市从1974 年到1987 年的数据(教材书上101页表3.11),数据如下图所示:

1粮食年销售量Y/万吨人均收入X/ rF1974[ 9& 45153.2 1975100.7190 pl1976102.8240.3 1977133. 95301.12 [61978140.13361 71979143.11420 8—1980146.15491.76「91981144.6501 101982148. 94529.2 1 11-1983158.55552. 72匸1984169. 68771.16 131985P 162.1481L8 14二1986170. 09988.43 1519871F& 691094.65为分析粮食年销售量与人均收入的关系,做下图所谓的散点图 从散点图可以看出粮食年销售量与人均收入大体呈现为线性关 系,可以建立如下简单现行回归模型: 3?估计参数

Y t = ■? 1 2 X t ——I t 假定所建模型及其中的随机扰动项叫满足各项古典假定,可以 用OLS法估计其参数。 通过利用EViews对以上数据作简单线性回归分析,得出回归结果如下表所示: Dependent Variable Y Method: Least Squares Date 10/15/11 Time 14 49 Sample- 1 14 Included observations: 14 Variable Coefficient Std Error t-Statistic Prob C99 61349 6 431242 15 489000 0000 X0.0814700.010738 7.5071190.0000 R-squared0 827493Mean dependent var142 7129 Adjusted R-squared0 813123S.D. dependent var26.09805 S E of regression11 28200Akaike info criterion7 915858 Sum squared resid1527 403Schwarz criterion7 907152 Log likelihood-52.71101F-statisti c5756437 Durbin-V/atson stat0 638969Prob(尸-statistic)0 000006 可用规范的形式将参数估计和检验的结果写为: A Y t =99.61349+0.08147 X t (6.431242)(0.10738) t= (15.48900) (7.587119) R2=0.827498 F=57.56437 n=14 4?模型检验 (1).经济意义检验 A A 所估计的参数1=99.61349, 1 2=0.08147,说明人均收入每增加 1元,平均说来可导致粮食年销售量提高0.08147元。这与经济学中

第八章虚拟变量参考答案

练习题8.1参考解答: (1)在其它条件不变的情况下,对数人均收入提高1%,则平均预期寿命可能提高约0.0939年。但从统计检验结果看,对数人均收入lnX 对期望寿命Y 的影响并不显著。方程的拟合情况良好,可进一步进行多重共线性等其他计量经济学的检验。 (2)引入()ln 7i i D X -的原因是想从截距和斜率两个方面考证将人均收入超过1097美元的国家定义为富国的话,贫国和富国的预期寿命是否存在显著的区别。 如果人均收入大于1097美元,那么虚拟变量取值为1,否则为0。即: 1 1097 (l n ()7)0 1097 i i D X ?-=??人均收入大于美元人均收入低于 美元 (3) 对于贫穷国,其回归方程为: 2.409.39ln i X -+ 对于富国,其回归方程为: 2.40(9.39- 3.36)ln 3.36*721.12 6.03ln i i X X -++=+ 习题8.2参考答案 由于有四个季度,因此引入三个季度虚拟变量 1 1 1 1220 0 0 D D D ???===??????一季度二季度三季度其它其它其它 (1)按照加法模型引入三个虚拟变量,模型为:(加法模型的作用是改变了设定模型的截距 水平) i 0112233i i Y =D D D X ααααβμ+++++ 回归结果如下: 123i 22?=6910.449187.7317D 1169.32D 417.1182D 0.038008X t= (3.594792) (-0.28439 (1.835446) 065093256914 R =0.517642 R =0.416093 F=5.097454 DW=0.39625 i Y -+-+)(-.) (.) (2)由于考虑利润对销售额的变化率发生变异,即斜率的改变,因此按照乘法模型引入三 个虚拟变量,模型为: i 01i 1i 12i 23i 3i Y =X X D X D X D ββαααμ+++++ 回归结果如下: i i 1i 2i 322?=7014.7570.037068X -0.000933X D 0.00791X D 0.002385X D t= (3.934394) (3.273896 (-0.216776) 0.0040180.58529 R =0.519733 R =0.418624 F=5.140311 DW=0.429628 i Y ++--)() () (3)按照加法和乘法相结合的方式引入三个虚拟变量,模型为: i 01122331i 2i 13i 24i 3i Y =D D D X X D X D X D ααααββββμ++++++++ 回归结果为: i 123i i 1i 2i 322?Y =10457.394752.26D 3764.21D 4635.46D 0.0159X 0.029X D 0.03X D 0.0266X D t= (2.566) (-0.87 (-0.6860.8320.6280824089960749 R =0.546701 R =0.348383 F=2---++++-)) () () (.) (.)(.).756686 DW=0.464982

计量经济学·多元线性回归模型

计量经济学·多元线性回归模型应用作业 1985~2014年中国GDP与进口、出口贸易总额的关系 一、概述 在当今市场上,一国的GDP与多个因素存在着紧密的联系,例如进口总额和出口总额等都是影响一国GDP 的重要因素。本次将以中国1985-2014年GDP和进口总额、出口总额两个因素因素的数据,通过建立计量经济模型来分析上述变量之间的关系,强调贸易对GDP 的重要性,从而促进国内生产总值的发展。 二、模型构建过程 ⒈变量的定义 解释变量:X1进口贸易总额,X2出口贸易总额被解释变量:Y国内生产总值 建立计量经济模型:解释原油产量与进口贸易总额、出口贸易总额之间的关系。 ⒉模型的数学形式 设定GDP与两个解释变量相关关系模型,样本回归模型为: ⒊数据的收集 该模型的构建过程中共有两个变量,分别是中国从1990-2006年民用汽车拥有量、电力产量、国内生产总值以及能源消费总量,因此为时间序列数据,最后一个即2006年的数据作为预测对比数据,收集的数据如下所示 时间国内生产总值(亿元) 出口总额(人民币亿 元) 进口总额(人民币亿 元) 1985年9039.9 808.9 1257.8 1986年10308.8 1082.1 1498.3 1987年12102.2 1470 1614.2 1988年15101.1 1766.7 2055.1 1989年17090.3 1956 2199.9 1990年18774.3 2985.8 2574.3 1991年21895.5 3827.1 3398.7 1992年27068.3 4676.3 4443.3 1993年35524.3 5284.8 5986.2 1994年48459.6 10421.8 9960.1 1995年61129.8 12451.8 11048.1 1996年71572.3 12576.4 11557.4 1997年79429.5 15160.7 11806.5 1998年84883.7 15223.6 11626.1 1999年90187.7 16159.8 13736.5 2000年99776.3 20634.4 18638.8 2001年110270.4 22024.4 20159.2 2002年121002 26947.9 24430.3 2003年136564.6 36287.9 34195.6 2004年160714.4 49103.3 46435.8 2005年185895.8 62648.1 54273.7

第八章 虚拟变量回归 思考题

第八章 虚拟变量回归 思考题 8.1 什么是虚拟变量 ? 它在模型中有什么作用 ? 8.2 虚拟变量为何只选 0 、 1, 选 2 、 3 、 4 行吗 ? 为什么 ? 8.3 对 (8.10) 式的模型 , 如果选择一个虚拟变量 1,01D ?? =??-? 大专及大专以上,高中 ,高中以下 这样的设置方式隐含了什么假定 ? 这一假定合理吗 ? 8.4 引入虚拟解释变量的两种基本方式是什么 ? 它们各适用于什么情况 ? 8.5 四种加法方式引入虚拟变量会产生什么效应? 8.6 引入虚拟被解释变量的背景是什么?含有虚拟被解释变量模型的估计方法有哪些 ? 8.7 设服装消费函数为 12233t i i i i Y D D X u αααβ=++++ 其中, i X =收入水平 ;Y = 年服装消费支出 ; 1,30D ?=? ?大专及大学以上 ,其他 ;1,20D ?=??女性,其他 试写出不同人群组的服装消费函数模型。 8.8 利用月度数据资料 ,为了检验下面的假设,应引入多少个虚拟解释变量 ? 1) 一年里的 12 个月全部表现出季节模式 ; 2) 只有 2 月、 6 月、 8 月、 10 月和 12 月表现出季节模式。 练习题 8.1 1971 年 ,Sen 和 Sztvastava 在研究贫富国之间期望寿命的差异时 , 利用 101 个国家的数据 , 建立了如下回归模型 []? 2.409.39ln 3.36(ln 7)i i i i Y X D X =-+-- (4.37)(0.857)(2.42) R2=0.752 其中 ,X 是以美元计的人均收入 ;Y 是以年计的期望寿命 ; Sen 和 Srimstava 认为人均收入的临界值为 1097 美元 (ln1097=7), 若人均收入超过 1097 美元 , 则被认定为富国 ; 若人均收入低于1097美元 , 被认定为贫穷国。括号内的数值为对应参数估计值的t 值。 1) 解释这些计算结果。 2) 回归方程中引入(ln 7)i i D X =-的原因是什么?如何解释这个回归解释变量? 3) 如何对贫穷国进行回归 ? 又如何对富国进行回归 ? 4)这个回归结果中可得到的一般结论是什么 ?

计量经济学范本

第八章 虚拟变量 一、单选题: 1、虚拟变量模型i i i D Y μβα++=中,i Y 为居民的年可支配收入,i D 为虚拟解释变量, i D =1代表城镇居民,i D =0代表非城镇居民。当i μ满足古典假设时,则α ==)0|(i i D Y E 表示( B ) A 、城镇居民的年平均收入, B 、非城镇居民的年平均收入, C 、所有居民的年平均收入, D 、其他; 2、虚拟变量模型i i i D Y μβα++=中,i Y 为居民的年可支配收入,i D 为虚拟解释变量, i D =1代表城镇居民,i D =0代表非城镇居民。当i μ满足古典假设时,则βα+==)1|(i i D Y E 表示( A ) A 、城镇居民的年平均收入, B 、非城镇居民的年平均收入, C 、所有居民的年平均收入, D 、其它; 3、在没有定量解释变量的情形下,以加法形式引入虚拟解释变量,主要用于( C )。 A 、共线性分析, B 、自相关分析, C 、方差分析 , D 、其它 4、如果你有连续几年的月度数据,如果只有2、4、6、8、10、12月表现季节类型,则需要引入虚拟变量的个数是( B )。 A 、模型中有截距项时,引入12个, B 、模型中有截距项时,引入5个 C 、模型中没有截距项时,引入11个, D 、模型中没有截距项时,引入12个 5、下列不属于常用的虚拟变量模型是( D ); A 、解释变量中只包含虚拟变量, B 、解释变量中既含定量变量又含虚拟变量, C 、被解释变量本身为虚拟变量的模型, D 、解释变量和被解释变量中不含虚拟变量。 6、考虑虚拟变量模型:i i i X D D D Y μβαααα+++++=3322110,其中 ???=其他一季度011D ???=其他二季度012D ???=其他 三季度013D , 当其随机扰动项服从古典假定时,则下列回归方程中表示一季度的是:( B ) A 、i i i X D D D X Y E βαα++====)()0,1,|(20312 B 、i i i X D D D X Y E βαα++====)()0,1,|(10321 C 、i i i X D D D X Y E βαα++====)()0,1,|(30213 D 、i i i X D D D X Y E βα+====0321)0,|( 7、在含有截距项的分段线性回归分析中,如果只有一个属性变量,且其有三种类型,则引入虚拟变量个数应为( B ) A 、 1个, B 、 2个, C 、3个, D 、4个; 8、某商品需求函数为 u x b b y i i i ++=10,其中y 为需求量,x 为价格。为了考虑“地

《计量经济学》虚拟变量练习题及参考答案

一、选择题 1、 对于一个含有截距项的计量经济模型,若某定性因素有m 个互斥的类型,为将其引入模型中,则需要引入虚拟变量个数为( B ) A. m B. m-1 C. m+1 D. m-k 2、 在经济发展发生转折时期,可以通过引入虚拟变量方法来表示这种变化。例如,研究中国城镇居民消费函数时。1991年前后,城镇居民商品性实际支出Y 对实际可支配收入X 的回归关系明显不同。现以1991年为转折时期,设虚拟变 量???=年以前,年以后,1991019911t D ,数据散点图显示消费函数发生了结构性变化:基本消费部分下降了,边际消费倾向变大了。则城镇居民线性消费函数的理论方程可以写作( D ) A. t t t u X Y ++=10ββ B. t t t t t u X D X Y +++=210βββ C. t t t t u D X Y +++=210βββ D. t t t t t t u X D D X Y ++++=3210ββββ 3、设某地区消费函数中,消费支出不仅与收入x 有关,而且与消费者的年龄构成有关,若将年龄构成分为小孩、青年人、成年人和老年人4个层次。假设边际消费倾向不变,考虑上述年龄构成因素的影响时,该消费函数引入虚拟变量的个数为 ( C ) A.1个 B.2个 C.3个 D.4个 4、在利用月度数据构建计量经济模型时,如果一年里的12个月全部表现出季节模式,则应该引入虚拟变量个数为( C ) A. 4 B. 12 C. 11 D. 6 5、在利用月度数据构建计量经济模型时,如果一年里的1、3、5、9四个月表现出季节模式,则应该引入虚拟变量个数为( 3个 ) 6、个人保健支出的计量经济模型为:i i i i X D Y μβαα+++=221 ,其中i Y 为保健年度 支出;i X 为个人年度收入;虚拟变量 ???=大学以下大学及以上 012i D ;i μ满足古典假定。则大学以上群体的平均年度保健支出为 ( B ) A. i i i i X D X Y E βα+==12)0,/( B.i i i i X D X Y E βαα++==212)1,/(

计量经济学多元线性回归

低碳农业发展影响因素分析——以新疆南疆五地州为例 学生姓名方芳 学号1075717008 所属学院经济与管理学院 专业农村与区域发展 塔里木大学教务处制

目录 1 引言 (1) 2 数据来源和研究方法 (1) 2.1数据来源 (1) 2.2研究方法 (2) 3 模型检验与结果 (3) 3.1初始模型计量 (3) 3.2检验 (3) 4 结论与建议 (4) 5 参考文献 (4)

低碳农业发展影响因素分析 --以新疆南疆五地州为例 方芳 摘要:全球变暖问题引起世界各国的广泛关注,这一变化使得自然灾害频发,甚至危及人类安全,因此解决这一问题迫在眉睫。通过对新疆南疆五地州的农业总产值与化肥施用量、农用机械总动力及农作物总播种面积进行回归分析后,发现化肥施用量对农作物的总产值影响极大,是其主要的制约因素。要发展低碳农业应转变农业生产方式,实施保护性耕作;应推广施肥新技术,提高化肥利用率;应改进装置,利用新技术生产化肥;发展生态农业,实现经济循环发展。 关键字:低碳农业影响因素回归分析 1 引言 近年来气候变化所导致的高温热潮、暴雨连连、旱灾、沙尘暴频发事件的概率持续增加,CO2是造成该现象的源头之一,因此,发展低碳经济、发展节能减排成为全球关注的热点。2014 年《中美气候变化联合声明》提出我国将于2030 年左右达到碳排放峰值的庄严承诺,2015 年12 月12 日,195个缔约方在巴黎达成了新的全球气候协议———《巴黎协议》,提出努力将气温升幅限制在1.5℃内的目标。农业碳排放量介于电热生产和尾气之间,成为第二大排放源,占我国碳排放总量的17%。新疆位于亚欧大陆腹地,地处中国西北边陲,是中国面最大、交界邻国最多、陆地边境线最长的省区,肩负着与重要世界经济资源大国沿边开放的重任。同时,新疆作为我国重要的种植业和畜牧业基地,以8%的绿洲面积承载了90%以上的人口、耕地和生产总值,绿色生态压力相当严峻。新疆南疆位于天山以南的塔里木盆地 ,四周高山环抱。在行政区划上包括巴音郭楞、阿克苏、喀什、克孜勒苏、和田等五地州及生产建设兵团的四个农业师。塔里木河是我国最大的内陆河,它由西向东1321km,流域覆盖新疆南部地区,面积102万km2,人口825.7万 ,分别占新疆自治区的61%和 47%,是我国重要的棉花基地。冉锦成、苏洋等人研究表明,南疆各地 (州,市) 区域差异明显,喀什地区属碳排放量、碳排放强度“双高”型地区,因此,通过对农业产值与化肥施用量、机械总动力以及农作物播种面积的回归分析,试图找到影响低碳农业发展的主要因素,并提出相关的建议,促进农业实现低碳生产。 2 数据来源和研究方法 2.1数据来源 本文选取的是新疆2006--2016年的农业生产数据,其中包括:农业总产值(亿)Y,化肥施用量(万吨)(X1)、农用机械总动力(万千瓦)(X2)、农作物总播种面积(万公顷)(X3),数据来源于《中国统计年鉴》和《新疆统计年鉴》(2006--2016),数据见表1。 表1 新疆统计年鉴2006-2016样本数据

计量经济学:第八章 虚拟变量回归

第八章 虚拟变量回归 第一节 虚拟变量的概念 一、问题的提出 计量经济学模型对变量的要求——可观测、可计量。但在现实经济问题中,存在定性影响因素,比如 1、属性(品质)因素的表达。 在经济活动中,有的经济变量的变动要受到属性因素(或品质因素)的影响。如收入在形成过程中,不同的性别所得到的收入是不一样的;在城乡、不同地区等收入存在差距;再比如,在我国,经济的发展水平对于不同的区域有不同的表现。 2、异常值现象。 当经济运行过程中,可能会受到突发事件的影响,那么,其值有可能出现异常,偏离正常轨迹很远,对这类现象需要加以修正。 3、季节因素的影响。 有的经济现象存在明显的季节特征,如啤酒的消费。那么,在建模过程中,季节变动这一因素怎样考虑? 4、离散选择现象的描述。 如公共交通与私人交通的选择、商品购买与否的决策、求职者对职业的选择等。 第1、2、3种情况属于解释变量为定性变量,第4情况为被解释变量属于定性变量。称前一种情况为虚拟解释变量,后一种为虚拟被解释变量。本章主要介绍虚拟解释变量的内容。 二、虚拟变量的定义 1、定义。设变量D 表示某种属性,该属性有两种类型,即当属性存在时D 取值为1;当属性不存在时D 取值为0。记为 ???=不具有该属性 具有某种属性01D

2、虚拟变量引入的规则。 (1)在模型里存在截距项的条件下,如果一个属性存在m 个相互排斥类型(非此即彼),则在模型里引入m-1个虚拟变量。否则,会出现完全的多重共线性。但要注意,在模型无截距项的情况下,如果一个属性存在m 个类型,即便引入m 个变量,不会出现多重共线性问题。( 请思考为什么?) (2)虚拟变量取值为0,意味着所对应的类型是基础类型。而虚拟变量取值为1,代表与基础类型相比较的类型,称为比较类型。例如“有学历”D 为1,“无学历”D 为0,则“无学历”就是基础类型,“有学历”为比较类型。 (3)当属性有m 个类型时,不能把虚拟变量的取值设成如下情况 D=0, 第一个类型; D=1, 第二个类型; …… D=m-1, 第m 个类型。 原因是上述情况没有反映出属性类型的相互排斥性。 第二节 虚拟解释变量的回归 一、加法引入规则 1、加法引入规则,虚拟解释变量与别的解释变量以相加的关系出现在模型里。加法引入虚拟变量对模型产生的结果是只改变截距项。 设模型为 123i i i i Y X D u βββ=+++ 式中,i D 为虚拟变量,它与其它解释变量是相加的关系。如果虚拟变量按这种方式引入模型,则称虚拟变量按加法类型引入。 2、加法引入虚拟变量的应用。 (1)模型中只有一个定性解释变量。 设模型形式为 12i i i Y D u ββ=++ n i ,,3,2,1 = 其中,i D 为具有两个属性类型的定性变量,如在教材第217页,设i Y 为居民的

计量经济学实验报告(虚拟变量)

计量经济学实验报告 实验三:虚拟变量模型 姓名:上善若水 班级: 序号: 学号: 中国人均消费影响因素 一、理论基础及数据 1. 研究目的 本文在现代消费理论的基础,分析建立计量模型,通过对 1979—— 2008 年全国城镇居民的人均消费支出做时间序列分析和对2004— 2008年各地区(31 个省市)城镇居民的人均消费支出做面板数据分析,比较分析了人均可支配收入、消费者物价指数和银行一年期存款利率等变量对居民消费的不同影响。

2. 模型理论 西方消费经济学者们认为,收入是影响消费者消费的主要因素,消费是需求的函数。消费经济学有关收入与消费的关系,即消费函数理论有:( 1)凯恩斯的绝对收入理论。他认为消费主要取决于消费者的净收入,边际消费倾向小于平均消费倾向。他假定,人们的现期消费,取决于他们现期收入的绝对量。(2)杜森贝利的相对收入消费理论。他认为消费者会受自己过去的消费习惯以及周围消费水准来决定消费,从而消费是相对的决定的。当期消费主要决定于当期收入和过去的消费支出水平。(3)弗朗科?莫迪利安的生命周期的消费理论。这种理论把人生分为三个阶段:少年、壮年和老年;在少年与老年阶段,消费大于收入;在壮年阶段,收入大于消费,壮年阶段多余的收入用于偿还少年时期的债务或储蓄起来用来防老。( 4)弗里德曼的永久收入消费理论。他认为消费者的消费支出主要不是由他的现期收入来决定,而是由他的永久收入来决定的。这些理论都强调了收入对消费的影响。除此之外,还有其他一些因素也会对消费行为产生影响。(1)利率。传统的看法认为,提高利率会刺激储蓄,从而减少消费。当然现代经济学家也有不同意见,他们认为利率对储蓄的影响要视其对储蓄的替代效应和收入效应而定,具体问题具体分析。( 2)价格指数。价格的变动可以使得实际收入发生变化,从而改变消费。 基于上述这些经济理论,我找到中国 1979-2008 年全国城镇居民人均消费以及城镇居民人均可支配收入、城镇居民消费者物价指数和 2004— 2008年各地区城镇居民人均消费以及城镇居民人均可支配收入、城镇居民消费者物价指数、以及银行一年期存款利率的官方数据。想借此来分析中国消费的影响因素以及它们具体是如何对消费产生影响的。针对这一模型,有以下两个假定。一,自改革开放以来,我国人均消费倾向呈现缓慢的递减趋势,即保持粘性。这一假定符合我国居民的储蓄——消费心理,也与其他一些发展中国家的情况大体一致。二,由储蓄和消费的替代关系,可以假定刺激储蓄的因素,会制约消费。我们知道提高利率会刺激储蓄,因而我把利率也引入模型的分析中。 以下对我所找的数据作一一说明 : 1、城镇居民人均消费水平。借此来代表城镇居民的消费支出情况,这是将要建立计量经济学模型的被解释变量。由下图可以看到消费是逐年增加的,与此同时,人均可支配收入也是逐年增加,隐含着两者可能有很高的线性相关性这层意思。

第8章 虚拟变量回归

计量经济学课程教案授课题目(教学章、节或主题): 第8章 虚拟变量回归 授课时间 安排 第16周共2课时教学器材与工具多媒体 授 课 类 型(请打√)理论课√讨论课□ 实验课□ 习题课□ 双语课程□ 其他□ 教学目的、要求(分掌握、熟悉、了解三个层次): 1、熟悉虚拟变量的含义; 2、掌握虚拟变量设置原则; 3、掌握虚拟变量回归引入方法; 4、了解虚拟被解释变量模型。 教学重点及难点: 虚拟变量回归引入方法与估计方法 教 学 基 本 内 容 §1 虚拟变量 §2 虚拟解释变量的回归 §3 虚拟被解释变量* §4 案例分析 教学过程设计: 一、引入 二、讲授 三、小结 教学方法及手段(请打√):讲授√、讨论□、多媒体讲解√、模型、实物讲解□、挂图讲解□、音像讲解□等。 作业、讨论题、思考题: 1、什么是虚拟变量?它在模型中有什么作用? 参考资料(含参考书、文献等):《计量经济学》,(美)D.Gujarati 著,林少宫译;《计量经济学》,李子奈编著;《经济计量学精要》,(美)D.Gujarati著,张寿等译。 课后小结:虚拟变量从本质上说是“数据分类器”,它根据样本的属性(性别、婚姻状况、种族、宗教等等)将样本分为各个不同的子群体并对

每个子群体进行回归分析。若模型包含多个定性变量,而且每个定性变量有多种分类,则引入模型的虚拟变量将消耗大量的自由度。因此,应当权衡进入模型的虚拟变量的个数以免超过样本观察值的个数。

第8章 虚拟变量回归 §8.1 虚拟变量 一、虚拟变量的基本含义 许多经济变量是可以定量度量的,如:商品需求量、价格、收入、产量等。 但也有一些影响经济变量的因素无法定量度量,如:职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等。 为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”, 这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量(dummy variables),记为D。 例如,反映文程度的虚拟变量可取为: 1, 本科学历 D= 0, 非本科学历 一般地,在虚拟变量的设置中: 基础类型、肯定类型取值为1; 比较类型,否定类型取值为0。 二、虚拟变量的设置原则 虚拟变量的个数须按以下原则确定: 每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1,即如果有m个定性变量,只在模型中引入m-1个虚拟变量。 例。已知冷饮的销售量Y除受k种定量变量Xk的影响外,还受春、夏、秋、冬四季变化的影响,要考察该四季的影响,只需引入三个虚拟变量即可: 则冷饮销售量的模型为: 在上述模型中,若再引入第四个虚拟变量:

计量经济学实验报告 虚拟变量

实验三:虚拟变量模型一、研究的目的与要求 根据下表2009年我国城镇居民人均收入与住房方面消费性支出的统计资料建立我国城镇居民住房方面消费性支出函数。 二、模型设立 1、问题描述:2009年我国城镇居民人均收入对住房方面消费性支出的影响。 2、数据: 我国城镇居民家庭抽样调查资料 平均每人全部年 项目住房 D 收入 (元) 困难户60.83 4935.81 0 最低收入户84.73 5950.68 0 低收入户123.92 8956.81 0 中等偏下户178.48 12345.17 0 中等收入户261.37 16858.36 0 中等偏上户526.36 23050.76 1 高收入户659.61 31171.69 1 最高收入户1482.11 51349.57 1 三、相关图分析; 1. 键入命令:SCAT X Y,则人均收入与住房方面消费性支出的相关散点图如下图所示。 从相关图可以看出,前5个样本点(即中低收入家庭)与后3个样本点(中、

高收入)的消费性支出存在较大差异,因此,为了反映“收入层次”这一定性因素的影响,设置虚拟变量如下: 2. 构造虚拟变量。 使用SMPL和GENR命令直接定义。 DATA D1 GENR XD=X*D1 3. 估计虚拟变量模型: 再由t检验值判断虚拟变量的引入方式,并写出各类家庭的消费性支出函数。虚拟变量模型的估计结果如下: Dependent Variable: Y Method: Least Squares Date: 01/03/12 Time: 15:25 Sample: 2001 2008 Included observations: 8 Variable Coefficient Std. Error t-Statistic Prob.?? X 0.016400 0.005743 2.855676 0.0461 D1 -327.1185 118.4766 -2.777039 0.0498 XD 0.018709 0.006356 2.943588 0.0422 C -19.00288 61.67034 -0.308136 0.7734 R-squared 0.992173 ????Mean dependent var 422.1763 Adjusted R-squared 0.986303 ????S.D. dependent var 479.4838 S.E. of regression 56.11683 ????Akaike info criterion 11.19960 Sum squared resid 12596.40 ????Schwarz criterion 11.23932 Log likelihood -40.79841 ????F-statistic 169.0152 Durbin-Watson stat 3.162055 ????Prob(F-statistic) 0.000115 我国城镇居民住房方面消费性支出函数的估计结果为: t (-0.308136) ( 2.855676) (-2.777039) (2.943588) 2 R=0.9921732 R=0.986303 F=169.0152 S.E=56.11683 虚拟变量的回归系数的t检验都是显着的,且模型的拟合优度很高,说明我

计量经济学多元回归分析案例

计量经济学案例分析 多元回归分析案例

财政收入规模的影响因素 被解释变量:财政收入(亿元) 解释变量:税收(亿元),经济活动人口(亿元),国内生产总值(亿元) 样本:2000年—2011年的财政收入,税收(亿元),经济活动人口(亿元),国内生产总值(亿元) 数据来源:中华人民共和国国家统计局(单位:亿元) 财政收入Y 各项税收 X1 经济活动人口 X2 国民生产总值X3 1990 2,937.10 2,821.86 65,323.00 18,668.00 1991 3,149.48 2,990.17 66,091.00 21,618.00 1992 3,483.37 3,296.91 66,782.00 26,924.00 1993 4,348.95 4,255.30 67,468.00 35,334.00 1994 5,218.10 5,126.88 68,135.00 48,198.00 1995 6,242.20 6,038.04 68,855.00 60,794.00 1996 7,407.99 6,909.82 69,765.00 71,177.00 1997 8,651.14 8,234.04 70,800.00 78,973.00 1998 9,875.95 9,262.80 72,087.00 84,402.00 1999 11,444.08 10,682.58 72,791.00 89,677.00 2000 13,395.23 12,581.51 73,992.00 99,215.00 2001 16,386.04 15,301.38 73,884.00 109,655.00 2002 18,903.64 17,636.45 74,492.00 120,333.00 2003 21,715.25 20,017.31 74,911.00 135,823.00 2004 26,396.47 24,165.68 75,290.00 159,878.00 2005 31,649.29 28,778.54 76,120.00 183,085.00 2006 38,760.20 34,804.35 76,315.00 211,923.00 2007 51,321.78 45,621.97 76,531.00 257,306.00 2008 61,330.35 54,223.79 77,046.00 307,064.00 2009 68,518.30 59,521.59 77,510.00 335,353.00 2010 83,101.51 73,210.79 78,388.00 362,181.00 2011 103,874.43 89,738.39 78,579.00 471,564.00

相关主题
文本预览
相关文档 最新文档