当前位置:文档之家› 计量经济学多元线性回归、多重共线性、异方差实验报告

计量经济学多元线性回归、多重共线性、异方差实验报告

计量经济学多元线性回归、多重共线性、异方差实验报告
计量经济学多元线性回归、多重共线性、异方差实验报告

计量经济学实验报告

多元线性回归、多重共线性、异方差实验报告

一、研究目的和要求:

随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。尤其是假日旅游,有力刺激了居民消费而拉动内需。2012年,我国全年国内旅游人数达到30.0亿人次,同比增长13.6%,国内旅游收入2.3万亿元,同比增长19.1%。旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化产业结构,而且可以增加国家外汇收入,促进国际收支平衡,加强国家、地区间的文化交流。为了研究影响旅游景区收入增长的主要原因,分析旅游收入增长规律,需要建立计量经济模型。

影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。因此选取我国31个省市地区的旅游业相关数据进行定量分析我国旅游业发展的影响因素。

二、模型设定

根据以上的分析,建立以下模型

Y=β

0+β1X

1

+β2X

2

3

X

3

4

X

4

+Ut

参数说明:

Y ——旅游景区营业收入/万元X

1

——旅游业从业人员/人

X

2

——旅游景区固定资产/万元

X

3

——旅游外汇收入/万美元

X

4

——城镇居民可支配收入/元

收集到的数据如下(见表2.1):

表2.1 2011年全国旅游景区营业收入及相关数据(按地区分)

数据来源:1.中国统计年鉴2012,

2.中国旅游年鉴2012。

三、参数估计

利用Eviews6.0做多元线性回归分析步骤如下:

1、创建工作文件

双击Eviews6.0图标,进入其主页。在主菜单中依次点击“File\New\Workfile”,出现对话框“Workfile Range”。本例中是截面数据,在workfile structure type中选择“Unstructured/Undated”,在Date range中填入observations 31,点击ok键,完成工作文件的创建。

2、输入数据

在命令框中输入 data Y X1 X2 X3 X4,回车出现“Group”窗口数据编辑框,在对应的Y X1 X2 X3 X4下输入相应数据,关闭对话框将其命名为group01,点击ok,保存。

对数据进行存盘,点击“File/Save As”,出现“Save As”对话框,选择存入路径,并将文件命名,再点“ok”。

3、参数估计

在Eviews6.0命令框中键入“LS Y C X1 X2 X3 X4”,按回车键,即出现回归结果。

利用Eviews6.0估计模型参数,最小二乘法的回归结果如下:

表3.1 回归结果

Dependent Variable: Y

Method: Least Squares

Date: 11/14/13 Time: 21:14

Sample: 1 31

Included observations: 31

Coefficient Std. Error t-Statistic Prob.

C 32390.83 39569.49 0.818581 0.4205

X1 0.603624 0.366112 1.648741 0.1112

X2 0.234265 0.041218 5.683583 0.0000

X3 0.044632 0.060755 0.734620 0.4691

X4 -1.914034 2.098257 -0.912202 0.3700

R-squared 0.879720 Mean dependent var 114619.2 Adjusted R-squared 0.861215 S.D. dependent var 112728.1

S.E. of regression 41995.55 Akaike info criterion 24.27520

Sum squared resid 4.59E+10 Schwarz criterion 24.50649

Log likelihood -371.2657 Hannan-Quinn criter. 24.35060

F-statistic 47.54049 Durbin-Watson stat 2.007191

Prob(F-statistic) 0.000000

根据表中的样本数据,模型估计结果为

^

Y=32390.83+0.603624X

1+0.234265X

2

+0.044632X

3

-1.914034X

4

(39569.49)(0.366112)(0.041218)(0.060755)(2.098257)t = (0.818581) (1.648741) (5.683583) (0.734620) (-0.912202)

R2=0.879720

-

-

R2=0.861215 F=47.54049 DW=2.007191

可以看出,可决系数R2=0.879720,修正的可决系数

-

-

R2=0.861215。说明模

型的拟合程度还可以。但是当α=0.05时,X

1、X

2

、X

4

系数均不能通过检验,

且X

4

的系数为负,与经济意义不符,表明模型很可能存在严重的多重共线性。

四、模型修正

1.多重共线性的检验与修正

(1)检验

选中X1 X2 X3 X4数据,点击右键,选择“Open/as Group”,在出现的对话框中选择“View/Covariance Analysis/correlation”,点击ok,得到相关系数矩阵。

计算各个解释变量的相关系数,得到相关系数矩阵。

表4.1 相关系数矩阵

变量X1 X2 X3 X4

X1 1.0000000.8097770.8720930.659239

X2 0.809777 1.0000000.7583220.641086

X3 0.8720930.758322 1.0000000.716374由相关系数矩阵可以看出,解释变量X2、X3之间存在较高的相关系数,证实确实存在严重的多重共线性。

(2)多重共线性修正

采用逐步回归的办法,检验和回归多重共线性问题。分别作Y对X1、X2、X3、X4的一元回归,在命令窗口分别输入LS Y C X1,LS Y C X2,LS Y C X3,LS Y C X4,并保存,整理结果如表4.2所示。

表4.2 一元回归结果 变量 X1 X2 X3 X4 参数估计值 1.978224 0.315120 0.316946 12.54525 t 统计量 8.635111 12.47495 6.922479 4.005547 R 2

0.719983 0.842924 0.622988 0.356191 -

2R

0.710327

0.837508

0.609988

0.333991

其中,X2的方程-

2R 最大,以X2为基础,顺次加入其它变量逐步回归。在命令窗口中依次输入:LS Y C X2 X1,LS Y C X2 X3, LS Y C X2 X4,并保存结果,整理结果如表4.3所示。

表4.3 加入新变量的回归结果(一)

经比较,新加入X1的方程-2

R =0.866053,改进最大,而且各个参数的t 检验显著,选择保留X1

,再加入其它新变量逐步回归,在命令框中依次输入:LS Y C X2 X1 X3,LS Y C X2 X1 X4,保存结果,整理结果如表4.4所示。

表4.4 加入新变量的回归结果(二) 当加入X3或X4时,-2

R 均没有所增加,且其参数是t 检验不显著。从相关系数可以看出X3、X4与X1、X2之间相关系数较高,这说明X3、X4引起了多重共线性,予以剔除。

当取α=0.05时,t α/2(n-k-1)=2.048,X1、X2的系数t 检验均显著,这是最后

消除多重共线性的结果。

修正多重共线性影响后的模型为

^

Y= 0.711446 X

1+0.230304 X

2

(0.265507)(0.039088)t = (2.679575) (5.891959)

R2=0.874983

2

R=0.866053 F=97.98460 DW=1.893654

在确定模型以后,进行参数估计

表4.5消除多重共线性后的回归结果

Dependent Variable: Y

Method: Least Squares

Date: 11/14/13 Time: 21:47

Sample: 1 31

Included observations: 31

Coefficient Std. Error t-Statistic Prob.

C -4316.824 12795.42 -0.337373 0.7384

X1 0.711446 0.265507 2.679575 0.0122

X2 0.230304 0.039088 5.891959 0.0000

R-squared 0.874983 Mean dependent var 114619.2 Adjusted R-squared 0.866053 S.D. dependent var 112728.1 S.E. of regression 41257.10 Akaike info criterion 24.18480 Sum squared resid 4.77E+10 Schwarz criterion 24.32357 Log likelihood -371.8644 Hannan-Quinn criter. 24.23004 F-statistic 97.98460 Durbin-Watson stat 1.893654 Prob(F-statistic) 0.000000

五、异方差检验

在实际的经济问题中经常会出现异方差这种现象,因此建立模型时,必须要注意异方差的检验,否则,在实际中会失去意义。

(1)检验异方差

由表 4.5的结果,按路径“View/Residual Tests/Heteroskedasticity Tests”,在出现的对话框中选择Specification:White,点击ok.得到White 检验结果如下。

表5.1 White检验结果

Heteroskedasticity Test: White

F-statistic 3.676733 Prob. F(5,25) 0.0125

Obs*R-squared 13.13613 Prob. Chi-Square(5) 0.0221

Scaled explained SS 15.97891 Prob. Chi-Square(5) 0.0069

Test Equation:

Dependent Variable: RESID^2

Method: Least Squares

Date: 11/14/13 Time: 21:48

Sample: 1 31

Included observations: 31

Coefficient Std. Error t-Statistic Prob.

C -1.10E+09 1.11E+09 -0.992779 0.3303

X1 -12789.36 30151.30 -0.424173 0.6751

X1^2 0.420716 0.294332 1.429393 0.1653

X1*X2 -0.101814 0.083576 -1.218216 0.2345

X2 14604.52 5047.701 2.893301 0.0078

X2^2 -0.002489 0.008030 -0.309972 0.7592

R-squared 0.423746 Mean dependent var 1.54E+09

Adjusted R-squared 0.308495 S.D. dependent var 2.70E+09

S.E. of regression 2.24E+09 Akaike info criterion 46.07313

Sum squared resid 1.26E+20 Schwarz criterion 46.35068

Log likelihood -708.1335 Hannan-Quinn criter. 46.16360

F-statistic 3.676733 Durbin-Watson stat 1.542170

Prob(F-statistic) 0.012464

从上表可以看出,nR2=13.13613,由White检验可知,在α=0.05下,查2χ

(5)=11.0705,比较计算的2χ统计量与临界值,因为分布表,得临界值χ2

.0

05

(5)=11.0705,所以拒绝原假设,表明模型存在异方差。

nR2=13.13613>χ2

.0

05

(2)异方差的修正

①用WLS估计:选择权重w=1/e1^2,其中e1=resid。

在命令窗口中输入 genr e1= resid,点回车键。

在消除多重共线性后的回归结果(表4.5的回归结果)对话框中点击

Estimate/Options/Weithted LS/TSLS,并在Weight中输入1/e1^2,点确定,得到

如下回归结果。

表5.2用权数1/e1^2的回归结果

Dependent Variable: Y

Method: Least Squares

Date: 11/14/13 Time: 21:49

Sample: 1 31

Included observations: 31

Weighting series: 1/E1^2

Coefficient Std. Error t-Statistic Prob.

C -7074.873 389.4944 -18.16425 0.0000

X1 0.788277 0.013692 57.57099 0.0000

X2 0.235806 0.000968 243.6786 0.0000

Weighted Statistics

R-squared 0.999848 Mean dependent var 31056.56

Adjusted R-squared 0.999837 S.D. dependent var 171821.4

S.E. of regression 4.259384 Akaike info criterion 5.827892

Sum squared resid 507.9857 Schwarz criterion 5.966665

Log likelihood -87.33232 Hannan-Quinn criter. 5.873128

F-statistic 92014.78 Durbin-Watson stat 1.663366

Prob(F-statistic) 0.000000

Unweighted Statistics

R-squared 0.871469 Mean dependent var 114619.2

Adjusted R-squared 0.862288 S.D. dependent var 112728.1

S.E. of regression 41832.86 Sum squared resid 4.90E+10

Durbin-Watson stat 1.853343

②修正后的White检验为

在表5.2的回归结果中,按路径“View/Residual Tests/Heteroskedasticity Tests”,在出现的对话框中选择Specification:White,点击ok.得到White 检验结果如下。

表5.3 修正后的White检验结果

Heteroskedasticity Test: White

F-statistic 0.210748 Prob. F(2,28) 0.8113

Obs*R-squared 0.459736 Prob. Chi-Square(2) 0.7946

Scaled explained SS 0.595955 Prob. Chi-Square(2) 0.7423

Test Equation:

Dependent Variable: WGT_RESID^2

Method: Least Squares

Date: 11/15/13 Time: 20:29

Sample: 1 31

Included observations: 31

Collinear test regressors dropped from specification

Coefficient Std. Error t-Statistic Prob.

C 17.63991 5.922594 2.978410 0.0059

WGT -256.0052 728.8280 -0.351256 0.7280

WGT^2 8.261926 23.57155 0.350504 0.7286

R-squared 0.014830 Mean dependent var 16.38664

Adjusted R-squared -0.055539 S.D. dependent var 29.69485

S.E. of regression 30.50832 Akaike info criterion 9.765641

Sum squared resid 26061.21 Schwarz criterion 9.904414

Log likelihood -148.3674 Hannan-Quinn criter. 9.810878

F-statistic 0.210748 Durbin-Watson stat 2.081320

Prob(F-statistic) 0.811251

从上表可知nR2==0.459736<χ2

05

.0

(5)=11.0705,证明模型中的异方差已经被消除了。

异方差修正后的模型为

^

Y= -7074.873+0.788277X1*+0.235806 X2*

389.4944 0.013692 0.000968

t = (-18.16425) ( 57.57099) ( 243.6786)

R2=0.999848

2

R=0.999837 F=92014.78 DW=1.663366

其中X1*= 1/e1^2* X1, X2*=1/e1^2*X2, e1=resid。

六、自相关检验与修正

(1)DW检验

在显著性水平α=0.05,查DW表,当n=31,k=2时,得上临界值d

u

=1.27,

下临界值d

l =1.15,DW= 1.663365。因为d

u

u

,所以模型不存在序列

自相关。

由图示法也可以看出随机误差项μ

i

不存在自相关。下图是残差及一阶滞后残差相关图。

图6.1残差与其滞后一阶残差图

(2)LM检验

在表 5.2的回归结果中,按路径“View/Residual Tests/Serial Correlation LM Tests”,在出现的对话框中选择Lags to include:1,点击ok.得到LM检验结果如下。

表6.1 LM检验结果

Breusch-Godfrey Serial Correlation LM Test:

F-statistic 0.809839 Prob. F(1,27) 0.3761

Obs*R-squared 0.902738 Prob. Chi-Square(1) 0.3420

Test Equation:

Dependent Variable: RESID

Method: Least Squares

Date: 11/14/13 Time: 21:50

Sample: 1 31

Included observations: 31

Presample missing value lagged residuals set to zero.

Weight series: 1/E1^2

Coefficient Std. Error t-Statistic Prob.

C -766.3965 937.0314 -0.817898 0.4206

X1 0.020990 0.027070 0.775390 0.4448

X2 -0.001273 0.001716 -0.742002 0.4645

RESID(-1) -0.007092 0.007881 -0.899910 0.3761

Weighted Statistics

R-squared 0.029121 Mean dependent var -0.564513

Adjusted R-squared -0.078755 S.D. dependent var 4.074747

S.E. of regression 4.273921 Akaike info criterion 5.862855

Sum squared resid 493.1929 Schwarz criterion 6.047885

Log likelihood -86.87425 Hannan-Quinn criter. 5.923170

F-statistic 0.269946 Durbin-Watson stat 1.683210

Prob(F-statistic) 0.846488

Unweighted Statistics

R-squared -0.014569 Mean dependent var -4021.722

Adjusted R-squared -0.127299 S.D. dependent var 40207.07

S.E. of regression 42689.59 Sum squared resid 4.92E+10

Durbin-Watson stat 1.69E-08

从上表可以看出,nR2=0.902738,由LM检验可知,在α=0.05下,查2χ分

(5)=11.0705,比较计算的2χ统计量与临界值,因为布表,得临界值χ2

.0

05

(5)=11.0705,所以接受原假设,表明模型不存在自相关。nR2=0.902738<χ2

05

.0

七、模型检验

1、经济意义检验

模型估计结果表明,在假定其他变量不变的情况下,当景区固定资产每增长1元时,旅游收入增加0.788277元;在假定其他变量不变的情况下,当景区从业人员每增加1人时,旅游收入增加0.235806万元。这与理论分析判断相一致。

2、统计检验

(1)拟合优度:由表中数据可得:R2=0.999848,修正的可决系数为

-

2

R=0.999837,这说明模型对样本的拟合很好。

(2)F检验:针对H0:β1=β2=0,给定显著性水平α=0.05,在F分布表中查出自由度为k=2和n-k-1=28的临界值Fα( 2,28)=3.34。由表中得到F=92014.78,

由于F=92014.78> Fα( 2,28)=3.34,应拒绝原假设,说明回归方程显著,即“旅游景区固定资产”、“旅游从业人员”等变量联合起来确实对“旅游景区营业收入”有显著影响。

(3)t检验:分别对H0:βj=0(j=1,2),给定显著性水平α=0.05,查t分布表得

自由度为n-k-1=28临界值tα/2(n-k-1)=2.048。由表中数据可得,

^

1

β、^

2

β对应的t

统计量分别为57.57099、243.6786,其绝对值均大于tα/2(n-k-1)=2.048,这说明应该分别拒绝H0:βj =0(j=1,2),也就是说,当在其他解释变量不变的情况下,解释变量“旅游景区固定资产”(X1)、“旅游从业人数”(X2)分别对被解释变量“旅游景区营业收入”(Y)影响显著。

八、附录

以下是多重共线性参数估计

备表1 对X

1

回归分析

Dependent Variable: Y

Method: Least Squares

Date: 11/14/13 Time: 21:14

Sample: 1 31

Included observations: 31

Coefficient Std. Error t-Statistic Prob.

C -15595.61 18604.86 -0.838255 0.4087

X1 1.978224 0.229091 8.635111 0.0000 R-squared 0.719983 Mean dependent var 114619.2

Adjusted R-squared 0.710327 S.D. dependent var 112728.1

S.E. of regression 60671.69 Akaike info criterion 24.92668

Sum squared resid 1.07E+11 Schwarz criterion 25.01920

Log likelihood -384.3636 Hannan-Quinn criter. 24.95684

F-statistic 74.56515 Durbin-Watson stat 2.090544

Prob(F-statistic) 0.000000

备表2 对X

2

回归分析

Dependent Variable: Y

Method: Least Squares

Date: 11/14/13 Time: 21:15

Sample: 1 31

Included observations: 31

Coefficient Std. Error t-Statistic Prob.

C 15958.73 11364.71 1.404236 0.1709

X2 0.315120 0.025260 12.47495 0.0000

R-squared 0.842924 Mean dependent var 114619.2 Adjusted R-squared 0.837508 S.D. dependent var 112728.1 S.E. of regression 45441.05 Akaike info criterion 24.34856 Sum squared resid 5.99E+10 Schwarz criterion 24.44108 Log likelihood -375.4027 Hannan-Quinn criter. 24.37872 F-statistic 155.6243 Durbin-Watson stat 1.665119 Prob(F-statistic) 0.000000

回归分析

备表3 对X

3

Dependent Variable: Y

Method: Least Squares

Date: 11/14/13 Time: 21:15

Sample: 1 31

Included observations: 31

Coefficient Std. Error t-Statistic Prob.

C 53599.95 15413.41 3.477488 0.0016

X3 0.316946 0.045785 6.922479 0.0000 R-squared 0.622988 Mean dependent var 114619.2 Adjusted R-squared 0.609988 S.D. dependent var 112728.1 S.E. of regression 70399.77 Akaike info criterion 25.22411 Sum squared resid 1.44E+11 Schwarz criterion 25.31662 Log likelihood -388.9737 Hannan-Quinn criter. 25.25427 F-statistic 47.92072 Durbin-Watson stat 1.724195 Prob(F-statistic) 0.000000

备表4 对X

回归分析

4

Dependent Variable: Y

Method: Least Squares

Date: 11/14/13 Time: 21:15

Sample: 1 31

Included observations: 31

Coefficient Std. Error t-Statistic Prob.

C -143904.9 66622.99 -2.159989 0.0392

X4 12.54525 3.131970 4.005547 0.0004

R-squared 0.356191 Mean dependent var 114619.2 Adjusted R-squared 0.333991 S.D. dependent var 112728.1 S.E. of regression 91996.75 Akaike info criterion 25.75923 Sum squared resid 2.45E+11 Schwarz criterion 25.85175 Log likelihood -397.2681 Hannan-Quinn criter. 25.78939 F-statistic 16.04440 Durbin-Watson stat 1.829839 Prob(F-statistic) 0.000394

备表5 对X

2、X

1

回归分析

Dependent Variable: Y

Method: Least Squares

Date: 11/14/13 Time: 21:15

Sample: 1 31

Included observations: 31

Coefficient Std. Error t-Statistic Prob.

C -4316.824 12795.42 -0.337373 0.7384

X2 0.230304 0.039088 5.891959 0.0000

X1 0.711446 0.265507 2.679575 0.0122

R-squared 0.874983 Mean dependent var 114619.2 Adjusted R-squared 0.866053 S.D. dependent var 112728.1 S.E. of regression 41257.10 Akaike info criterion 24.18480 Sum squared resid 4.77E+10 Schwarz criterion 24.32357 Log likelihood -371.8644 Hannan-Quinn criter. 24.23004 F-statistic 97.98460 Durbin-Watson stat 1.893654 Prob(F-statistic) 0.000000

备表6 对X

2、X

3

回归分析

Dependent Variable: Y

Method: Least Squares

Date: 11/14/13 Time: 21:15

Sample: 1 31

Included observations: 31

Coefficient Std. Error t-Statistic Prob.

C 16874.53 10798.59 1.562660 0.1294

X2 0.258113 0.036788 7.016265 0.0000

X3 0.087950 0.043040 2.043471 0.0505

R-squared 0.863310 Mean dependent var 114619.2 Adjusted R-squared 0.853546 S.D. dependent var 112728.1 S.E. of regression 43140.27 Akaike info criterion 24.27407 Sum squared resid 5.21E+10 Schwarz criterion 24.41284 Log likelihood -373.2480 Hannan-Quinn criter. 24.31930 F-statistic 88.42123 Durbin-Watson stat 1.600090 Prob(F-statistic) 0.000000

备表7 对X

2、X

4

回归分析

Dependent Variable: Y

Method: Least Squares

Date: 11/14/13 Time: 21:15

Sample: 1 31

Included observations: 31

Coefficient Std. Error t-Statistic Prob.

C 10868.79 37371.23 0.290833 0.7733

X2 0.312045 0.033484 9.319239 0.0000

X4 0.293708 2.050660 0.143226 0.8871

R-squared 0.843039 Mean dependent var 114619.2 Adjusted R-squared 0.831828 S.D. dependent var 112728.1 S.E. of regression 46228.45 Akaike info criterion 24.41234 Sum squared resid 5.98E+10 Schwarz criterion 24.55112 Log likelihood -375.3913 Hannan-Quinn criter. 24.45758 F-statistic 75.19429 Durbin-Watson stat 1.642818 Prob(F-statistic) 0.000000

备表8 对X

2、X

1

、X

3

回归分析

Dependent Variable: Y

Method: Least Squares

Date: 11/14/13 Time: 21:15

Sample: 1 31

Included observations: 31

Coefficient Std. Error t-Statistic Prob.

C -975.0304 15047.61 -0.064796 0.9488

X2 0.227087 0.040334 5.630196 0.0000

X1 0.603269 0.364972 1.652919 0.1099

X3 0.024860 0.056581 0.439370 0.6639

R-squared 0.875870 Mean dependent var 114619.2 Adjusted R-squared 0.862078 S.D. dependent var 112728.1 S.E. of regression 41864.78 Akaike info criterion 24.24219 Sum squared resid 4.73E+10 Schwarz criterion 24.42722 Log likelihood -371.7540 Hannan-Quinn criter. 24.30251 F-statistic 63.50482 Durbin-Watson stat 1.842559 Prob(F-statistic) 0.000000

备表9 对X

2、X

1

、X

4

回归分析

Dependent Variable: Y

Method: Least Squares

Date: 11/14/13 Time: 21:16

Sample: 1 31

Included observations: 31

Coefficient Std. Error t-Statistic Prob.

C 17568.38 33747.27 0.520587 0.6069

X2 0.237243 0.040667 5.833838 0.0000

X1 0.773017 0.281939 2.741794 0.0107

X4 -1.364110 1.943398 -0.701920 0.4887

R-squared 0.877223 Mean dependent var 114619.2 Adjusted R-squared 0.863581 S.D. dependent var 112728.1 S.E. of regression 41636.01 Akaike info criterion 24.23123 Sum squared resid 4.68E+10 Schwarz criterion 24.41626 Log likelihood -371.5841 Hannan-Quinn criter. 24.29155 F-statistic 64.30377 Durbin-Watson stat 2.042712 Prob(F-statistic) 0.000000

SPSS实验报告_线性回归_曲线估计

《数据分析实务与案例实验报告》 曲线估计 学号:2013111104000614 班级:2013 应用统计 姓名: 日期: 2 0 1 4 – 12 – 7 数学与统计学学院

一、实验目的 1. 准确理解曲线回归分析的方法原理。 2. 了解如何将本质线性关系模型转化为线性关系模型进行回归分析。 3. 熟练掌握曲线估计的SPSS 操作。 4. 掌握建立合适曲线模型的判断依据。 5. 掌握如何利用曲线回归方程进行预测。 6. 培养运用多曲线估计解决身边实际问题的能力。 二、准备知识 1. 非线性模型的基本内容 变量之间的非线性关系可以划分为 本质线性关系和本质非线性关系。所谓本质线性关系是指变量关系形式上虽然呈非线性关系,但可以通过变量转化为线性关系,并可最终进行线性回归分析,建立线性模型。本质非线性关系是指变量之间不仅形式上呈现非线性关系,而且也无法通过变量转化为线性关系,最终无法进行线性回归分析,建立线性模型。本实验针对本质线性模型进行。 下面介绍本次实验涉及到的可线性化的非线性模型,所用的变换既有自变量的变换,也有因变量的变换。 乘法模型: 123y x x x βγδαε= 其中α,β,γ,δ 都是未知参数,ε是乘积随机误差。对上式两边取自然对数得到 123ln ln ln ln ln ln y x x x αβγδε=++++

上式具有一般线性回归方程的形式,因而用多元线性回归的方法来处理。然而,必须强调指出的是,在求置信区间和做有关试验时,必须是2ln (0,)n N I εδ: , 而不是2n N I εδ:(0,) ,因此检验之前,要先检验ln ε 是否满足这个假设。 三、实验内容 已有很多学者验证了能源消费与经济增长的因果关系,证明了能源消费是促进经济增长的原因之一。也有众多学者利用C-D 生产函数验证了劳动和资本对经济增长的影响机理。所有这些研究都极少将劳动、资本、和能源建立在一个模型中来研究三个因素对经济增长的作用方向和作用大小。 现从我国能源消费、全社会固定资产投资和就业人员的实际出发,假定生产技术水平在短期能不会发生较大变化,经济增长、全社会固定资产投资、就业人员、能源消费可以分别采用国内生产总值、全社会固定资产投资总量、就业总人数、能源消费总量进行衡量,并假定经济增长与能源消费、资本和劳动力的关系均满足C-D 生产函数。 问题中的C-D 生产函数为: Y AK L E αβγ= 式中:Y 为GDP ,衡量总产出;K 为全社会固定资产投资,衡量资本投入量;L 为就业人数,衡量劳动投入量;E 为能源消费总量,衡量能源投入量;A,α,β, γ 为未知参数。根据C-D 函数的假定,一般情形α,β,γ均在0和1之间,但当α,β,γ中有负数时,说明这种投入量的增长,反而会引起GDP 的下降,当α,β,γ中出现大于1的值时,说明这种投入量的增加会引起GDP 成倍增加,这在经济学现象中都是存在的。 以我国1985—2004年的有关数据建立了SPSS 数据集,参见

《计量经济学》第四章精选题及答案

第四章:多重共线性 二、简答题 1、导致多重共线性的原因有哪些? 2、多重共线性为什么会使得模型的预测功能失效? 3、如何利用辅回归模型来检验多重共线性? 4、判断以下说法正确、错误,还是不确定?并简要陈述你的理由。 (1)尽管存在完全的多重共线性,OLS 估计量还是最优线性无偏估计量(BLUE )。 (2)在高度多重共线性的情况下,要评价一个或者多个偏回归系数的个别显著性是不可能的。 (3)如果某一辅回归显示出较高的2 i R 值,则必然会存在高度的多重共线性。 (4)变量之间的相关系数较高是存在多重共线性的充分必要条件。 (5)如果回归的目的仅仅是为了预测,则变量之间存在多重共线性是无害的。 12233i i i Y X X βββ=++ 来对以上数据进行拟合回归。 (1) 我们能得到这3个估计量吗?并说明理由。 (2) 如果不能,那么我们能否估计得到这些参数的线性组合?可以的话,写出必要的计 算过程。 6、考虑以下模型: 23 1234i i i i i Y X X X ββββμ=++++ 由于2X 和3 X 是X 的函数,那么它们之间存在多重共线性。这种说法对吗?为什么? 7、在涉及时间序列数据的回归分析中,如果回归模型不仅含有解释变量的当前值,同时还含有它们的滞后值,我们把这类模型称为分布滞后模型(distributed-lag model )。我们考虑以下模型: 12313233i t t t t t Y X X X X βββββμ---=+++++ 其中Y ——消费,X ——收入,t ——时间。该模型表示当期的消费是其现期的收入及其滞后三期的收入的线性函数。 (1) 在这一类模型中是否会存在多重共线性?为什么? (2) 如果存在多重共线性的话,应该如何解决这个问题? 8、设想在模型 12233i i i i Y X X βββμ=+++ 中,2X 和3X 之间的相关系数23r 为零。如果我们做如下的回归:

多元线性回归SPSS实验报告

回归分析基本分析: 将毕业生人数移入因变量,其他解释变量移入自变量。在统计量中选择估计和模型拟合度,得到如图 注解:模型的拟合优度检验:

第二列:两变量(被解释变量和解释变量)的复相关系数R=0.999。 第三列:被解释向量(毕业人数)和解释向量的判定系数R2=0.998。 第四列:被解释向量(毕业人数)和解释向量的调整判定系数R2=0.971。在多个解释变量的时候,需要参考调整的判定系数,越接近1,说明回归方程对样本数据的拟合优度越高,被解释向量可以被模型解释的部分越多。 第五列:回归方程的估计标准误差=9.822 回归方程的显著性检验-回归分析的方差分析表 F检验统计量的值=776.216,对应的概率p值=0.000,小于显著性水平0.05,应拒绝回归方程显著性检验原假设(回归系数与0不存在显著性差异),认为:回归系数不为0,被解释变量(毕业生人数)和解释变量的线性关系显著,可以建立线性模型。 注解:回归系数的显著性检验以及回归方程的偏回归系数和常数项的估计值第二列:常数项估计值=-544.366;其余是偏回归系数估计值。

第三列:偏回归系数的标准误差。 第四列:标准化偏回归系数。 第五列:偏回归系数T检验的t统计量。 第六列:t统计量对应的概率p值;小于显著性水平0.05,拒接原假设(回归系数与0不存在显著性差异),认为回归系数部位0,被解释变量与解释变量的线性关系是显著的;大于显著性水平0.05,接受原假设(回归系数与0不存在显著性差异),认为回归系数为0被解释变量与解释变量的线性关系不显著的。 于是,多元线性回归方程为: y=-544.366+0.032x1+0.009x2+0.001x3-0.1x5+3.046x6 回归分析的进一步分析: 1.多重共线性检验 从容差和方差膨胀因子来看,在校学生数和教职工总数与其他解释变量的多重共线性很严重。在重新建模中可以考虑剔除该变量

计量经济学多元线性回归、多重共线性、异方差实验报告记录

计量经济学多元线性回归、多重共线性、异方差实验报告记录

————————————————————————————————作者:————————————————————————————————日期:

计量经济学实验报告

多元线性回归、多重共线性、异方差实验报告 一、研究目的和要求: 随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。尤其是假日旅游,有力刺激了居民消费而拉动内需。2012年,我国全年国内旅游人数达到亿人次,同比增长%,国内旅游收入万亿元,同比增长%。旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化产业结构,而且可以增加国家外汇收入,促进国际收支平衡,加强国家、地区间的文化交流。为了研究影响旅游景区收入增长的主要原因,分析旅游收入增长规律,需要建立计量经济模型。 影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。因此选取我国31个省市地区的旅游业相关数据进行定量分析我国旅游业发展的影响因素。 二、模型设定 根据以上的分析,建立以下模型 Y=β 0+β 1 X 1 +β 2 X 2 +β 3 X 3 +β 4 X 4 +Ut 参数说明: Y ——旅游景区营业收入/万元 X 1 ——旅游业从业人员/人 X 2 ——旅游景区固定资产/万元 X 3 ——旅游外汇收入/万美元 X 4 ——城镇居民可支配收入/元

计量经济学实验报告(多元线性回归 自相关 )

实验报告 课程名称计量经济学 实验项目名称多元线性回归自相关 异方差多重共线性班级与班级代码 08国际商务1班实验室名称(或课室)实验楼910 专业国际商务 任课教师刘照德 学号: 043 姓名:张柳文 实验日期: 2011 年 06 月 23日 广东商学院教务处制

姓名张柳文实验报告成绩 评语: 指导教师(签名) 年月日说明:指导教师评分后,实验报告交院(系)办公室保存。

计量经济学实验报告 实验项目:多元线性回归、自相关、异方差、多重共线性 实验目的:掌握多元线性回归模型、自相关模型、异方差模型、多重共线性模型的估计和检验方法和处理方法 实验要求:选择方程进行多元线性回归;熟悉图形法检验和掌握D-W 检验,理解广义差分法变换和掌握迭代法;掌握Park或 Glejser检验,理解同方差性变换; 实验原理:普通最小二乘法图形检验法 D-W检验广义差分变换加权最小二乘法 Park检验等 实验步骤: 首先:选择数据 为了研究影响中国税收收入增长的主要原因,选择国内生产总值(GDP)、财政支出(ED)、商品零售价格指数(RPI)做为解释变量,对税收收入(Y)做多元线性回归。从《中国统计年鉴》2011中收集1978—2009年各项影响因素的数据。如下表所示: 中国税收收入及相关数据

实验一:多元线性回归 1、将数据导入后,分别对三个解释变量与被解释变量做散点图,选择两个变量作为group打开,在数据表“group”中点击view/graph/scatter/simple scatter,出现数据的散点图,分别如下图所示: 从散点图看,变量间不一定呈现线性关系,可以试着作线性回归。 2、进行因果关系检验

计量经济学多元线性回归、多重共线性、异方差实验报告概要

计量经济学实验报告

多元线性回归、多重共线性、异方差实验报告 一、研究目的和要求: 随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。尤其是假日旅游,有力刺激了居民消费而拉动内需。2012年,我国全年国内旅游人数达到30.0亿人次,同比增长13.6%,国内旅游收入2.3万亿元,同比增长19.1%。旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化产业结构,而且可以增加国家外汇收入,促进国际收支平衡,加强国家、地区间的文化交流。为了研究影响旅游景区收入增长的主要原因,分析旅游收入增长规律,需要建立计量经济模型。 影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。因此选取我国31个省市地区的旅游业相关数据进行定量分析我国旅游业发展的影响因素。 二、模型设定 根据以上的分析,建立以下模型 Y=β 0+β1X 1 +β2X 2 +β 3 X 3 +β 4 X 4 +Ut 参数说明: Y ——旅游景区营业收入/万元 X 1 ——旅游业从业人员/人 X 2 ——旅游景区固定资产/万元 X 3 ——旅游外汇收入/万美元 X 4 ——城镇居民可支配收入/元

计量经济学简单线性回归实验报告精编

实验报告 1. 实验目的随着中国经济的发展,居民的常住收入水平不断提高,粮食销售量也不断增长。研究粮食年销售量与人均收入之间的关系,对于探讨粮食年销售量的增长的规律性有重要的意义。 2. 模型设定 为了分析粮食年销售量与人均收入之间的关系,选择“粮食年销售量” 为被解释变量(用Y 表示),选择“人均收入”为解释变量(用X 表 示)。本次实验报告数据取自某市从1974 年到1987 年的数据(教材书上101页表3.11),数据如下图所示:

1粮食年销售量Y/万吨人均收入X/ rF1974[ 9& 45153.2 1975100.7190 pl1976102.8240.3 1977133. 95301.12 [61978140.13361 71979143.11420 8—1980146.15491.76「91981144.6501 101982148. 94529.2 1 11-1983158.55552. 72匸1984169. 68771.16 131985P 162.1481L8 14二1986170. 09988.43 1519871F& 691094.65为分析粮食年销售量与人均收入的关系,做下图所谓的散点图 从散点图可以看出粮食年销售量与人均收入大体呈现为线性关 系,可以建立如下简单现行回归模型: 3?估计参数

Y t = ■? 1 2 X t ——I t 假定所建模型及其中的随机扰动项叫满足各项古典假定,可以 用OLS法估计其参数。 通过利用EViews对以上数据作简单线性回归分析,得出回归结果如下表所示: Dependent Variable Y Method: Least Squares Date 10/15/11 Time 14 49 Sample- 1 14 Included observations: 14 Variable Coefficient Std Error t-Statistic Prob C99 61349 6 431242 15 489000 0000 X0.0814700.010738 7.5071190.0000 R-squared0 827493Mean dependent var142 7129 Adjusted R-squared0 813123S.D. dependent var26.09805 S E of regression11 28200Akaike info criterion7 915858 Sum squared resid1527 403Schwarz criterion7 907152 Log likelihood-52.71101F-statisti c5756437 Durbin-V/atson stat0 638969Prob(尸-statistic)0 000006 可用规范的形式将参数估计和检验的结果写为: A Y t =99.61349+0.08147 X t (6.431242)(0.10738) t= (15.48900) (7.587119) R2=0.827498 F=57.56437 n=14 4?模型检验 (1).经济意义检验 A A 所估计的参数1=99.61349, 1 2=0.08147,说明人均收入每增加 1元,平均说来可导致粮食年销售量提高0.08147元。这与经济学中

2019年1计量经济学作业多重共线性p171.doc复习进程

2019年1计量经济学作业多重共线性 p171.d o c

计量经济学作业 ——多重共线性P171 8.下表是被解释变量Y,解释变量X1,X2,X3,X4的时间序列观测值: 时间序列观测值表 3 6.5 47.5 5.2 108 86 4 7.1 49.2 6.8 100 100 5 7.2 52.3 7.3 99 107 6 7.6 58.0 8. 7 99 111 7 8.0 61.3 10.2 101 114 8 9.0 62.3 14.1 97 116 9 9.0 64.7 17.1 93 119 10 9.3 66.8 21.3 102 121 (1)采用适当的方法检验多重共线性。 (2)多重共线性对参数估计值有何影响? (3)用Frisch法确定一个较好的回归模型。 解:(1)采用参数估计值的统计检验法检验多重共线性。 用OLS最小二乘法,估计被解释变量Y与解释变量X1,X2,X3,X4的样本方程,如下所示:

图1-1 在Eviews中建立样本回归模型 图1-2 样本回归模型数据表 输入被解释变量与解释变量: 图1-3 整体样本回归模型建立

用最小二乘法求得结果如下所示: 图1-4 Eviews的结果分析一元线性样本回归方程为: 1.拟合优度检验 由上表可知,样本可决系数为: R-squared=0.978915 修正样本可决系数为: Adjusted-squared=0.962046 即

计算结果表明,估计的样本回归方程较好的拟合了样本观测值。 2.F检验 提出检验的原假设为 对立假设为 由图1-4,得F统计量为 F-statistic=58.03254 对于给定的显著性水平α=0.05,查出分子自由度为4,分母自由度为5的F分布上侧分位数F0.05(4,5)=5.19。因为 F=58.03254>5.19,所以否定H0,总体回归方程显著。 3.t检验 提出检验的原假设为 由上表可知,t统计量为 β0的t-statistic=1.975329 β1的t-statistic=1.149646 β2的t-statistic=2.401806 β3的t-statistic=-0.662938

多元线性回归模型实验报告

多元线性回归模型实验报告 13级财务管理 101012013101 蔡珊珊 【摘要】首先做出多元回归模型,对于解释变量作出logx等变换,选择拟合程度最高的模型,然后判断出解释变量之间存在相关性,然后从检验多重线性性入手,由于解释变量之间有的存在严重的线性性,因此采用逐步回归法,将解释变量进行筛选,保留对模型解释能力较强的解释变量,进而得出一个初步的回归模型,最后对模型进行异方差和自相关检验。 【操作步骤】1.输入解释变量与被解释变量的数据 2.作出回归模型

R^2=0.966951 DW=0.626584 F-statictis=241.3763 ②我们令y1=log(consumption),x4=log(people),x5=log(price),x6=log(retained),x7= log(gdp), 作出回归模型

② 发现拟合程度很高,也通过了F检验与T检验。但是我们首先检查模型的共线性 发现x4与x6,x4与x7,x6与x7存在很强的共线性,对模型会造成严重影响。

目前暂用模型y1=10.55028-3.038439x4-0.236518x5+2.647396x6-0.557805x7,我们将陆续进行调整。 3.分别作出各解释变量与被解释变量之间的线性模型

①作出汽车消费量与汽车保有量之间的线性回归模型 R^2=0.956231 DW=0.147867 F-statistic=786.4967

因为prob小于α置信度,则可说明β1不明显为零。经济意义存在 Y1^=4.142917 + 0.761197x6 (8.283960) (28.04455)

matlab多元线性回归模型

云南大学数学与统计学实验教学中心 实验报告 一、实验目的 1.熟悉MATLAB的运行环境. 2.学会初步建立数学模型的方法 3.运用回归分析方法来解决问题 二、实验内容 实验一:某公司出口换回成本分析 对经营同一类产品出口业务的公司进行抽样调查,被调查的13家公司,其出口换汇成本与商品流转费用率资料如下表。试分析两个变量之间的关系,并估计某家公司商品流转费用率是6.5%的出口换汇成本. 实验二:某建筑材料公司的销售量因素分析 下表数据是某建筑材料公司去年20个地区的销售量(Y,千方),推销开支、实际帐目数、同类商品

竞争数和地区销售潜力分别是影响建筑材料销售量的因素。1)试建立回归模型,且分析哪些是主要的影响因素。2)建立最优回归模型。 提示:建立一个多元线性回归模型。

三、实验环境 Windows 操作系统; MATLAB 7.0. 四、实验过程 实验一:运用回归分析在MATLAB 里实现 输入:x=[4.20 5.30 7.10 3.70 6.20 3.50 4.80 5.50 4.10 5.00 4.00 3.40 6.90]'; X=[ones(13,1) x]; Y=[1.40 1.20 1.00 1.90 1.30 2.40 1.40 1.60 2.00 1.00 1.60 1.80 1.40]'; plot(x,Y,'*'); [b,bint,r,rint,stats]=regress(Y,X,0.05); 输出: b = 2.6597 -0.2288 bint = 1.8873 3.4322 -0.3820 -0.0757 stats = 0.4958 10.8168 0.0072 0.0903 即==1,0?6597.2?ββ,-0.2288,0?β的置信区间为[1.8873 3.4322],1,?β的置信区间为[-0.3820 -0.0757]; 2r =0.4958, F=10.8168, p=0.0072 因P<0.05, 可知回归模型 y=2.6597-0.2288x 成立. 1 1.5 2 2.5 散点图 估计某家公司商品流转费用率是6.5%的出口换汇成本。将x=6.5代入回归模型中,得到 >> x=6.5; >> y=2.6597-0.2288*x y = 1.1725

多元线性回归模型实验报告 计量经济学

实验报告 课程名称金融计量学 实验项目名称多元线性回归模型班级与班级代码 实验室名称(或课室) 专业 任课教师xxx 学号:xxx 姓名:xxx 实验日期:2012年5 月3日 广东商学院教务处制

姓名xxx 实验报告成绩 评语: 指导教师(签名) 年月日说明:指导教师评分后,实验报告交院(系)办公室保存

多元线性回归模型 一、实验目的 通过上机实验,使学生能够使用 Eviews 软件估计可化为线性回归模型的非线性模型,并对线性回归模型的参数线性约束条件进行检验。二、实验内容 (一)根据中国某年按行业分的全部制造业国有企业及规模以上制造业非国有企业的工业总产值Y,资产合计K及职工人数L进行回归分析。(二)掌握可化为线性多元非线性回归模型的估计和多元线性回归模型的线性约束条件的检验方法 (三)根据实验结果判断中国该年制造业总体的规模报酬状态如何?三、实验步骤 (一)收集数据 下表列示出来中国某年按行业分的全部制造业国有企业及规模以上制造业非国有企业的工业总产值Y,资产合计K及职工人数L。 序号工业总产值Y (亿元) 资产合计K (亿元) 职工人数L (万人)序号 工业总产 值Y(亿元) 资产合计K (亿元) 职工人数L (万人) 1 3722.7 3078.2 2 11 3 17 812.7 1118.81 43 2 1442.52 1684.4 3 67 18 1899.7 2052.16 61 3 1752.37 2742.77 8 4 19 3692.8 5 6113.11 240 4 1451.29 1973.82 27 20 4732.9 9228.2 5 222 5 5149.3 5917.01 327 21 2180.23 2866.65 80 6 2291.16 1758.7 7 120 22 2539.76 2545.63 96 7 1345.17 939.1 58 23 3046.95 4787.9 222 8 656.77 694.94 31 24 2192.63 3255.29 163 9 370.18 363.48 16 25 5364.83 8129.68 244 10 1590.36 2511.99 66 26 4834.68 5260.2 145 11 616.71 973.73 58 27 7549.58 7518.79 138 12 617.94 516.01 28 28 867.91 984.52 46 13 4429.19 3785.91 61 29 4611.39 18626.94 218 14 5749.02 8688.03 254 30 170.3 610.91 19 15 1781.37 2798.9 83 31 325.53 1523.19 45 16 1243.07 1808.44 33 表1

违背基本假设的问题:多重共线性异方差和自相关

第5章、违背基本假设的问题: 多重共线性、异方差和自相关 回顾并再次记住最小二乘法(LS)的三个基本假设: 1.y=Xβ+ε 2.Rank(X)=K 3.ε|X~N(0,σ2I) 1 / 51

§1、多重共线性(multicollinearity) 1、含义及后果 1)完全的多重共线性 如果存在完全的多重共线性(perfect multicollinearity),即在X中存在不完全为0的a i,使得 a1x1+…+a K x K=0 即X的列向量之间存在线性相关。因此,有Rank(X)

3 / 51

4 / 51 2)近似共线性 常见为近似共线性,即 a 1x 1+…+a K x K ≈0 则有|X’X|≈0,那么(X’X)-1对角线元素较大。由于 21|[,(')]b X N X X βσ- , 21|[,(')]k k kk b X N X X βσ- , 所以b k 的方差将较大。 例子:Longley 是著名例子。

5 / 51

6 / 51 2、检验方法 1)VIF 法(方差膨胀因子法,variance inflation factor ) 第j 个解释变量的VIF 定义为 2 1 VIF 1j j R = - 此处2j R 是第j 个解释变量对其他解释变量进行回归的确定系数。若2j R 接近于1,那么VIF 数值将较大,说明第j 个解释变量与其他解释变量之间存在线性关系。从而,可以用VIF 来度量多重共线性的严重程度。当 2j R 大于0.9,也就是VIF 大于10时,认为自变量之间存在比较严重的

一元线性回归分析实验报告

一元线性回归在公司加班制度中的应用 院(系): 专业班级: 学号姓名: 指导老师: 成绩: 完成时间:

一元线性回归在公司加班制度中的应用 一、实验目的 掌握一元线性回归分析的基本思想和操作,可以读懂分析结果,并写出回归方程,对回归方程进行方差分析、显著性检验等的各种统计检验 二、实验环境 SPSS21.0 windows10.0 三、实验题目 一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。经10周时间,收集了每周加班数据和签发的新保单数目,x 为每周签发的新保单数目,y 为每周加班时间(小时),数据如表所示 y 3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0 2. x 与y 之间大致呈线性关系? 3. 用最小二乘法估计求出回归方程。 4. 求出回归标准误差σ∧ 。 5. 给出0 β∧与1 β∧ 的置信度95%的区间估计。 6. 计算x 与y 的决定系数。 7. 对回归方程作方差分析。 8. 作回归系数1 β∧ 的显著性检验。 9. 作回归系数的显著性检验。 10.对回归方程做残差图并作相应的分析。

11.该公司预测下一周签发新保单01000 x=张,需要的加班时间是多少? 12.给出0y的置信度为95%的精确预测区间。 13.给出 () E y的置信度为95%的区间估计。 四、实验过程及分析 1.画散点图 如图是以每周加班时间为纵坐标,每周签发的新保单为横坐标绘制的散点图,从图中可以看出,数据均匀分布在对角线的两侧,说明x和y之间线性关系良好。 2.最小二乘估计求回归方程

用SPSS 求得回归方程的系数01,ββ分别为0.118,0.004,故我们可以写出其回归方程如下: 0.1180.004y x =+ 3.求回归标准误差σ∧ 由方差分析表可以得到回归标准误差:SSE=1.843 故回归标准误差: 2= 2SSE n σ∧-,2σ∧=0.48。 4.给出回归系数的置信度为95%的置信区间估计。 由回归系数显著性检验表可以看出,当置信度为95%时:

多元线性回归模型实验报告

多元线性回归模型 一、实验目的 通过上机实验,使学生能够使用Eviews 软件估计可化为线性回归模型的非线性模型,并对线性回归模型的参数线性约束条件进行检验。二、实验内容 (一)根据中国某年按行业分的全部制造业国有企业及规模以上制造业非国有企业的工业总产值Y,资产合计K及职工人数L进行回归分析。(二)掌握可化为线性多元非线性回归模型的估计和多元线性回归模型的线性约束条件的检验方法 (三)根据实验结果判断中国该年制造业总体的规模报酬状态如何?三、实验步骤 (一)收集数据 下表列示出来中国某年按行业分的全部制造业国有企业及规模以上制造业非国有企业的工业总产值Y,资产合计K及职工人数L。 序号工业总产值Y (亿元) 资产合计K (亿元) 职工人数L (万人)序号 工业总产 值Y(亿元) 资产合计K (亿元) 职工人数L (万人) 1 3722.7 3078.2 2 11 3 17 812.7 1118.81 43 2 1442.52 1684.4 3 67 18 1899.7 2052.16 61 3 1752.37 2742.77 8 4 19 3692.8 5 6113.11 240 4 1451.29 1973.82 27 20 4732.9 9228.2 5 222 5 5149.3 5917.01 327 21 2180.23 2866.65 80 6 2291.16 1758.7 7 120 22 2539.76 2545.63 96 7 1345.17 939.1 58 23 3046.95 4787.9 222 8 656.77 694.94 31 24 2192.63 3255.29 163 9 370.18 363.48 16 25 5364.83 8129.68 244 10 1590.36 2511.99 66 26 4834.68 5260.2 145 11 616.71 973.73 58 27 7549.58 7518.79 138 12 617.94 516.01 28 28 867.91 984.52 46 13 4429.19 3785.91 61 29 4611.39 18626.94 218 14 5749.02 8688.03 254 30 170.3 610.91 19 15 1781.37 2798.9 83 31 325.53 1523.19 45 16 1243.07 1808.44 33 表1

第四章 多重共线性 答案(1)

第四章 多重共线性 一、判断题 1、多重共线性是一种随机误差现象。(F ) 2、多重共线性是总体的特征。(F ) 3、在存在不完全多重共线性的情况下,回归系数的标准差会趋于变小,相应的t 值会趋于变大。(F ) 4、尽管有不完全的多重共线性,OLS 估计量仍然是最优线性无偏估计量。(T ) 5、在高度多重共线的情形中,要评价一个或多个偏回归系数的个别显著性是不可能的。(T ) 6、变量的两两高度相关并不表示高度多重共线性。(F ) 7、如果分析的目的仅仅是预测,则多重共线性一定是无害的。(T ) 8、在多元回归中,根据通常的t 检验,每个参数都是统计上不显著的,你就不会得到一个高的2 R 值。(F ) 9、如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。( F ) 10、多重共线性问题的实质是样本问题,因此可以通过增加样本信息得到改善。(T ) 11、虽然多重共线性下,很难精确区分各个解释变量的单独影响,但可据此模型进行预测。(T ) 12、如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性。(F ) 13、多重共线性的存在会降低OLS 估计的方差。(F ) 14、随着多重共线性程度的增强,方差膨胀因子以及系数估计误差都在增大。(T ) 15、解释变量和随机误差项相关,是产生多重共线性的原因。(F ) 16、对于模型i ni n i 110i u X X Y ++++=βββ ,n 1i ,, =;如果132X X X -=,模型必然存在解释变量的多重共线性问题。(T ) 17、多重共线性问题是随机扰动项违背古典假定引起的。(F ) 18、存在多重共线性时,模型参数无法估计。(F ) 二、单项选择题 1、在线性回归模型中,若解释变量1X 和2X 的观测值成比例,既有12i i X kX =,其中k 为 非零常数,则表明模型中存在 ( B ) A 、异方差 B 、多重共线性 C 、序列相关 D 、随机解释变量 2、 在多元线性回归模型中,若某个解释变量对其余解释变量的可决系数接近1,则表明模型中存在 ( C ) A 、异方差性 B 、序列相关

计量经济学 简单线性回归 实验报告.doc

实验报告 1.实验目的 随着中国经济的发展,居民的常住收入水平不断提高,粮食销售量也不断增长。研究粮食年销售量与人均收入之间的关系,对于探讨粮食年销售量的增长的规律性有重要的意义。 2.模型设定 为了分析粮食年销售量与人均收入之间的关系,选择“粮食年销售量”为被解释变量(用Y表示),选择“人均收入”为解释变量(用X表示)。本次实验报告数据取自某市从1974年到1987年的数据(教材书上101页表3.11),数据如下图所示: 为分析粮食年销售量与人均收入的关系,做下图所谓的散点图:

粮食年销售量与人均收入的散点图 从散点图可以看出粮食年销售量与人均收入大体呈现为线性关系,可以建立如下简单现行回归模型: 3.估计参数 假定所建模型及其中的随机扰动项 i μ满足各项古典假定,可以 用OLS 法估计其参数。 通过利用EViews 对以上数据作简单线性回归分析,得出回归结果如下表所示: t t t X Y μββ++=21

可用规范的形式将参数估计和检验的结果写为: =t Y ^ 99.61349+0.08147 t X (6.431242)(0.10738) t= (15.48900) (7.587119) 2R =0.827498 F=57.56437 n=14 4.模型检验 (1).经济意义检验 所估计的参数1^β=99.61349,2^β=0.08147,说明人均收入每增加1元,平均说来可导致粮食年销售量提高0.08147元。这与经济学中边际消费倾向的意义相符。 (2).拟合优度和统计检验 拟合优度的度量:由回归结果表可以看出,本实验中可决系数为0.827498,说明所建模型整体上对样本数据拟合一般偏好。 对回归系数的t 检验:针对0H :1β=0 和0H :2β=0,由回归结果表 中还可以看出,估计的回归系数1^β的标准误差和t 值分别为:SE(1^β)=6.431242,t(1^β)=15.48900; 2^β的标准误差和 t 值分别为:SE(2^β)=0.10738,t(2^β)=7.587119.取a=0.05,查t 分布表自由度为 n-2=14-2=12的临界值025.0t (12)=2.179.因为t(1^β)=15.48900>025.0t (12)=2.179, 所以应拒绝0H :1β=0;因为t(2^ β)=7.587119>025.0t (12)=2.179. 所以应拒绝0H :2β=0。这表明,人均收入对粮食年销售量确有显著影 响。

计量经济学多重共线性

2014-8-8 商学院 王中昭 教学内容 一、多重共线性 二、实际经济问题中的多重共线性 三、多重共线性的后果 四、多重共线性的检验 五、克服多重共线性的办法和实例 §4.3 多重共线性

2014-8-8商学院 王中昭 对于模型Y i =β0+ β1x 1i + β2x 2i +…… βk x ki +μi 如果某两个或多个解释变量之间出现相关性,即:C 1x 1i +C 2X 2i +……C k X ki =0 其中C i 不全为0,即某一个解释变量是其他解释变量的线性组合,则称为完全多重共线性。 完全多重共线性的情况并不多见,一般是出现不同程度的多重共线性。 注意多重共线性不 是指因变量与解释 一、多重共线性概念

2014-8-8商学院 王中昭 Y=Xβ+μ完全共线性:∣X′X ∣=0,(X′X)-1不存在, 使B ^=(X′X)-1X′Y 无法求解。 例如:, 0)(0020 1631084104213211 x x x 3213322113 21≠'=+-=++??????? ??=X X x x x X i i i i i i x c x c x c 这里,完全多重共线性

2014-8-8商学院 王中昭完全多重共线性的情况不多,一般出现不同程度的多重共线性。 多重共线性:∣X′X∣≈0,(X′X)-1存在,但 (X′X)-1主对角线上的元素很大。 ????? ?='≈'?≈+??????? ??=400300000300000100040030000030000010002100010004X)X ( ,0)( 0,0x x - x 199 .2993001001.4004001099.1992001101.1001001 x x x 1 -3i 2i 1i 3 21||这里,X X X 近似多重共线性

多元线性回归实验报告

实验题目:多元线性回归、异方差、多重共线性 实验目的:掌握多元线性回归的最小二乘法,熟练运用Eviews软件的多元线性回归、异方差、多重共线性的操作,并能够对结果进行相应的分析。 实验内容:习题3.2,分析1994-2011年中国的出口货物总额(Y)、工业增加值(X2)、人民币汇率(X3),之间的相关性和差异性,并修正。 实验步骤: 1.建立出口货物总额计量经济模型: 错误!未找到引用源。(3.1) 1.1建立工作文件并录入数据,得到图1 图1 在“workfile"中按住”ctrl"键,点击“Y、X2、X3”,在双击菜单中点“open group”,出现数据 表。点”view/graph/line/ok”,形成线性图2。 图2 1.2对(3.1)采用OLS估计参数 在主界面命令框栏中输入ls y c x2 x3,然后回车,即可得到参数的估计结果,如图3所示。

图 3 根据图3中的数据,得到模型(3.1)的估计结果为 (8638.216)(0.012799)(9.776181) t=(-2.110573) (10.58454) (1.928512) 错误!未找到引用源。错误!未找到引用源。F=522.0976 从上回归结果可以看出,拟合优度很高,整体效果的F检验通过。但当错误!未找到引用源。=0.05时,错误!未找到引用源。=错误!未找到引用源。2.131.有重要变量X3的t检验不显著,可能存在严重的多重共线性。 2.多重共线性模型的识别 2.1计算解释变量x2、x3的简单相关系数矩阵。 点击Eviews主画面的顶部的Quick/Group Statistics/Correlatios弹出对话框在对话框中输入解释变量x2、x3,点击OK,即可得出相关系数矩阵(同图4)。 相关系数矩阵 图4 由图4相关系数矩阵可以看出,各解释变量相互之间的相关系数较高,证实解释变量之间存在多重共线性。 2.2多重共线性模型的修正

计量经济学 简单线性回归 实验报告

实验报告 1. 实验目的 随着中国经济的发展,居民的常住收入水平不断提高,粮食销售量也不断增长。研究粮食年销售量与人均收入之间的关系,对于探讨粮食年销售量的增长的规律性有重要的意义。 2. 模型设定 为了分析粮食年销售量与人均收入之间的关系,选择“粮食年销售量”为被解释变量(用Y表示),选择“人均收入”为解释变量(用X 表示)。本次实验报告数据取自某市从1974年到1987年的数据(教材书上101页表3.11),数据如下图所示: 为分析粮食年销售量与人均收入的关系,做下图所谓的散点图: 粮食年销售量与人均收入的散点图 从散点图可以看出粮食年销售量与人均收入大体呈现为线性关系,可以建立如下简单现行回归模型:

3.估计参数 假定所建模型及其中的随机扰动项满足各项古典假定,可以用OLS 法估计其参数。 通过利用EViews对以上数据作简单线性回归分析,得出回归结果如下表所示: 可用规范的形式将参数估计和检验的结果写为: 99.61349+0.08147 (6.431242)(0.10738) t= (15.48900) (7.587119) =0.827498 F=57.56437 n=14 4.模型检验 (1).经济意义检验 所估计的参数=99.61349,=0.08147,说明人均收入每增加1元,平均说来可导致粮食年销售量提高0.08147元。这与经济学中边际消费倾向的意义相符。 (2).拟合优度和统计检验 拟合优度的度量:由回归结果表可以看出,本实验中可决系数为0.827498,说明所建模型整体上对样本数据拟合一般偏好。 对回归系数的t检验:针对:=0 和:=0,由回归结果表中还可以看出,估计的回归系数的标准误差和t值分别为:SE()=6.431242,t()=15.48900;的标准误差和t值分别为:SE()=0.10738,t()=7.587119.取a=0.05,查t分布表自由度为n-2=14-2=12的临界值(12)=2.179.因为t()=15.48900>(12)=2.179, 所以应拒绝:=0;因为t()=7.587119>(12)=2.179.所以应拒绝:=0。

计量经济学多重共线性实验报告

计量经济学实验报告 一、实验目的: 1、熟悉和掌握Eviews在多重共线性模型中的应用,如何判断和解决多重共线性问题。 2、加深对课程理论知识的理解和应用。 二、实验问题:农村居民各种不同类型的收入对消费支出影响(2006年) 农村居民收入(Y)主要来源于4项:即农业经营收入(X1)、工资性收入(X2)、财产性收入(X3)及转移性收入(X4)。 (1)利用线性模型或双对数模型进行分析。 (2)回归模型中存在多重共线性吗? 三、实验数据:由老师提供(本实验报告截取从北京到新疆共31组数据) 四、实验步骤: 1、建立新的工作文件,输入数据,分别保存为Y(农村居民收入),X1(农业经营收入)、X2(工资性收入)、X3(财产性收入)、及X4(转移性收入)。 2、建立线性模型:Y = a1*X1 + a2*X2 +a3*X3 + a4*X4 + u 得到方程: Y = 0.6268809567*X1 + 0.481134931*X2 - 0.255544644*X3 + 2.683018467*X4 + 479.3010949 3、分析 由图中数据可以看出,在最小二乘法下,模型的R平方和F值较大,表明模型中各解释变量对Y的联合线性作用显著; 但是X3(财产性收入)的系数是负的,这不符合经济学意义,财产性收入应当

与消费支出正相关,故怀疑模型存在多重共线性。 4、检验: 计算解释变量之间的简单相关系数: 在“quick”菜单中选“group statistics”项中的“correlation”命令。在出现“serieslist”对话框时,直接输入X1,X2,X3,X4出现如下结果 从表中可以看出,解释变量X1、X3、X4之间存在高度线性相关。 4、修正 第一步:运用OLS方法逐一求Y对各个解释变量的回归。 (1)Y = 0.8997862236*X1 + 1541.033294 t值 15.32947 12.29913 prob.值 0.0000 0.0000 R2=0.890148 F=234.9925 (2)Y = 0.2487123305*X2 + 2505.747921 t值 0.527219 2.676297 prob.值 0.6021 0.0121 R2= 0.009494 F=0.277960 (3)Y = 8.049228785*X3 + 1943.170851 t值 9.28666 11.56389 prob.值 0.0000 0.0000 R2=0.748356 F= 86.24206 (4)Y = 5.928884198*X4 + 1631.299987 t值 9.212266 8.434353 prob.值 0.0000 0.0000 R2= 0.745314 F=84.86584 结合经济意义和统计检验结果分析,在4个一元回归模型中消费支出Y对X1工资性收入线性关系最强,拟合程度较好,与经验相符,因此选(1)为初始的回归模型。 第二步:逐步回归 将其余解释变量逐一代入 (1)引入X2

相关主题
文本预览
相关文档 最新文档