当前位置：文档之家› 5广义矩估计word精品文档14页

5广义矩估计word精品文档14页

第1章广义矩估计

1.1 矩估计

1.1.1

总体矩与样本矩

设总体X 的可能分布族为(){},,F x θθ∈Θ，其中来自参数空间Θ的

()12,,,k θθθ=θK 是待估计的未知参数。假定总体分布的

m 阶矩存在，则总体分

布的k 阶原点矩和k 阶中心矩为

()(),1k k

k EX x dF x k m α+∝-∝

=≤≤?

θθ@

()[()]()[()],1k k k E X E x x E x dF x k m μ+∝-∝

-=-≤≤?

θθ@ 2

两种常见的情况是一阶原点矩和二阶中心矩：

()E X μ=

2222()[()]()Var X E X E X μμσ=-=-@

一阶原点矩表示变量的期望值，二阶中心矩表示变量的方差。

对于样本12(,,,)n X X X =X K ，其k 阶原点矩是：

1n k

k i i m X n ==∑（1k m ≤≤）

当k =1时，m 1表示X 的样本均值。 X 的k 阶中心矩是：

()1

k k i i B X X n =-∑@（1k m ≤≤）

当k =2时，B 2表示X 的样本方差。

1.1.2

矩估计方法

矩方法（moment method ）是一种古老的估计方法。其基本思想是：在

随机抽样中，样本统计量将依概率收敛于某个常数。这个常数又是分布中未知参数的一个函数。

总体分布的k 阶矩为()12,,,K θθθ=θK 的函数。根据大数定理，样本矩依概率收敛于总体矩。因此，可以用样本矩作为总体矩的估计，即令：即：

()1

1,1,2,,n k

i i x dF x X k K n +∝-∝

= = =∑

∑K θ 7

上式确定了包含K 个未知参数()12,,,K θθθ=θK 的K 个方程式，求解上式所构成

的方程组就可以得到()12,,,K θθθ=θK 的一组解()12????,,,k θθθ=?θ。因为m k 是随机变量，故解得的?θ也是随机变量。这种参数估计方法称为矩方法，()

12????,,,k θθθ=?θ即是()12,,,K θθθ=θK 的矩估计量。

定理：X 的分布函数F (X )存在2ν阶矩，则对样本的ν阶原点矩m v ，则矩的期望和方差为： []E m ννα=，[]()

21Var m n

ννν

αα=

- 8

证明：

矩方法的一般步骤：

Step1：总体矩条件（population moment condition ）：(),t =m w θ0。一般情况下，矩条件可以写为：[(,)]t E f =w θ0。

给定观测样本12(,,,)T y y y K ，总体矩无法计算。但可以计算总体矩条件对应的样本矩条件。

Step2：样本矩条件（sample moment condition ）：()?,t =m

w θ0。一般情况下，矩条件可以写为：

根据大数定理，样本矩依概率收敛于总体矩，即

Step3：令样本矩=总体矩，得到矩方程，解方程（组）得到未知参数的矩估计量。

在很多情况下，我们可以根据矩条件构建矩方程，然后求解未知参数。一般情况下，这些矩条件都是可以直接观察到（或假定）的。

例 1.1 假定随机变量 y t 的均值()t E y μ=存在但未知，利用矩方法进行估计。

Step1：总体矩：令(),t t f y y μμ=-，则(),0t E f y μ??=??

Step2：样本矩为：()()()11

11?,,0T T

t t t t t m

y f y y T T μμμ====-=∑∑ 根据大数定理，样本矩依概率收敛于总体矩，即

解上述方程即可得到μ的矩估计量1

1?T

MM t t y T μ

==∑ 1.1.3

矩方法的几个特例

很多估计方法（比如OLS 、TSLS 等）都是矩估计的特殊形式。

1． O LS 估计

例2：在回归方程中，

其中12(,,,)t t t Kt x x x =x L ，12(,,,)'K βββ=βL 。

假定t u 的条件均值()|t t E u x 为0，则由()|0t t E u =x 和迭代期望公式可以得出：其对应的样本矩条件为：解上述方程可以得到MM 估计量：

2． I V

估计

考虑如下回归模型：

1122t t t t y u =++x βx β

其中，()121,t t t K ?=x x x ，x 1t 包括K 1个外生变量，但2t x 包括K 2个内生变量，即

()1'0t t E u =x

()2'0t t E u ≠x

设x 2的工具变量为z 2，z 2包括K 2个工具变量，z 2满足

()22,0t t Corr ≠z x

()2,0t t Corr u =z

（10）（13）共同构成了新的矩条件，定义

z 为工具变量，其中x 1t 仍然作为自身的工具变量，而z 2t 作为x 2t 的工具变量。

K=K 1+K 2个总体矩条件为：

()()()1,''t t t t t t K E u E y ???= =-=??m w θz z x β0

相应的样本矩为：

()()()(1)111?,''T t t t t K t y T T

?=??=-=-=??∑m w θz x βz y x β0 15

MM 估计量为：

1111

??''(')T T

t t t t IV

t t y --==??

=== ???

∑∑βz x z z x zy β 16

1.2

广义矩

广义矩（Generalized Moment Method ）是由矩方法发展而来，其奠基

之作是Hansen （1982）。

1.2.1

GMM 方法的引入设模型设定为：

其中，12(,,,)t t t Kt x x x =x L ，12(,,,)'K βββ=βL ，z t 为工具变量（1L ）。令

(),,t t t t y =w x z ，则L 个矩条件为：

()()()1,''t t t t t t L E u E y ???==-=??m w θz z x β0

即：()()''E E =z x βz y

对应的样本矩条件为：

()()()1111?,''T t t t t L t y T T

?=??=-=-=??∑m w θz x βz y x β0 18

从上式可以看出，

(1) L < K ，即工具变量的个数小于未知参数的个数时，矩条件方程()?,0t =m w θ无解，参数不能识别。

(2) L = K ，即工具变量的个数等于未知参数的个数时，矩条件方程()?,0t =m

w θ

唯一解，参数恰好识别。估计量为：

1111

?''(')T T

t t t t t t y --==??== ???

∑∑βz x z z x zy

如前所述，OLS 估计量和IV 估计都是这种情况下的特殊形式。

(3) L > K ，即工具变量的个数大于未知参数的个数时，采用不同的矩方程可以得到不同的解，因此，矩方程具有多个解。

1.2.2

秩条件与阶条件

从（17）式得到的矩条件方程为：

可以看出，要使得有解，[(')][('')]Rank E Rank E =M z x z x z y 。如果[(')]Rank E K =z x ，

则存在唯一解；如果[(')]Rank E K z x ，则存在多个解。要得到β的唯一解，矩阵(')z x 的转置必须存在。而(')z x 为L K ?阶矩阵，因此，有唯一解的充分条件是[(')]Rank E K =z x ，称之为工具变量的秩条件。秩条件(')Rank K =z x 暗含的另外一个假定是L ≥K ，即工具变量的个数大于内生解释变量的个数。称之为工具变量的阶条件。如果L>K ，称为过度识别；如果L=K ，则称为恰好识别。

1.2.3

GMM 估计及渐进特征

当L > K 时，秩条件不成立，MM 方法存在多个解。这时，可以采用两种

方法。其一，将多个工具变量组合成为K 个工具变量。这即是2SLS 。在2SLS 中的第一阶段，用每一个内生变量对L 个工具变量回归，得到K 个拟合值；然后，用这K 个拟合值作为工具变量进行LS 回归。第二种方法即是GMM 估计。后面将会看到，TSLS 方法是GMM 方法在同方差假定下的特例。

GMM 方法即是解决L > K 情况下的一般方法。GMM 方法完全是根据矩条件来估计参数，因此对扰动项的分布形式没有任何假定，这一点使GMM 估计成为稳健性分析中的重要应用。

1． G MM 估计

广义矩方法即是处理过度识别情况的一般方法。首先来看一下如何将MM 估计推广到GMM 估计。设模型为

y =f(x, β)+u

x 中包含K 个变量，L 个工具变量表示为z 。在MM 估计中，利用K 个工具变

量估计K 个未知参数，需要构建K 个矩方程。每个矩条件表示为m l (l=1,2,…, K)。K 个矩方程为

等价于解方程：21???(,)'(,)K

l t t l Q m

====∑m w θm w θ0。 A

当存在L>K 个工具变量时，共有L 个矩方程，而只有K 个未知参数。因此，根据MM 方法，共有K L ??

???

个组合，可以得到的矩估计量的个数为K L

???

。这时，

每个组合得到的MM 估计量都不能满足A 式，即A 式不会恰好为0。但可以考虑将各种不同的估计结果综合起来，使A 式最小化。比如，

21???(,)'(,)L

l t t l Q m

===∑m w θm w θ 20

即使得L 个矩条件的平方和最小。

因为不同矩的方差不同，因此更科学的方法是使用加权的平方和，

??(,)'(,)t t t Q =m

w θW m w θ 21

W t 可以是任意的正定矩阵（可以依赖于数据，但不包含未知参数）。事实上（20）式是（21）式的一个特例，即W t =I 。GMM 估计量是求下式的最优解：

()

{}???arg min (,)'(,)GMM t t t t Q

=θ

θW m

w θW m w θ 22

括号中的W t 表示GMM 估计量取决于W t ，不同的权数矩阵会得到不同的估计量。根据一阶条件

便可以得到GMM 估计量。令?(,)?t ?=

w θG θ

为（L×K）矩阵，第（i ，j ）元素表示第i 个矩条件对第j 个参数的导数。

比如，在线性模型y = x β+u 中，令?()GMM t βW 表示参数β的GMM 估计。则矩条件为

目标函数为：一阶条件为：

()?(,)?(,)???(')'''()?(')'()(')'(')()t t t t t

t t t

Q ??==???-=?==m

w θW m

w θ0ββZ X W Z y Z X βW 0Z X W Zy Z X W Z X βW 0

进而可求得GMM 估计量

2．任意正定权数矩阵的GMM 估计量的渐进特征

定理：对于任意正定权数矩阵，?GMM

β具有一致性：

Pr ?GMM

??→ββ 24

定理：对于任意正定权数矩阵，?GMM β具有渐进正态性：

()

11?

),(')'(')d GMM Normal ---??

→ββG WG G WSWG G WG 0 25 其中，

.(,)t AsyVar ?=?

S w θ，(,)

t ?=?m w θG θ 注：对一阶条件在真实参数处进行泰勒级数展开便可得到GMM 估计量的极限分布。

如果权数矩阵选择为单位矩阵，那么渐进协方差为11(')'(')--G G G SG G G 。

3．任意正定权数矩阵的矩的渐进特征

GMM 估计中，不仅参数估计量具有渐进正态性，而且矩也具有渐进正态性。

假设1：如果W t 为正定矩阵，且plim t =W W 。

假设2：?plim (,)0t =m

w θ。根据大数定理，样本矩收敛于总体矩，

()()?,,t t →m

w θm w θ，当T →∞时。 26

又根据中心极限定理，

()()

?,0,t N →w θS 27

其中，S 表示(),t w θ的渐进协方差矩阵，即.(,)t AsyVar ?=?

S w θ。任意权数矩阵下，()?m

θ的渐进分布为： ()()

1/21/21/2

?,'d

N Normal ??→m θBW SW B 0 28

其中，1/211/2[']'L -=-B I W G G WG G W ，B 是对称幂等矩阵。

1.2.4

最优权数矩阵的选择

对于任意满足假设1的权数矩阵，?GMM θ都具有一致性。接下来，我们介

绍如何确定最优的W t 及其渐进分布特征。