GMM 估计中文讲义2
线性模型
1i x 是1k ?,2i x 是1r ?,l k r =+。如果没有其他约束,β的渐进有效估计量是OLS
估计。现在假设给定一个信息20β=,我们可以把模型写为,
11
i i i y x βε'=+,()0i i E x ε= 如何估计1β?一种就是OLS 估计。然而这种方法不是必然有效的,当在()0i i E x ε=方程中有l 个约束,然而1β的维数k l <,这种情况称为过渡识别。这里有r l k =-比自由参数多的矩约束,我们称r 是过渡约束识别个数。
让(,,,)g y z x β是1l ?个方程,参数β为1k ?,且k l <,有
0(,,,)0i i i Eg y z x β= (1)
0β是β
的真实值,在上面线性模型中有1
(,,)()g y x x y x ββ'=
-。在计量经济学里,这类模型称为矩条件模型。在统计学中,这称为估计方程。 另外,我们还有一个线性矩条件模型,
1i i i y z βε'=+,()0i i E x ε=
i z 和i x 的维数都是1k ?,且有1l ?,k l <,如果k l =则模型是恰好识别,否则是过
渡识别。变量i z 是i x 的一部分或是i x 的函数。模型(1)可以设置为,
0(,,,)()i i i g y z x x y z ββ'=- (2)
GMM 估计
模型(2)样本均值为
11111
()(())()n n n i i i i i i n n n
g g x y z X y X Z ββββ==='''=-=-∑∑ (3)
β的矩估计量就是设置()0n g β=。对于k l <个方程大于参数的情形,GMM 估计思
想就是设置()n g β近可能的接近于零。
对于l l ?加权矩阵W 0n >,让
这是向量()n g β长度的非负测度。例如,如果W n I =,则有
2
()()()()n n n n n n J g g g ββββ'=?=?。
GMM 估计就是最小化()n J β,即定义arg ()GMM n J β
ββ=。
注意,如果k l =,则()0?n g β
=,GMM 估计就是矩估计方法。GMM 估计的一阶条件为 则β的GMM 估计为 GMM 估计量的分布
假设W W>0p n ??
→,令)(i i Q E x z '= 和 2))((i i i i i E E x x g g ε=''Ω=
这里i i i g x ε=
,则11W W p
n Z X X Z Q Q n n ????'''??→ ? ?????
定理1:
?)(0,)d N V ββ-??→
为了使V 最小,最优加权矩阵1
0W -=Ω(证明留作练习)。这产生了最有效的GMM 估计量:
这时,我们有定理2:对于有效的GMM
11?)(0,())d
N Q Q β
β--'-??→Ω 实际上10W -=Ω是未知的,但它能一致估计。对于任何0W W p
n ??
→,我们仍然称?β是有效的GMM 估计量,且有相同的渐进分布。
有效即意味着GMM 估计量有最小的渐进方差。当我们只考虑加权矩阵W n ,这是弱有效概念。然而Gary Chamberlain (1987)证明这个GMM 估计量是半参数有效的。 有效加权矩阵估计
对于给定的W >0n ,?β的GMM 估计量是一致但不是有效的,例如W =n l I 。在线性模型,
一个较好的选择是1
W =()n X X -'
。给定第一步估计量,我们定义残差?i i i y z εβ'=-,矩方程 ???(,,,)i i i i i i g
x g y z x εβ==,构造 定义11
1111?W ?i n n n i i n n i i i g g
n n g g g g --*==*????
'''==- ? ?????
∑∑)) 那么有-10W =W p
n ??
→Ω,使用W n 得到的GMM 估计量是渐进有效的。 一个替代性选择是1
11?W ?i n n i i g n g -=??
'= ???
∑,使用非中心化的矩条件。因为0i Eg =,这两种估计量在正确的假设下是渐进相等的。然而,Alastair Hall (2000) 指出非中心化估计量是较
差的选择。当构造假设检验,备择假设下的矩条件是无效的,如0i Eg ≠,所以非中心化的估
计量包含着偏误项,以及对检验势的影响。
对于线性模型,有效的GMM 估计量可以这样计算,首先,设置1
W =()n X X -'
,使用此