第1章 广义矩估计
1.1 矩估计
1.1.1
总体矩与样本矩
设总体X 的可能分布族为(){},,F x θθ∈Θ,其中来自参数空间Θ的
()12,,,k θθθ=θK 是待估计的未知参数。假定总体分布的
m 阶矩存在,则总体分
布的k 阶原点矩和k 阶中心矩为
()(),1k k
k EX x dF x k m α+∝-∝
=≤≤?
θθ@
1
()[()]()[()],1k k k E X E x x E x dF x k m μ+∝-∝
-=-≤≤?
θθ@ 2
两种常见的情况是一阶原点矩和二阶中心矩:
()E X μ=
3
2222()[()]()Var X E X E X μμσ=-=-@
4
一阶原点矩表示变量的期望值,二阶中心矩表示变量的方差。
对于样本12(,,,)n X X X =X K ,其k 阶原点矩是:
1
1n k
k i i m X n ==∑(1k m ≤≤)
5
当k =1时,m 1表示X 的样本均值。 X 的k 阶中心矩是:
()1
1n
k k i i B X X n =-∑@(1k m ≤≤)
6
当k =2时,B 2表示X 的样本方差。
1.1.2
矩估计方法
矩方法(moment method )是一种古老的估计方法。其基本思想是:在
随机抽样中,样本统计量将依概率收敛于某个常数。这个常数又是分布中未知参数的一个函数。
总体分布的k 阶矩为()12,,,K θθθ=θK 的函数。根据大数定理,样本矩依概率收敛于总体矩。因此,可以用样本矩作为总体矩的估计,即令: 即:
()1
1,1,2,,n k
k
i i x dF x X k K n +∝-∝
= = =∑
∑K θ 7
上式确定了包含K 个未知参数()12,,,K θθθ=θK 的K 个方程式,求解上式所构成
的方程组就可以得到()12,,,K θθθ=θK 的一组解()12????,,,k θθθ=?θ。因为m k 是随机变量,故解得的?θ也是随机变量。这种参数估计方法称为矩方法,()
12????,,,k θθθ=?θ即是()12,,,K θθθ=θK 的矩估计量。
定理:X 的分布函数F (X )存在2ν阶矩,则对样本的ν阶原点矩m v ,则矩的期望和方差为: []E m ννα=,[]()
2
21Var m n
ννν
αα=
- 8
证明:
矩方法的一般步骤:
Step1:总体矩条件(population moment condition ):(),t =m w θ0。一般情况下,矩条件可以写为:[(,)]t E f =w θ0。
给定观测样本12(,,,)T y y y K ,总体矩无法计算。但可以计算总体矩条件对应的样本矩条件。
Step2:样本矩条件(sample moment condition ):()?,t =m
w θ0。一般情况下,矩条件可以写为:
根据大数定理,样本矩依概率收敛于总体矩,即
Step3:令样本矩=总体矩,得到矩方程,解方程(组)得到未知参数的矩估计量。
在很多情况下,我们可以根据矩条件构建矩方程,然后求解未知参数。一般情况下,这些矩条件都是可以直接观察到(或假定)的。
例 1.1 假定随机变量 y t 的均值()t E y μ=存在但未知,利用矩方法进行估计。
Step1:总体矩:令(),t t f y y μμ=-,则(),0t E f y μ??=??
Step2:样本矩为:()()()11
11?,,0T T
t t t t t m
y f y y T T μμμ====-=∑∑ 根据大数定理,样本矩依概率收敛于总体矩,即
解上述方程即可得到μ的矩估计量1
1?T
MM t t y T μ
==∑ 1.1.3
矩方法的几个特例
很多估计方法(比如OLS 、TSLS 等)都是矩估计的特殊形式。
1. O LS 估计
例2:在回归方程中,
其中12(,,,)t t t Kt x x x =x L ,12(,,,)'K βββ=βL 。
假定t u 的条件均值()|t t E u x 为0,则 由()|0t t E u =x 和迭代期望公式可以得出: 其对应的样本矩条件为: 解上述方程可以得到MM 估计量:
2. I V
估计
考虑如下回归模型:
1122t t t t y u =++x βx β
9
其中,()121,t t t K ?=x x x ,x 1t 包括K 1个外生变量,但2t x 包括K 2个内生变量,即
()1'0t t E u =x
10
()2'0t t E u ≠x
11
设x 2的工具变量为z 2,z 2包括K 2个工具变量,z 2满足
()22,0t t Corr ≠z x
12
()2,0t t Corr u =z
13
(10)(13)共同构成了新的矩条件,定义
z 为工具变量,其中x 1t 仍然作为自身的工具变量,而z 2t 作为x 2t 的工具变量。
K=K 1+K 2个总体矩条件为:
()()()1,''t t t t t t K E u E y ???= =-=??m w θz z x β0
14
相应的样本矩为:
()()()(1)111?,''T t t t t K t y T T
?=??=-=-=??∑m w θz x βz y x β0 15
MM 估计量为:
1111
??''(')T T
MM
t t t t IV
t t y --==??
=== ???
∑∑βz x z z x zy β 16
1.2
广义矩
广义矩(Generalized Moment Method )是由矩方法发展而来,其奠基
之作是Hansen (1982)。
1.2.1
GMM 方法的引入 设模型设定为:
其中,12(,,,)t t t Kt x x x =x L ,12(,,,)'K βββ=βL ,z t 为工具变量(1L )。令
(),,t t t t y =w x z ,则L 个矩条件为:
()()()1,''t t t t t t L E u E y ???==-=??m w θz z x β0
17
即:()()''E E =z x βz y
对应的样本矩条件为:
()()()1111?,''T t t t t L t y T T
?=??=-=-=??∑m w θz x βz y x β0 18
从上式可以看出,
(1) L < K ,即工具变量的个数小于未知参数的个数时,矩条件方程()?,0t =m w θ无解,参数不能识别。
(2) L = K ,即工具变量的个数等于未知参数的个数时,矩条件方程()?,0t =m
w θ
唯一解,参数恰好识别。估计量为:
1111
?''(')T T
t t t t t t y --==??== ???
∑∑βz x z z x zy
19
如前所述,OLS 估计量和IV 估计都是这种情况下的特殊形式。
(3) L > K ,即工具变量的个数大于未知参数的个数时,采用不同的矩方程可以得到不同的解,因此,矩方程具有多个解。
1.2.2
秩条件与阶条件
从(17)式得到的矩条件方程为:
可以看出,要使得有解,[(')][('')]Rank E Rank E =M z x z x z y 。如果[(')]Rank E K =z x ,
则存在唯一解;如果[(')]Rank E K
1.2.3
GMM 估计及渐进特征
当L > K 时,秩条件不成立,MM 方法存在多个解。这时,可以采用两种
方法。其一,将多个工具变量组合成为K 个工具变量。这即是2SLS 。在2SLS 中的第一阶段,用每一个内生变量对L 个工具变量回归,得到K 个拟合值;然后,用这K 个拟合值作为工具变量进行LS 回归。第二种方法即是GMM 估计。后面将会看到,TSLS 方法是GMM 方法在同方差假定下的特例。
GMM 方法即是解决L > K 情况下的一般方法。GMM 方法完全是根据矩条件来估计参数,因此对扰动项的分布形式没有任何假定,这一点使GMM 估计成为稳健性分析中的重要应用。
1. G MM 估计
广义矩方法即是处理过度识别情况的一般方法。首先来看一下如何将MM 估计推广到GMM 估计。设模型为
y =f(x, β)+u
x 中包含K 个变量,L 个工具变量表示为z 。在MM 估计中,利用K 个工具变
量估计K 个未知参数,需要构建K 个矩方程。每个矩条件表示为m l (l=1,2,…, K)。K 个矩方程为
等价于解方程:21???(,)'(,)K
l t t l Q m
====∑m w θm w θ0。 A
当存在L>K 个工具变量时,共有L 个矩方程,而只有K 个未知参数。因此,根据MM 方法,共有K L ??
???
个组合,可以得到的矩估计量的个数为K L
??
???
。这时,
每个组合得到的MM 估计量都不能满足A 式,即A 式不会恰好为0。但可以考虑将各种不同的估计结果综合起来,使A 式最小化。比如,
21???(,)'(,)L
l t t l Q m
===∑m w θm w θ 20
即使得L 个矩条件的平方和最小。
因为不同矩的方差不同,因此更科学的方法是使用加权的平方和,
??(,)'(,)t t t Q =m
w θW m w θ 21
W t 可以是任意的正定矩阵(可以依赖于数据,但不包含未知参数)。事实上(20)式是(21)式的一个特例,即W t =I 。GMM 估计量是求下式的最优解:
()
{}???arg min (,)'(,)GMM t t t t Q
=θ
θW m
w θW m w θ 22
括号中的W t 表示GMM 估计量取决于W t ,不同的权数矩阵会得到不同的估计量。根据一阶条件
便可以得到GMM 估计量。令?(,)?t ?=
?m
w θG θ
为(L×K)矩阵,第(i ,j )元素表示第i 个矩条件对第j 个参数的导数。
比如,在线性模型y = x β+u 中,令?()GMM t βW 表示参数β的GMM 估计。则矩条件为
目标函数为: 一阶条件为:
()?(,)?(,)???(')'''()?(')'()(')'(')()t t t t t
t t t
Q ??==???-=?==m
w θW m
w θ0ββZ X W Z y Z X βW 0Z X W Zy Z X W Z X βW 0
23
进而可求得GMM 估计量
2. 任意正定权数矩阵的GMM 估计量的渐进特征
定理:对于任意正定权数矩阵,?GMM
β具有一致性:
Pr ?GMM
??→ββ 24
定理:对于任意正定权数矩阵,?GMM β具有渐进正态性:
()
11?
),(')'(')d GMM Normal ---??
→ββG WG G WSWG G WG 0 25 其中,
.(,)t AsyVar ?=?
S w θ,(,)
'
t ?=?m w θG θ 注:对一阶条件在真实参数处进行泰勒级数展开便可得到GMM 估计量的极限分布。
如果权数矩阵选择为单位矩阵,那么渐进协方差为11(')'(')--G G G SG G G 。
3. 任意正定权数矩阵的矩的渐进特征
GMM 估计中,不仅参数估计量具有渐进正态性,而且矩也具有渐进正态性。
假设1:如果W t 为正定矩阵,且plim t =W W 。
假设2:?plim (,)0t =m
w θ。 根据大数定理,样本矩收敛于总体矩,
()()?,,t t →m
w θm w θ,当T →∞时。 26
又根据中心极限定理,
()()
?,0,t N →w θS 27
其中,S 表示(),t w θ的渐进协方差矩阵,即.(,)t AsyVar ?=?
S w θ。 任意权数矩阵下,()?m
θ的渐进分布为: ()()
1/21/21/2
?,'d
N Normal ??→m θBW SW B 0 28
其中,1/211/2[']'L -=-B I W G G WG G W ,B 是对称幂等矩阵。
1.2.4
最优权数矩阵的选择
对于任意满足假设1的权数矩阵,?GMM θ都具有一致性。接下来,我们介
绍如何确定最优的W t 及其渐进分布特征。