在做回归时,很多时候会有E(xtεt)=0的情况,这也意味着不满足外生性条件E(ε∣X)=0,此时的OLS估计量β^就不再满足无偏性,并且随着n的变大,它的bias也无法变小。若对此无法理解,请先掌握《小样本OLS回归梳理》中的内容。
此时该怎么办?一种解决方法是利用一些与ε无关的变量,这就是工具变量(instrumental variables,下文统称IV)。我们假设找到的IV是一些l×1的向量zt,再将它排成n×l的矩阵Z=[z1,⋯,zn]′。
IV需要与原来的xt足够接近,因此Z′X(X为n×k矩阵)必须满列秩。而我们寻找IV的目的,就是要让IV满足E(ztεt)=0,由数据生成过程εt=yt−xt′βo可知,我们要求解的就是满足E(zt(yt−xt′βo))=0的βo。
我们无法知道E(ztyt)和E(ztxt′),但可以用样本矩代替,即
n−1t=1∑nzt(yt−xt′βo)=Z′(y−Xβo)/n=0
上面的方程,若l<k,则有多个解,若l=k且Z′X非奇异,则有唯一解β~n=(Z′X)−1Z′y,若l>k,无解。在经济学理论中,往往会出现l>k的情形,此时尽管方程无解,但我们依旧可以寻找βo,使Z′(y−Xβo)尽可能接近0。
我们可以定义一个Z′(y−Xβo)和0之间的二次距离:
dn(β)=(Y−Xβ)′ZP^nZ′(y−Xβ)
其中P^n是一个l×l的正定范数矩阵(positive definite norming matrix),它可以是随机矩阵。这里之所以选择二次距离,是因为这样在求解最优化问题时比较方便,可以直接写出一阶条件:
∂β∂dn(β)=−2X′ZP^nZ′(y−Xβ)=0
假设X′ZP^nZ′X非奇异,就可以得到IV估计量
β~n=(X′ZP^nZ′X)−1X′ZP^nZ′y
只要选择Z和P^n,就可以得到各种计量经济学中的估计量。比如选择Z=X和P^n=(X′X/n)−1,那么β~n就变成了OLS估计量β^n。而选择P^n=(Z′Z/n)−1,就得到了2SLS(two-stage least squares)估计量。
IV估计量是无偏的吗?在数据生成过程y=Xβo+ε下,有
β~n===(X′ZP^nZ′X)−1X′ZP^nZ′y(X′ZP^nZ′X)−1X′ZP^nZ′(Xβo+ε)βo+(X′ZP^nZ′X)−1X′ZP^nZ′ε
事实上,上式的第二项我们没有理由保证它为0,哪怕有E(ε∣Z)=0也无法保证。但在假设Z′ε/n⟶a.s.0、Z′X/n⟶a.s.Q(Q为有限满列秩矩阵)以及P^n⟶a.s.P(P为有限正定矩阵)之后,可以得到比无偏性更弱的一致性:β~n⟶a.s.βo。