本文将把OLS回归,从小样本推广到大样本的情形。关于小样本OLS回归,可见《小样本OLS回归的框架》和《小样本OLS回归梳理》。
尽管在大样本下,假设、推导、结论都与在小样本情形下不同,但总体的思路还是一样的:
- 进行点估计,再研究估计量的性质;
- 构造统计量,在大样本下推导其渐近分布,并进行假设检验。
本文考虑大样本情形中最简单的情况:独立同分布的随机样本。
1 记号与假设
由于可能会考虑到时间序列的情形,因此这里对于单个样本的下标采用t,不再用i。记Q=E(xtxt′),V=Var(xtεt),其他记号与小样本情形下一样。
- 假设1 独立同分布:{xt′,yt}′,t=1,…,N是可观测的独立同分布的随机样本;
- 假设2 线性性:yt=xt′β+εt,可写作矩阵形式y=Xβ+ε;
- 假设3 模型正确设定:E(εt∣xt)=0且E(εt2)=σ2<∞;
- 假设4 非奇异性:K×K矩阵Q是对称、有限、非奇异的;
- 假设5:K×K矩阵V是对称、有限、正定的;
- 假设6 条件同方差:E(εt2∣xt)=σ2。
由假设1与假设3,可推出E(εt∣X)=0,即满足了严格外生性。另外,由于有假设3的保证,V=Var(xtεt)=E(xtxt′εt2)。
可以看到,在大样本下,不需要对扰动项作出正态分布的假设。而这里的独立同分布假设,也保证了扰动项无自相关,因此,在后续的推导中,只需要考虑假设6是否满足即可。若满足假设6,那么假设5可由假设4保证,若不满足假设6即存在条件异方差,可以用E(εt4)<∞和E(xtk4)<∞联合保证假设5的矩条件。在推导后续结论时,一般要对是否满足假设6做分类讨论。
2 一些定理
定理1 独立同分布随机样本的弱大数定律:假设{Zt}t=1n为独立同分布随机样本,E(Zt)=μ且E(∣Zt∣)<∞,定义Zˉn=n−1∑t=1nZt,则当n→∞时,有Zˉnpμ。
定理2 独立同分布随机样本的多元中心极限定理:若{Zt}t=1n为独立同分布随机样本,E(Zt)=0且Var(Zt)=V为有限、对称、正定的矩阵。定义Zˉn=n−1∑t=1nZt,则当n→∞时,有
nZˉndN(0,V)
定理3 依概率收敛的连续性:若当n→∞时,AnpA,BnpB,且g(⋅)和f(⋅)都是连续函数,则
g(An)+h(Bn)g(An)h(Bn)pg(A)+h(B)pg(A)h(B)
定理4 Slutsky定理:若ZndZ,anpa且bnpb,其中a和b是常数,则当n→∞时有an+bnZnda+bZ。
3 β^的性质
β的点估计与小样本情形一样:β^=(X′X)−1X′y。在后续推导中,主要用到的是β^与β之差,β^−β=(X′X)−1X′ε。
为方便地使用大数定律和中心极限定理,可将它改写为β^−β=(N1X′X)−1(N1X′ε)。若将矩阵形式展开,上式就变为
β^−β=(N1t=1∑Nxtxt′)−1(N1t=1∑Nxtεt)
其中N1∑t=1Nxtxt′=N1XX′其实就是Q的样本矩形式,记为Q^。由大数定律,Q^pQ,而矩阵求逆操作可视为连续函数,因此有Q^−1pQ−1。
同样利用大数定律和假设3,可得N1∑t=1NxtεtpE(xtεt)=0。再由定理3,可知β^−βp0。这就是估计量β^的一致性。
4 β^的渐近分布及假设检验
4.1 β^的渐近分布
由中心极限定理可得
N⋅N1t=1∑NxtεtdN(0,V)
因此
N(β^−β)dN(0,Q−1VQ−1)
它的渐近分布的方差又称为渐近方差,记为Avar(Nβ^)=Q−1VQ−1。
若满足假设6,即在条件同方差下,V=σ2Q,渐近分布就变成了
N(β^−β)dN(0,σ2Q−1)
4.2 假设检验
检验零假设H0:Rβ=r,其中R为J×K矩阵。
4.2.1 条件异方差
若零假设成立,则R(β^−β)=Rβ^−r,而左边的渐近分布已经知道了,因此,可构造
N(Rβ^−r)′(RQ−1VQ−1R′)−1N(Rβ^−r)dχJ2
式中的Q和V我们还需要进行估计。由前文可知Q^pQ,对于V,我们同样可其用样本形式估计:
V^=N−1t=1∑Nxtxt′et2=NX′D(e)D(e)′X
其中D(e)=diag(e1,…,eN)。
可以证得,V^pV。证明只需将et写为et=εt−(β^−β)′xt后代入V^中,然后逐项推导依概率收敛即可。
最后,我们用Q^和V^进行替换,得:
N(Rβ^−r)′(RQ^−1V^Q^−1R′)−1(Rβ^−r)dχJ2
当J=1时,χ12开根号就是标准正态分布,因此可直接构造t统计量:
RQ^−1V^Q^−1R′N(Rβ^−r)dN(0,1)
值得注意的是,在大样本下,t统计量的tN−K分布变成了标准正态分布。
4.2.2 条件同方差
若满足假设6,则V=σ2Q,代入上一节,有
N(Rβ^−r)′(σ2RQ^−1R′)−1(Rβ^−r)dχJ2
与小样本情形中遇到的问题一样,由于不知道σ2的值,无法直接计算统计量。因此,可同样用s2代替σ2,这也是一致估计量,即s2pσ2。最后可得
N(Rβ^−r)′(s2RQ^−1R′)−1(Rβ^−r)dχJ2
当J=1时,可得
s2RQ^−1R′N(Rβ^−r)dN(0,1)