1 CEF error的有限性问题
在回归中,记条件期望函数(conditional expectation function,CEF)为E[Y∣X=x],则可将因变量Y分解为
Y=E[Y∣X=x]+e
可记e=Y−E[Y∣X=x]为条件期望函数误差(CEF error)。
显然,e满足E[e∣X]=0,E[e]=0,这些都很容易证明。下面来看一个关于e的有限性的问题:
若对于r>1有E[∣Y∣r]<∞,求证E[∣e∣r]<∞。
从直觉上说,e是用条件期望函数对Y做了解释后留下的残差,那么Y的有限性应该可以保证e的有限性。但要证明它,却比较复杂。
2 证明
首先我们利用Minkowski不等式,有
=≤(E[∣e∣r])1/r(E[∣Y−E[Y∣X=x]∣r])1/r(E[∣Y∣r])1/r+(E[∣E[Y∣X=x]∣r])1/r
由已知条件,第一项(E[∣Y∣r])1/r是有限的。
对于第二项,由于g(⋅)=∣⋅∣r在r≥1时为凸函数,由Jensen不等式g(E[Y∣X])≤E[g(Y)∣X],即有
∣E[Y∣X]∣r≤E[∣Y∣r∣X]
再对两边取期望后取1/r次幂,可得
(E[∣E[Y∣X]∣r])1/r≤(E[∣Y∣r])1/r
由已知条件可知,这一项也是有限的。
3 扩展
若我们关注r=2,就变成了CEF error的无条件方差σ=E[e2]=Var[e]。结论重新表述如下:
若E[Y2]<∞,则σ2<∞。
事实上,若对于多个解释变量,则不断加入解释变量后,残差的方差必将减小,即若E[Y2]<∞,必有
Var[Y]≥Var[Y−E[Y∣X1]]≥Var[Y−E[Y∣X1,X2]]
为什么?
证明:先利用E[Y∣X1]=E[E[Y∣X1,X2]∣X1]和Jensen不等式,我们可以得到
(E[Y∣X1])2=(E[E[Y∣X1,X2]∣X1])2≤E[(E[Y∣X1,X2])2∣X1]
两边取期望后有
E[(E[Y∣X1])2]≤E[(E[Y∣X1,X2])2]
同理,利用E[Y]=E[E[Y∣X1]]和Jensen不等式,可得到(E[Y])2≤E[(E[Y∣X1])2],与上面的式子放在一起有
(E[Y])2≤E[(E[Y∣X1])2]≤E[(E[Y∣X1,X2])2]
三个地方都同时减去(E[Y])2,可得
0≤Var[E[Y∣X1]]≤Var[E[Y∣X1,X2]]
另一方面,我们已有e=Y−E[Y∣X],再记u=E[Y∣X]−E[Y],则E[eu]=0,因此
===Var[Y]Var[e+u]Var[e]+Var[u]Var[Y−E[Y∣X]]+Var[E[Y∣X]]
而Var[Y]为常数,因此,Var[E[Y∣X]]越大,Var[Y−E[Y∣X]]越小,即
Var[Y]≥Var[Y−E[Y∣X1]]≥Var[Y−E[Y∣X1,X2]]