Cauchy-Schwarz不等式、Hölder不等式与Minkowski不等式

553 阅读1分钟

本文介绍几个常用的与期望有关的不等式。

1 Cauchy–Schwarz不等式

Cauchy–Schwarz不等式有许多形式,这里只介绍它的期望函数的形式。

Cauchy–Schwarz不等式

[E(XY)]2E(X2)E(Y2)[\text{E}(XY)]^2 \leq \text{E}(X^2)\text{E}(Y^2)

证明非常简单,只需先将YY分解为相互正交的两部分(类似于OLS回归):

Y=E(XY)E(X2)X+(YE(XY)E(X2)X)Y=\dfrac{\text{E}(XY)}{\text{E}(X^2)}X+\left(Y-\dfrac{\text{E}(XY)}{\text{E}(X^2)}X\right)

然后两边取平方,再求期望。注意到取平方后交叉项的期望

E[E(XY)E(X2)X(YE(XY)E(X2)X)]=E(XY)2E(X2)E(XY)2E(X2)=0\text{E}\left[\dfrac{\text{E}(XY)}{\text{E}(X^2)}X\cdot\left(Y-\dfrac{\text{E}(XY)}{\text{E}(X^2)}X\right)\right]=\dfrac{\text{E}(XY)^2}{\text{E}(X^2)}-\dfrac{\text{E}(XY)^2}{\text{E}(X^2)}=0

交叉项期望为00,因此,只剩平方项的期望:

E(Y2)=E(XY)2E(X2)2E(X2)+E[(YE(XY)E(X2)X)2]E(XY)2E(X2)\begin{aligned} \text{E}(Y^2)&=\dfrac{\text{E}(XY)^2}{\text{E}(X^2)^2}\text{E}(X^2)+\text{E}\left[\left(Y-\dfrac{\text{E}(XY)}{\text{E}(X^2)}X\right)^2\right]\\ &\geq \dfrac{\text{E}(XY)^2}{\text{E}(X^2)} \end{aligned}

得证。

2 Hölder不等式

事实上,Cauchy–Schwarz不等式是Hölder不等式的特例。

Hölder不等式XXYY为两个随机变量,正数ppqq满足

1p+1q=1\dfrac{1}{p}+\dfrac{1}{q}=1

则有

EXY[EXp]1/p[EYq]1/q\text{E}\vert XY\vert\leq \left[\text{E}\vert X\vert^p\right]^{1/p}\left[\text{E}\vert Y\vert^q\right]^{1/q}

证明过程如下:首先证明对于任意正数aabb,且正数ppqq满足1p+1q=1\dfrac{1}{p}+\dfrac{1}{q}=1,必有

1pap+1qbqab\dfrac{1}{p}a^p+\dfrac{1}{q}b^q\geq ab

当且仅当ap=bqa^p=b^q时等号成立。

该式的证明,只需构造函数g(a)=1pap+1qbqabg(a)=\dfrac{1}{p}a^p+\dfrac{1}{q}b^q - ab,该函数最小值在ap1=ba^{p-1}=b时取到00,因此上式成立。

有了这一步,再将a=X[E(Xp)]1/pa=\dfrac{\vert X\vert}{\left[\text{E}(\vert X\vert^p)\right]^{1/p}}b=Y[E(Yq)]1/qb=\dfrac{\vert Y\vert}{\left[\text{E}(\vert Y\vert^q)\right]^{1/q}}代入,再对两边同时取期望,即可证得Hölder不等式。

3 Minkowski不等式

利用Hölder不等式,可以得到另一个重要的不等式:Minkowski不等式。

Minkowski不等式:已知随机变量XXYY,当1q<1\leq q<\infty时,必有

[E(X+Yp)]1/p[E(Xp)]1/p+[E(Yp)]1/p\left[\text{E}(\vert X+Y \vert^p)\right]^{1/p}\leq \left[\text{E}(\vert X\vert^p)\right]^{1/p}+\left[\text{E}(\vert Y \vert^p)\right]^{1/p}

它的证明如下:

取满足1p+1q=1\dfrac{1}{p}+\dfrac{1}{q}=1qq,有

E(X+Yp)=E(X+YX+Yp1)E(XX+Yp1)+E(YX+Yp1)[E(Xp)]1/p[E(X+Y(p1)q)]1/q+[E(Yp)]1/p[E(X+Y(p1)q)]1/q={[E(Xp)]1/p+[E(Yp)]1/p}[E(X+Yp)]1/q\begin{aligned} \text{E}(\vert X+Y \vert^p) =& \text{E}\left(\vert X+Y \vert \vert X+Y \vert^{p-1}\right)\\ \leq& \text{E}\left(\vert X \vert \vert X+Y \vert^{p-1}\right)+\text{E}\left(\vert Y \vert \vert X+Y \vert^{p-1}\right)\\ \leq& \left[\text{E}\left(\vert X \vert^p\right)\right]^{1/p}\left[\text{E}\left(\vert X+Y \vert^{(p-1)q}\right)\right]^{1/q}\\ & +\left[\text{E}\left(\vert Y \vert^p\right)\right]^{1/p}\left[\text{E}\left(\vert X+Y \vert^{(p-1)q}\right)\right]^{1/q}\\ =&\left\{\left[\text{E}\left(\vert X \vert^p\right)\right]^{1/p}+\left[\text{E}\left(\vert Y \vert^p\right)\right]^{1/p}\right\}\left[\text{E}\left(\vert X+Y \vert^{p}\right)\right]^{1/q} \end{aligned}

其中,第一个不等式用到了三角不等式X±YX+Y\vert X\pm Y\vert \leq \vert X\vert+\vert Y\vert,第二个不等式则是直接使用Hölder不等式。

最后两边同除以[E(X+Yp)]1/q\left[\text{E}\left(\vert X+Y \vert^{p}\right)\right]^{1/q},即得证。