概率论基础 - 9 - 中心极限定理

203 阅读3分钟

「这是我参与2022首次更文挑战的第10天,活动详情查看:2022首次更文挑战」。

中心极限定理(Central Limit Theorem,CTL),是指概率论中讨论随机变量序列部分和分布渐近于正态分布的一类定理。。

概述

定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。它是概率论中最重要的一类定理,有广泛的实际应用背景。在自然界与生产中,一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小时,总的影响可以看作是服从正态分布的。中心极限定理就是从数学上证明了这一现象。 ——百度百科

  • 中心极限定理(CLT)指出,如果样本量足够大,则变量均值的采样分布将近似于正态分布,而与该变量在总体中的分布无关。

独立同分布

  • 设随机变量X1,X2,,XnX_1, X_2,\dots,X_n独立同分布,且具有数学期望μ\mu和方差σ2\sigma^2,前nn个变量之和为{%raw%}S=i=1nXi\overline S = \sum\limits_{i = 1}^n {{X_i}} \\{%endraw%}
  • 那么Sn\overline S_n的期望和方差为nμn\munσ2n\sigma^2Sn\overline S_n的标准化变量为:
Yn=SnnμnσY_n=\frac{\overline S_n - n\mu}{\sqrt n\sigma}

定义

  • 中心极限定理的内容为:YnY_n的概率分布函数Fn(x)F_n(x)对于任意xx满足:

{%raw%}

limnFn(x)=limnP{Ynx}=limnP{k=1nXknμnσx}=x12πet2/2dt=Φ(x)\begin{array}{c} \lim _{n \rightarrow \infty} F_{n}(x)=\lim \limits_{n \rightarrow \infty} P\left\{Y_{n} \leq x\right\}=\lim \limits_{n \rightarrow \infty} P\left\{\frac{\sum_{k=1}^{n} X_{k}-n \mu}{\sqrt{n} \sigma} \leq x\right\} \\ =\int_{-\infty}^{x} \frac{1}{\sqrt{2 \pi}} e^{-t^{2} / 2} d t=\Phi(x) \end{array}

{%endraw%}

证明

通过观察某个分布的采样均值可以发现近似服从正态分布,我们的目标就是证明这个变量与正态分布的特征函数相同

  • 引入一些特征函数的结论
  • 正态分布的特征函数:

{%raw%}

φ(t)=et22{\varphi (t)}{ = {e^{ - \frac{{{t^2}}}{2}}}}

{%endraw%}

标准正态分布的特征函数

  • 随机变量XiX_i的特征函数用φx(t){\varphi_x (t)}表示
  • Sn\overline S_n的特征函数为:

{%raw%}

φSn(t)=[φx(t)]n{\varphi_{S_n} (t)}=[{\varphi_x (t)}]^n

{%endraw%}

独立变量和的特征函数

  • XiX_i均值X=1nSn\overline X=\frac{1}{n}\overline {S_n}的特征函数:

{%raw%}

φX(t)=φSn(tn)=[φx(tn)]n{\varphi_{\overline X} (t)}={\varphi_{S_n} (\frac{t}{n})}=[{\varphi_x (\frac{t}{n})}]^n

{%endraw%}

常数线性变换的特征函数

  • {%raw%}Yn=Snnμnσ=Xμσn=nσXnσμY_n=\frac{\overline S_n - n\mu}{\sqrt n\sigma}=\frac{\overline X - \mu}{\frac{\sigma}{\sqrt n}}=\frac{\sqrt n}{\sigma}\overline X - \frac{\sqrt n}{\sigma} \mu {%endraw%}的特征函数:

{%raw%}

φy(t)=ei(nσμ)tφxˉ(nσt)=ei(nσμ)t[φx(tσn)]n\varphi_{y}(t)=e^{i\left(-\frac{\sqrt{n}}{\sigma} \mu\right) t} \cdot \varphi_{\bar{x}}\left(\frac{\sqrt{n}}{\sigma} t\right)=e^{i\left(-\frac{\sqrt{n}}{\sigma} \mu\right) t} \cdot\left[\varphi_{x}\left(\frac{t}{\sigma \sqrt{n}}\right)\right]^{n}

{%endraw%}

思路1
  • 取对数:

{%raw%}

lnφy(t)=ln{ei(nσμ)t[φx(tσn)]n}=inσμt+nln[φx(tσn)]=iμtσn+ln[φx(tσn)]1n\begin{aligned} \ln \varphi_{y}(t)&=\ln \left\{e^{i\left(-\frac{\sqrt{n}}{\sigma} \mu\right) t} \cdot\left[\varphi_{x}\left(\frac{t}{\sigma \sqrt{n}}\right)\right]^{n}\right\}\\ &=-i \frac{\sqrt{n}}{\sigma} \mu t+n \ln \left[\varphi_{x}\left(\frac{t}{\sigma \sqrt{n}}\right)\right]\\ &=\frac{-i \mu \frac{t}{\sigma \sqrt{n}}+\ln \left[\varphi_{x}\left(\frac{t}{\sigma \sqrt{n}}\right)\right]}{\frac{1}{n}}\\ \end{aligned}

{%endraw%}

  • p=tσnp=\frac{t}{\sigma \sqrt{n}}, 当 nn \rightarrow \infty 时, p0 p \rightarrow 0 又 :

{%raw%}

φx(0)=f(x)dx=1φx(0)=ixf(x)dx=iμφx(0)=x2f(x)dx=E(X2)=μ2σ2\begin{aligned} &\varphi_{x}(0)=\int_{-\infty}^{\infty} f(x) d x=1\\ &\varphi_{x}^{\prime}(0)=\int_{-\infty}^{\infty} i x f(x) d x=i \mu\\ &\varphi_{x}^{\prime \prime}(0)=\int_{-\infty}^{\infty}-x^{2} f(x) d x=-E\left(X^{2}\right)=-\mu^{2}-\sigma^{2}\\ \end{aligned}

{%endraw%}

  • 有 :

{%raw%}

limnlnφy(t)=limniμtσn+ln[φx(tσn)]1n=t2σ2limp0iμp+ln[φx(p)]p2( 洛必达) =t2σ2limp0iμ+1φx(p)φx(p)2p( 洛必达 )=t2σ2limp0φx(p)φx(p)φx(p)φx(p)2[φx(p)]2=t2σ2φx(0)φx(0)φx(0)φx(0)2[φx(0)]2=t2σ2(μ2σ2)1iμiμ21=t22\begin{aligned} \lim _{n \rightarrow \infty} \ln \varphi_{y}(t)&=\lim _{n \rightarrow \infty} \frac{-i \mu \frac{t}{\sigma \sqrt{n}}+\ln \left[\varphi_{x}\left(\frac{t}{\sigma \sqrt{n}}\right)\right]}{\frac{1}{n}}\\ &=\frac{t^{2}}{\sigma^{2}} \lim _{p \rightarrow 0} \frac{-i \mu p+\ln \left[\varphi_{x}(p)\right]}{p^{2}} \quad(\text { 洛必达) }\\ &=\frac{t^{2}}{\sigma^{2}} \lim _{p \rightarrow 0} \frac{-i \mu+\frac{1}{\varphi_{x}(p)} \cdot \varphi_{x}^{\prime}(p)}{2 p} \quad(\text { 洛必达 })\\ &=\frac{t^{2}}{\sigma^{2}} \lim _{p \rightarrow 0} \frac{\varphi_{x}^{\prime \prime}(p) \cdot \varphi_{x}(p)-\varphi_{x}^{\prime}(p) \cdot \varphi_{x}^{\prime}(p)}{2\left[\varphi_{x}(p)\right]^{2}}\\ &=\frac{t^{2}}{\sigma^{2}} \cdot \frac{\varphi_{x}^{\prime \prime}(0) \cdot \varphi_{x}(0)-\varphi_{x}^{\prime}(0) \cdot \varphi_{x}^{\prime}(0)}{2\left[\varphi_{x}(0)\right]^{2}}\\ &=\frac{t^{2}}{\sigma^{2}} \cdot \frac{\left(-\mu^{2}-\sigma^{2}\right) \cdot 1-i \mu \cdot i \mu}{2 \cdot 1}\\ &=-\frac{t^{2}}{2} \end{aligned}

{%endraw%}

思路2

{%raw%}

Yn=nXˉμσn=i=1nηiσnηi=Xiμφ(t)=E(eitYn)=E(eitη1σneitη2σneitηnσn)=[ϕ(tσn)]n\begin{array}{l} Y_{n}=\frac{n \bar{X}-\mu}{\sigma \sqrt{n}}=\frac{\sum_{i=1}^{n} \eta_{i}}{\sigma \sqrt{n}} \\\quad \eta_{i}=X_{i}-\mu \\ \varphi(t)=E\left(e^{i t Y_{n}}\right)=E\left(e^{i t \frac{\eta_{1}}{\sigma \sqrt{n}}} \cdot e^{i t \frac{\eta_{2}}{\sigma \sqrt{n}}} \cdot \ldots \cdot e^{i t \frac{\eta_{n}}{\sigma \sqrt{n}}}\right)=\left[\phi\left(\frac{t}{\sigma \sqrt{n}}\right)\right]^{n} \end{array}

{%endraw%}

  • ϕ(t)\phi(t)ηi\eta_{i} 的特征函数
  • ϕ(tσn)\phi\left(\frac{t}{\sigma \sqrt{n}}\right) 在0点处的泰勒展开形式为:

{%raw%}

ϕ(tσn)=ϕ(0)+ϕ(0)tσn+ϕ(0)2!(tσn)2+o((tσn)2)=1+0t22n+o((tσn)2)\begin{aligned} \phi\left(\frac{t}{\sigma \sqrt{n}}\right)=\phi(0) &+\phi^{\prime}(0) \frac{t}{\sigma \sqrt{n}}+\frac{\phi^{\prime \prime}(0)}{2 !}\left(\frac{t}{\sigma \sqrt{n}}\right)^{2}+o\left(\left(\frac{t}{\sigma \sqrt{n}}\right)^{2}\right) \\ &=1+0-\frac{t^{2}}{2 n}+o\left(\left(\frac{t}{\sigma \sqrt{n}}\right)^{2}\right) \end{aligned}

{%endraw%}

  • 所以, φ(t)\varphi(t) 为:

{%raw%}

φ(t)=(1t22n+o((tσn)2))(2nt2)×(t22)=et22,n+\varphi(t)=\left(1-\frac{t^{2}}{2 n}+o\left(\left(\frac{t}{\sigma \sqrt{n}}\right)^{2}\right)\right)^{\left(-\frac{2 n}{t^{2}}\right) \times\left(-\frac{t^{2}}{2}\right)}=e^{-\frac{t^{2}}{2}}, n \rightarrow+\infty

{%endraw%}

都得出结论
  • 即有:

{%raw%}

limnφy(t)=et22\lim _{n \rightarrow \infty} \varphi_{y}(t)={e^{ - \frac{{{t^2}}}{2}}}

{%endraw%}

  • YnY_n特征函数与正态分布相同,故有当n n \rightarrow \infty时,YnY_n服从正态分布的结论

应用思路

  • 均值方差为μ\muσ2\sigma^2,的独立同分布的随机变量XiX_inn项之和Sn\overline S_n的标准变化量YnY_n,当nn充分大时,其分布近似于标准正态分布
  • 即在nn充分大时,Sn\overline S_n分布近似于N(nμ,nσ2)N(n\mu,n\sigma^2)
  • 一般情况下,很难求出nn个随机变量之和的分布函数。因此当nn充分大时,可以通过正态分布来做理论上的分析或者计算

独立不同分布

  • Liapunov 定理:设随机变量 X1,X2,,Xn,X_{1}, X_{2}, \cdots, X_{n}, \cdots 相互独立, 具有数学期望和方差:

    E[Xk]=μk,Var[Xk]=σk2\mathbb{E}\left[X_{k}\right]=\mu_{k}, \operatorname{Var}\left[X_{k}\right]=\sigma_{k}^{2}
  • 记: Bn2=k=1nσk2B_{n}^{2}=\sum_{k=1}^{n} \sigma_{k}^{2} 若存在正数 δ,\delta, 使得当 nn \rightarrow \infty 时,有:

    {%raw%}

    1Bn2+δk=1nE[Xkμk2+δ]0\frac{1}{B_{n}^{2+\delta}} \sum_{k=1}^{n} \mathbb{E}\left[\left|X_{k}-\mu_{k}\right|^{2+\delta}\right] \rightarrow 0

{%endraw%}

  • 则随机变量之和 SXn=k=1nXk\overline{S X_{n}}=\sum_{k=1}^{n} X_{k} 的标准变化量:

{%raw%}

Zn=SXnE[SXn]Var[SXn]=SXnk=1nμkBnZ_{n}=\frac{\overline{S X_{n}}-\mathbb{E}\left[\overline{S X_{n}}\right]}{\sqrt{\operatorname{Var}\left[\overline{S X_{n}}\right]}}=\frac{\overline{S X_{n}}-\sum_{k=1}^{n} \mu_{k}}{B_{n}}

{%endraw%}

  • 概率分布函数 Fn(x)F_{n}(x) 对于任意 xx 满足:

{%raw%}

limnFn(x)=limnP{Znx}=limnP{k=1nXkk=1nμkBnx}=x12πet2/2dt=Φ(x)\begin{array}{c} \lim _{n \rightarrow \infty} F_{n}(x)=\lim _{n \rightarrow \infty} P\left\{Z_{n} \leq x\right\}=\lim _{n \rightarrow \infty} P\left\{\frac{\sum_{k=1}^{n} X_{k}-\sum_{k=1}^{n} \mu_{k}}{B_{n}} \leq x\right\} \\ =\int_{-\infty}^{x} \frac{1}{\sqrt{2 \pi}} e^{-t^{2} / 2} d t=\Phi(x) \end{array}

{%endraw%}

  • 其物理意义为:

    相互独立的随机变量 X1,X2,,Xn,X_{1}, X_{2}, \cdots, X_{n}, \cdots 之和 SXn=k=1nXk\overline{S X_{n}}=\sum_{k=1}^{n} X_{k} 的衍生随机变量序列 Zn=SXnk=1nμkBn,Z_{n}=\frac{\overline{S X_{n}}-\sum_{k=1}^{n} \mu_{k}}{B_{n}},nn 充分大时, 其分布近似与标准正态分布。

  • 这里并不要求 X1,X2,,Xn,X_{1}, X_{2}, \cdots, X_{n}, \cdots 同分布。

棣莫佛-拉普拉斯定理

  • Demoiver-Laplace 定理:设随机变量序列 ηn,n=1,2,\eta_{n}, n=1,2, \ldots 服从参数为 (n,p)(n, p) 的二项分布,其中 0<p<10<p<1 则对于任意 xx, 有:

{%raw%}

limnP{ηnnpnp(1p)x}=x12πet22dt=Φ(x)\lim _{n \rightarrow \infty} P\left\{\frac{\eta_{n}-n p}{\sqrt{n p(1-p)}} \leq x\right\}=\int_{-\infty}^{x} \frac{1}{\sqrt{2 \pi}} e^{-t^{2} \mid 2} d t=\Phi(x)

{%endraw%}

  • 该定理表明, 正态分布是二项分布的极限分布。当 nn 充分大时,可以利用正态分布来计算二项分布的概率。

参考资料