「这是我参与2022首次更文挑战的第10天,活动详情查看:2022首次更文挑战」。
中心极限定理(Central Limit Theorem,CTL),是指概率论中讨论随机变量序列部分和分布渐近于正态分布的一类定理。。
概述
定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。它是概率论中最重要的一类定理,有广泛的实际应用背景。在自然界与生产中,一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小时,总的影响可以看作是服从正态分布的。中心极限定理就是从数学上证明了这一现象。 ——百度百科
- 中心极限定理(CLT)指出,如果样本量足够大,则变量均值的采样分布将近似于正态分布,而与该变量在总体中的分布无关。
独立同分布
- 设随机变量X1,X2,…,Xn独立同分布,且具有数学期望μ和方差σ2,前n个变量之和为{%raw%}S=i=1∑nXi{%endraw%}
- 那么Sn的期望和方差为nμ和nσ2,Sn的标准化变量为:
Yn=nσSn−nμ
定义
- 中心极限定理的内容为:Yn的概率分布函数Fn(x)对于任意x满足:
{%raw%}
limn→∞Fn(x)=n→∞limP{Yn≤x}=n→∞limP{nσ∑k=1nXk−nμ≤x}=∫−∞x2π1e−t2/2dt=Φ(x)
{%endraw%}
证明
通过观察某个分布的采样均值可以发现近似服从正态分布,我们的目标就是证明这个变量与正态分布的特征函数相同
{%raw%}
φ(t)=e−2t2
{%endraw%}
标准正态分布的特征函数
- 随机变量Xi的特征函数用φx(t)表示
- Sn的特征函数为:
{%raw%}
φSn(t)=[φx(t)]n
{%endraw%}
独立变量和的特征函数
- Xi均值X=n1Sn的特征函数:
{%raw%}
φX(t)=φSn(nt)=[φx(nt)]n
{%endraw%}
常数线性变换的特征函数
- {%raw%}Yn=nσSn−nμ=nσX−μ=σnX−σnμ {%endraw%}的特征函数:
{%raw%}
φy(t)=ei(−σnμ)t⋅φxˉ(σnt)=ei(−σnμ)t⋅[φx(σnt)]n
{%endraw%}
思路1
{%raw%}
lnφy(t)=ln{ei(−σnμ)t⋅[φx(σnt)]n}=−iσnμt+nln[φx(σnt)]=n1−iμσnt+ln[φx(σnt)]
{%endraw%}
- 令p=σnt, 当 n→∞ 时, p→0 又 :
{%raw%}
φx(0)=∫−∞∞f(x)dx=1φx′(0)=∫−∞∞ixf(x)dx=iμφx′′(0)=∫−∞∞−x2f(x)dx=−E(X2)=−μ2−σ2
{%endraw%}
{%raw%}
n→∞limlnφy(t)=n→∞limn1−iμσnt+ln[φx(σnt)]=σ2t2p→0limp2−iμp+ln[φx(p)]( 洛必达) =σ2t2p→0lim2p−iμ+φx(p)1⋅φx′(p)( 洛必达 )=σ2t2p→0lim2[φx(p)]2φx′′(p)⋅φx(p)−φx′(p)⋅φx′(p)=σ2t2⋅2[φx(0)]2φx′′(0)⋅φx(0)−φx′(0)⋅φx′(0)=σ2t2⋅2⋅1(−μ2−σ2)⋅1−iμ⋅iμ=−2t2
{%endraw%}
思路2
{%raw%}
Yn=σnnXˉ−μ=σn∑i=1nηiηi=Xi−μφ(t)=E(eitYn)=E(eitσnη1⋅eitσnη2⋅…⋅eitσnηn)=[ϕ(σnt)]n
{%endraw%}
- ϕ(t) 为 ηi 的特征函数
- ϕ(σnt) 在0点处的泰勒展开形式为:
{%raw%}
ϕ(σnt)=ϕ(0)+ϕ′(0)σnt+2!ϕ′′(0)(σnt)2+o((σnt)2)=1+0−2nt2+o((σnt)2)
{%endraw%}
- 所以, φ(t) 为:
{%raw%}
φ(t)=(1−2nt2+o((σnt)2))(−t22n)×(−2t2)=e−2t2,n→+∞
{%endraw%}
都得出结论
{%raw%}
n→∞limφy(t)=e−2t2
{%endraw%}
- Yn特征函数与正态分布相同,故有当n→∞时,Yn服从正态分布的结论
应用思路
- 均值方差为μ和σ2,的独立同分布的随机变量Xi前n项之和Sn的标准变化量Yn,当n充分大时,其分布近似于标准正态分布
- 即在n充分大时,Sn分布近似于N(nμ,nσ2)
- 一般情况下,很难求出n个随机变量之和的分布函数。因此当n充分大时,可以通过正态分布来做理论上的分析或者计算
独立不同分布
-
Liapunov 定理:设随机变量 X1,X2,⋯,Xn,⋯ 相互独立, 具有数学期望和方差:
E[Xk]=μk,Var[Xk]=σk2
-
记: Bn2=∑k=1nσk2 若存在正数 δ, 使得当 n→∞ 时,有:
{%raw%}
Bn2+δ1k=1∑nE[∣Xk−μk∣2+δ]→0
{%endraw%}
- 则随机变量之和 SXn=∑k=1nXk 的标准变化量:
{%raw%}
Zn=Var[SXn]SXn−E[SXn]=BnSXn−∑k=1nμk
{%endraw%}
- 概率分布函数 Fn(x) 对于任意 x 满足:
{%raw%}
limn→∞Fn(x)=limn→∞P{Zn≤x}=limn→∞P{Bn∑k=1nXk−∑k=1nμk≤x}=∫−∞x2π1e−t2/2dt=Φ(x)
{%endraw%}
-
其物理意义为:
相互独立的随机变量 X1,X2,⋯,Xn,⋯ 之和 SXn=∑k=1nXk 的衍生随机变量序列 Zn=BnSXn−∑k=1nμk, 当 n 充分大时, 其分布近似与标准正态分布。
-
这里并不要求 X1,X2,⋯,Xn,⋯ 同分布。
棣莫佛-拉普拉斯定理
Demoiver-Laplace 定理:设随机变量序列 ηn,n=1,2,… 服从参数为 (n,p) 的二项分布,其中 0<p<1 则对于任意 x, 有:
{%raw%}
n→∞limP{np(1−p)ηn−np≤x}=∫−∞x2π1e−t2∣2dt=Φ(x)
{%endraw%}
- 该定理表明, 正态分布是二项分布的极限分布。当 n 充分大时,可以利用正态分布来计算二项分布的概率。
参考资料