【概率论基础进阶】随机变量及其分布-常用分布

1,490 阅读3分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

一、010-1分布

定义:如果随机变量XX有分布律

 

XX00  11
PP1p1-ppp   

0<p<10<p<1,则称XX服从参数为pp010-1分布,或称XX具有010-1分布

 

二、二项分布

定义:如果随机变量XX有分布律

P{X=k}=Cnkpkqnk,k=0,1,2,,n P \left\{X=k\right\}=C_{n}^{k}p^{k}q^{n-k},k=0,1,2,\cdots ,n

其中0<p<1,q=1p0<p<1,q=1-p,则称XX服从参数为n,pn,p的二项分布,记作XB(n,p)X \sim B(n,p)

 

nn重伯努利试验中,若每次实验成功率为p(0<p<1)p(0<p<1),则在nn次独立重复试验中成功的总次数XX服从二项分布

 

n=1n=1时,不难验证二项分布就退化成010-1分布。所以010-1分布也可以记为B(1,p)B(1,p)

 

三、几何分布

定义:如果随机变量XX有分布律

P{X=k}=pqk1,k=1,2, P \left\{X=k\right\}=pq^{k-1},k=1,2,\cdots

其中0<p<1,q=1p0<p<1,q=1-p,则称XX服从参数为pp的几何分布,或称XX具有几何分布

 

在独立地重复做一系列伯努利试验中,若每次试验成功率为p(0<p<1)p(0<p<1),则在第kk次试验时才首次试验成功的概率服从几何分布

 

四、超几何分布

定义:如果随机变量XX有分布律

P{X=k}=CMkCNMnkCNn,k=l1,,l2 P \left\{X=k\right\}= \frac{C_{M}^{k}C_{N-M}^{n-k}}{C_{N}^{n}},k=l_{1},\cdots ,l_{2}

其中l1=max(0,nN+M),l2=min(M,n)l_{1}=\max(0,n-N+M),l_{2}=\min(M,n)。则称随机变量XX服从参数为n,N,Mn,N,M的超几何分布

 

如果NN件产品中含有MM件次品,从中任意一次取出nn件(或从中一件接一件不放回地取出nn件),令X=抽取的n件产品中的次品件数X=抽取的n件产品中的次品件数,则XX服从参数为n,N,Mn,N,M的超几何分布

 

如果NN件产品中含有MM件次品,从中一件接一件有放回的取nn次(即每次取出记录后就放回,再取下一个),则XX服从B(n,MN)B(n, \frac{M}{N})

 

五、泊松分布

如果随机变量XX的分布律为

P{X=k}=λkk!eλ,k=0,1,2,, P \left\{X=k\right\}=\frac{\lambda^{k}}{k!}e^{-\lambda},k=0,1,2,,\cdots

其中λ>0\lambda>0为常数,则称随机变量XX服从参数为λ\lambda的泊松分布,记作XP(λ)X \sim P(\lambda)

 

对于泊松分布有

k=0+P{X=k}=k=0+λkk!eλ=1k=0+λkk!=eλ如果把λ看做xk=0+xkk!=ex \begin{aligned} \sum\limits_{k=0}^{+\infty}P \left\{X=k\right\}=\sum\limits_{k=0}^{+\infty}\frac{\lambda^{k}}{k!}e^{-\lambda}&=1 \\ \sum\limits_{k=0}^{+\infty}\frac{\lambda^{k}}{k!}&=e^{\lambda}\quad如果把\lambda看做x\\ \sum\limits_{k=0}^{+\infty}\frac{x^{k}}{k!}&=e^{x} \end{aligned}

即为exe^{x}的幂级数展开

 

例1:设一文本各页的印刷错误XX服从泊松分布。已知有一个和两个印刷错误的页数相同,则随意抽查的44页中无印刷错误的概率p=()p=()

 

注意理解题意!

 

P{X=1}=P{X=2}λ1!eλ=λ22!eλ \begin{aligned} P \left\{X=1\right\}&=P \left\{X=2\right\}\\ \frac{\lambda}{1!}e^{-\lambda}&=\frac{\lambda^{2}}{2!}e^{-\lambda} \end{aligned}

解得λ=2\lambda=2,则某也没有印刷错误的概率为P{X=0}=e2P \left\{X=0\right\}= e^{-2}。可以理解各页印刷错误相互独立

p=(e2)4=e8 p=(e^{-2})^{4}=e^{-8}

 

不独立就不能往下算了

 

六、均匀分布

定义:如果连续型随机变量XX的概率密度为

f(x)={1baaxb0其他 f(x)=\left\{\begin{aligned}& \frac{1}{b-a}&a \leq x \leq b\\&0&其他\end{aligned}\right.

则称XX在区间[a,b][a,b]上服从均匀分布,记作XU[a,b]X \sim U[a,b]

 

如果概率密度为

f(x)={1baa<x<b0其他 f(x)=\left\{\begin{aligned}& \frac{1}{b-a}&a < x < b\\&0&其他\end{aligned}\right.

则称XX在区间(a,b)(a,b)上服从均匀分布,记作XU(a,b)X \sim U(a,b)

 

无论XU[a,b]X\sim U[a,b]XU(a,b)X\sim U(a,b),它们的分布函数均为

F(x)={0,x<axabaax<b1bx F(x)=\left\{\begin{aligned}&0,&x<a\\& \frac{x-a}{b-a}&a \leq x<b\\&1&b \leq x\end{aligned}\right.

 

性质

XU[a,b]X \sim U[a,b],则对ac<dba \leq c <d \leq b

P{cXd}=dcba P \left\{c \leq X \leq d\right\}=\frac{d-c}{b-a}

即随机变量XX落入区间[c,d][c,d]的概率等于该区间长度与[a,b][a,b]长度之比

 

七、指数分布

定义:如果连续型随机变量XX的概率密度为

f(x)={λeλxx>00x0,λ>0 f(x)=\left\{\begin{aligned}&\lambda e^{-\lambda x}&x>0\\&0&x \leq 0\end{aligned}\right.,\lambda>0

则称XX服从参数为λ\lambda的指数分布,记作XE(λ)X \sim E(\lambda)

 

XE(λ)X \sim E(\lambda),则XX的分布函数为

F(x)={1eλxx>00x0,λ>0 F(x)=\left\{\begin{aligned}&1- e^{-\lambda x}&x>0\\&0&x \leq 0\end{aligned}\right.,\lambda>0

 

性质

XE(λ)X\sim E(\lambda),则有

  • P{X>t}=t+λeλtdt=eλt,t>0P \left\{X>t\right\}=\int_{t}^{+\infty}\lambda e^{-\lambda t}dt=e^{-\lambda t},t>0

  • P{X>t+sX>s}=P{X>t+s}P{X>s}=eλ(t+s)eλs=eλt=P{X>t},t,s>0P \left\{X>t+s|X>s\right\}=\frac{P \left\{X>t+s\right\}}{P \left\{X>s\right\}}=\frac{e^{-\lambda(t+s)}}{e^{-\lambda s}}=e^{-\lambda t}=P \left\{X>t\right\},t,s>0

         此性质称为指数分布具有无记忆性

 

八、正态分布

定义:如果随机变量XX的概率密度为

f(x)=12πσe(xμ)22σ2,<x<+ f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu )^{2}}{2\sigma^{2}}},-\infty<x<+\infty

其中μ,σ\mu ,\sigma为常数且σ>0\sigma>0,则称XX服从参数为μ,σ\mu ,\sigma的正态分布,记作XN(μ,σ2)X \sim N(\mu ,\sigma^{2})

μ=0,σ2=1\mu =0,\sigma^{2}=1时,即XN(0,1)X \sim N(0,1),称XX服从标准正态分布,此时用ϕ(x)\phi (x)表示XX的概率密度,即

ϕ(x)=12πex22,<x<+ \phi (x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^{2}}{2}},-\infty<x<+\infty

 

标准化XN(μ,σ2)X \sim N(\mu ,\sigma^{2}),则xμσN(0,1)\frac{x-\mu }{\sigma}\sim N(0,1)

 

XN(μ,σ2)X \sim N(\mu ,\sigma^{2}),其分布函数为

F(x)=12πσxe(tμ)22σ2dt F(x)=\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{x}e^{- \frac{(t-\mu )^{2}}{2\sigma^{2}}}dt

XN(0,1)X \sim N(0,1)时,分布函数用Φ(x)\Phi (x)表示

Φ(x)=12πxet22dt \Phi (x)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{x}e^{-\frac{t^{2}}{2}}dt

 

性质

XN(μ,σ2)X \sim N(\mu ,\sigma^{2}),其分布函数为F(x)F(x),则

  • F(x)=P{Xx}=P{Xμσxμσ}=Φ(xμσ)\begin{aligned} F(x)=P \left\{X \leq x\right\}=P \left\{\frac{X-\mu }{\sigma}\leq \frac{x-\mu }{\sigma}\right\}=\Phi (\frac{x-\mu }{\sigma})\end{aligned}

  • P{a<Xb}=Φ(bμσ)Φ(aμσ),a<b\begin{aligned} P \left\{a<X \leq b\right\}=\Phi \left(\frac{b-\mu }{\sigma}\right)- \Phi \left(\frac{a-\mu }{\sigma}\right),a<b\end{aligned}

  • 概率密度f(x)f(x)关于x=μx=\mu对称,ϕ(x)\phi (x)是偶函数

  • Φ(x)=1Φ(x)\Phi (-x)=1-\Phi (x),也就有Φ(0)=12\Phi (0)=\frac{1}{2}

  • XN(0,1)X \sim N(0,1)a>0a>0时,P{Xa}=2Φ(a)1\begin{aligned} P \left\{|X| \leq a\right\}=2 \Phi (a)-1\end{aligned}

 

例2:设随机变量X1N(μ1,σ12),X2N(μ2,σ22)X_{1}\sim N(\mu_{1},\sigma^{2}_{1}),X_{2}\sim N(\mu_{2},\sigma_{2}^{2}),且P{X1μ1<1}>P{X2μ2<1}P \left\{|X_{1}-\mu_{1}|<1\right\}>P \left\{|X_{2}-\mu_{2}|<1\right\},证明σ1<σ2\sigma_{1}<\sigma_{2}

 

一维正态题做题步骤:查表,标准化,对称性,定参数或系数

 

P{X1μ1<1}=P{X1μ1σ11σ1}=2Φ(1σ1)1P{X2μ2<1}=2Φ(1σ2)1 \begin{aligned} P \left\{|X_{1}-\mu_{1}|<1\right\}&=P \left\{\left|\frac{X_{1}-\mu_{1}}{\sigma_{1}}\right|\leq \frac{1}{\sigma_{1}}\right\}=2\Phi \left(\frac{1}{\sigma_{1}}\right)-1\\ P \left\{|X_{2}-\mu_{2}|<1\right\}&=2\Phi \left(\frac{1}{\sigma_{2}}\right)-1 \end{aligned}

由题意,有

2Φ(1σ1)1>2Φ(1σ2)11σ1>1σ2σ1<σ2 \begin{aligned} 2\Phi \left(\frac{1}{\sigma_{1}}\right)-1&>2\Phi \left(\frac{1}{\sigma_{2}}\right)-1\\ \frac{1}{\sigma_{1}}&>\frac{1}{\sigma_{2}}\\ \sigma_{1}&<\sigma_{2} \end{aligned}