【概率论基础进阶】随机变量的数字特征-随机变量的数学期望和方差

260 阅读3分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

数学期望

离散型随机变量的数学期望

设随机变量XX的概率分布为

P{X=xk}=pk,k=1,2, P \left\{X=x_{k}\right\}=p_{k},k=1,2,\cdots

如果级数k=1+xkpk\sum\limits_{k=1}^{+\infty}x_{k}p_{k}绝对收敛,则称为级数随机变量XX的数学期望或均值,记作E(X)E(X),即

E(X)=k=1+xkpk E(X)=\sum\limits_{k=1}^{+\infty}x_{k}p_{k}

 

连续型随机变量的数学期望

设随机变量XX的概率密度为f(x)f(x),如果积分+xf(x)dx\begin{aligned} \int_{-\infty}^{+\infty}xf(x)dx\end{aligned}绝对收敛,则称此积分为随机变量XX的数学期望或均值,记作E(X)E(X),即

E(X)=+xf(x)dx E(X)=\int_{-\infty}^{+\infty}xf(x)dx

 

例1:设随机变量XX的概率密度f(x)={xnn!exx>00x0f(x)=\left\{\begin{aligned}&\frac{x^{n}}{n!}e^{-x}&x>0\\&0&x \leq 0\end{aligned}\right.,求EXEX

 

+f(x)dx=0+xnn!exdx=10+xnexdx=n! \int_{-\infty}^{+\infty}f(x)dx=\int_{0}^{+\infty}\frac{x^{n}}{n!}e^{-x}dx=1 \Rightarrow \int_{0}^{+\infty}x^{n}e^{-x}dx=n!

 

其实在二维均匀分布和二维正态分布也证明过0+xnex=n!\begin{aligned} \int_{0}^{+\infty}x^{n}e^{-x}=n!\end{aligned}

 

EX=+xf(x)dx=0+xxnn!exdx=1n!0+xn+1exdx=(n+1)!n!=n+1 \begin{aligned} EX=\int_{-\infty}^{+\infty}xf(x)dx &=\int_{0}^{+\infty}x \cdot \frac{x^{n}}{n!}e^{-x}dx\\ &=\frac{1}{n!}\int_{0}^{+\infty}x^{n+1}e^{-x}dx\\ &=\frac{(n+1)!}{n!}=n+1 \end{aligned}

 

性质

  • CC是常数,则有E(C)CE(C) \equiv C

  • XX是随机变量,CC是常数,则有E(CX)=CE(X)E(CX)=CE(X)

  • XXYY是任意两个随机变量,则有E(X±Y)=E(X)±E(Y)E(X \pm Y)=E(X) \pm E(Y)

  • 设随机变量XXYY相互独立,则有E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)

 

 例1:设随机变量XX的密度为f(x)f(x),数学期望E(X)=0E(X)=0,说明0+x[f(x)f(x)]dx=0\begin{aligned} \int_{0}^{+\infty}x[f(x)-f(-x)]dx=0\end{aligned}

0+x[f(x)f(x)]dx=0+xf(x)dx++0xf(x)dx=0+xf(x)dx0+(x)f(x)d(x)=0 \begin{aligned} \int_{0}^{+\infty}x[f(x)-f(-x)]dx&=\int_{0}^{+\infty}xf(x)dx+\int_{+\infty}^{0}xf(-x)dx\\ &=\int_{0}^{+\infty}xf(x)dx-\int_{0}^{+\infty}(-x)f(-x)d(-x)\\ &=0 \end{aligned}

 

函数的期望

定理:

设随机变量XX的概率分布为

P{X=xk}=pk,k=1,2, P \left\{X=x_{k}\right\}=p_{k},k=1,2,\cdots

如果级数k=1+g(xk)pk\sum\limits_{k=1}^{+\infty}g(x_{k})p_{k}绝对收敛,则随机变量Y=g(X)Y=g(X)的数学期望为

E(Y)=E[g(X)]=k=1+g(xk)pk E(Y)=E[g(X)]=\sum\limits_{k=1}^{+\infty}g(x_{k})p_{k}

 

设随机变量XX的概率密度为f(x)f(x),如果积分+g(x)f(x)dx\begin{aligned} \int_{-\infty}^{+\infty}g(x)f(x)dx\end{aligned}绝对收敛,则随机变量Y=g(X)Y=g(X)的数学期望为

E(Y)=E[g(X)]=+g(x)f(x)dx E(Y)=E[g(X)]=\int_{-\infty}^{+\infty}g(x)f(x)dx

 

定理:

设随机变量(X,Y)(X,Y)的概率分布为

P{X=xi,Y=yi}=pij,i,j=1,2, P \left\{X=x_{i},Y=y_{i}\right\}=p_{ij},i,j=1,2,\cdots

如果级数i=1+i=1+g(xi,yj)pij\sum\limits_{i=1}^{+\infty}\sum\limits_{i=1}^{+\infty}g(x_{i},y_{j})p_{ij}绝对收敛,则随机变量Z=g(X,Y)Z=g(X,Y)的数学期望为

E(Z)=E[g(X,Y)]=i=1++g(x,y)f(x,y)dxdy E(Z)=E[g(X,Y)]=\sum\limits_{i=1}^{+\infty}\sum\limits_{-\infty}^{+\infty}g(x,y)f(x,y)dxdy

 

设随机变量(X,Y)(X,Y)的概率密度为f(x,y)f(x,y),如果积分++g(x,y)f(x,y)dxdy\begin{aligned} \int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}g(x,y)f(x,y)dxdy\end{aligned}绝对收敛,则随机变量Z=g(X,Y)Z=g(X,Y)的数学期望为

E(Z)=E[g(X,Y)]=++g(x,y)f(x,y)dxdy E(Z)=E[g(X,Y)]=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}g(x,y)f(x,y)dxdy

 

一般做题用以下两个方法计算

FZ(z)=P{Zz}=P{g(X,Y)z}=g(x,y)zf(x,y)dxdyE(Z)=E(g(X,Y))=++g(x,y)f(x,y)dxdy\begin{aligned}F_{Z}(z)&=P \left\{Z \leq z\right\}=P \left\{g(X,Y) \leq z\right\}=\iint\limits_{g(x,y)\leq z}f(x,y)dxdy\\E(Z)&=E(g(X,Y))=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}g(x,y)f(x,y)dxdy\end{aligned}

其中也可根据FZ(z)F_{Z}(z)得到fZ(z)f_{Z}(z)然后用

E(Z)=+zfZ(z)dzE(Z)=\int_{-\infty}^{+\infty}zf_{Z}(z)dz

得到E(Z)E(Z)

 

简单来说,期望的计算就是,取的值×对应的概率取的值\times对应的概率

 

例2:设随机变量XX服从P(λ)P(\lambda),则随机变量Y=11+XY= \frac{1}{1+X}的数学期望EY=()EY=()

 

XX服从泊松分布P(λ)P(\lambda)P{X=k}=λkk!eλ,k=0,1,2,P \left\{X=k\right\}=\frac{\lambda^{k}}{k!}e^{-\lambda},k=0,1,2,\cdots,因此

E(Y)=E(11+X)=k=0+11+kλkk!eλ=1λi=1+λii!eλ=1λ(i=0+λii!eλ)=1λ(1eλ) \begin{aligned} E(Y)=E(\frac{1}{1+X})&=\sum\limits_{k=0}^{+\infty} \frac{1}{1+k}\cdot \frac{\lambda^{k}}{k!}e^{-\lambda}\\ &=\frac{1}{\lambda}\sum\limits_{i=1}^{+\infty} \frac{\lambda^{i}}{i!}e^{-\lambda}\\ &=\frac{1}{\lambda}\left(\sum\limits_{i=0}^{+\infty} \frac{\lambda^{i}}{i!}-e^{-\lambda}\right)\\ &=\frac{1}{\lambda}(1-e^{-\lambda}) \end{aligned}

 

例3:设随机变量XX服从标准正态分布N(0,1)N(0,1),则E(e2X)=()E(e^{2X})=()

 

E(e2X)=+e2x12πex22dx=e2+12πex24x+42dx=e2+12πe(x2)22dx \begin{aligned} E(e^{2X})&=\int_{-\infty}^{+\infty}e^{2x}\cdot \frac{1}{\sqrt{2\pi}}e^{\frac{-x^{2}}{2}}dx\\ &=e^{2}\int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}}e^{\frac{-x^{2}-4x+4}{2}}dx\\ &=e^{2}\int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}}e^{- \frac{(x-2)^{2}}{2}}dx \end{aligned}

 

这里+12πe(x2)22dx\begin{aligned} \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}}e^{- \frac{(x-2)^{2}}{2}}dx\end{aligned}可以直接求积(用0+ex2dx=π2\begin{aligned} \int_{0}^{+\infty}e^{-x^{2}}dx= \frac{\sqrt{\pi}}{2}\end{aligned},也可以看成正态分布N(2,1)N(2,1)的密度函数积分等于11而不必直接求积分,所以答案为e2e^{2}

 

例4:某商店销售节日商品每公斤可获利88元,节后每公斤亏损22元,节日商品销售量XX[100,200][100,200]上均匀分布的随机变量,问节前应进多少公斤这种商品才可以使商店的利润期望值最大

 

设进货量为yy公斤,利润为ZZ元,显然,利润与XXyy有关系

如果yXy \leq X,则Z=8yZ=8y

如果y>Xy>X,则Z=8X2(yX)=10X2yZ=8X-2(y-X)=10X-2y

Z={8yXy10X2yX<y,其中100y200,XU[100,200] Z=\left\{\begin{aligned}&8y&X \leq y\\&10X-2y&X<y\end{aligned}\right.,其中100 \leq y \leq 200,X \sim U[100,200]

因此

E(Z)=100y(10x2y)1100dx+y2008y1100dx=1100(5y2+1800y50000) \begin{aligned} E(Z)&=\int_{100}^{y}(10x-2y) \frac{1}{100}dx+\int_{y}^{200} 8y \frac{1}{100}dx\\ &=\frac{1}{100}(-5y^{2}+1800y-50000) \end{aligned}

又有

dE(Z)dy=1100(10y+1800)=0 \begin{aligned} \frac{dE(Z)}{dy}=\frac{1}{100}(-10y+1800)=0\end{aligned}

解得y=180y=180

 

方差

定义:设XX是随机变量,如果数学期望E{[XE(X)]2}E \left\{[X-E(X)]^{2}\right\}存在,则称之为XX的方差,记作D(X)D(X),即

D(X)=E{[XE(X)]2} D(X)=E \left\{[X-E(X)]^{2}\right\}

D(X)\sqrt{D(X)}为随机变量XX的标准差或均方差,记作σ(X)\sigma(X),即σ(X)=D(X)\sigma(X)=\sqrt{D(X)}

 

性质

  • CC是常数,则D(C)=0D(C)=0,反之,从D(X)=0D(X)=0不能得出XX为常数的结论

  • XX是随机变量,aabb是常数,则有

         D(aX+b)=a2D(X)D(aX+b)=a^{2}D(X)

  • 设随机变量XXYY相互独立,则有

         D(X±Y)=D(X)+D(Y)D(X \pm Y)=D(X)+D(Y)

 

要求XXYY相互独立,可以减弱为XXYY不相关就有D(X±Y)=D(X)+D(Y)D(X \pm Y)=D(X)+D(Y)。事实上D(X±Y)=D(X)+D(Y)D(X \pm Y)=D(X)+D(Y)城里的充要条件是XXYY不相关

独立:有两随机事件 A、B 。 A、B 发生的概率分别为 P(A) 和 P(B) , AB 事件同时发生的概率为 P(AB) 若 P(A)×P(B)=P(AB) ,则 A 与 B 相互独立。事件 A 发生的概率不影响事件 B 发生的概率,反应的是概率运算上的关系。

不相关:不相关是指两个变量的相关系数为0,两个变量之间没有线性关系的。

1.不相关是指的两个变量之间没有线性关系,并不一定没有其他关系。而独立指的是两个随机变量之间什么关系都没有。so,独立一定不相关,不相关不一定独立。

2.特别的,当随机变量x,y是服从于二维正态分布时,不相关和独立等价

作者:啊,都是鬼

链接:概率论中的独立和不相关的区别_啊,都是鬼的博客-CSDN博客_不相关和独立的区别

 

随机变量XX的方差计算公式

D(X)=E{[XE(X)]2}=E(X2)[E(X)]2 D(X)=E \left\{[X-E(X)]^{2}\right\}=E(X^{2})-[E(X)]^{2}

证明:

D(X)=E{[XE(X)]2}=E{X22XE(X)+[E(X)]2}=E(X2)2E(X)E(X)+[E(X)]2=E(X2)[E(X)]2 \begin{aligned} D(X)&=E \left\{[X-E(X)]^{2}\right\}\\ &=E \left\{X^{2}-2XE(X)+[E(X)]^{2}\right\}\\ &=E(X^{2})-2E(X)E(X)+[E(X)]^{2}\\ &=E(X^{2})-[E(X)]^{2} \end{aligned}

由于对任何随机变量XXD(X)0D(X)\geq 0,故恒有

E(X2)[E(X)]2 E(X^{2})\geq [E(X)]^{2}

有时在已知XX的数学期望与方差时,还用此公式求E(X2)E(X^{2})

 

常用随机变量的数学期望和方差

010-1分布:E(X)=p,D(X)=p(1p)E(X)=p,D(X)=p(1-p)

二项分布,XB(n,p)X \sim B(n,p)E(X)=np,D(X)=np(1p)E(X)=np,D(X)=np(1-p)

泊松分布,XP(λ)X \sim P(\lambda)E(X)=λ,D(X)=λE(X)=\lambda,D(X)=\lambda

几何分布,P{X=k}=p(1p)k1,k=1,2,,0<p<1P \left\{X=k\right\}=p(1-p)^{k-1},k=1,2,\cdots ,0<p<1E(X)=1p,D(X)=1pp2\begin{aligned} E(X)=\frac{1}{p},D(X)=\frac{1-p}{p^{2}}\end{aligned}

均匀分布,XU(a,b)X \sim U(a,b)E(X)=a+b2,D(X)=(ba)212\begin{aligned} E(X)= \frac{a+b}{2},D(X)= \frac{(b-a)^{2}}{12}\end{aligned}

指数分布,XE(λ)X \sim E(\lambda)E(X)=1λ,D(X)=1λ2\begin{aligned} E(X)= \frac{1}{\lambda},D(X)=\frac{1}{\lambda^{2}}\end{aligned}

正态分布,XN(μ,σ2)X \sim N(\mu,\sigma^{2})E(X)=μ,D(X)=σ2E(X)=\mu,D(X)=\sigma^{2}