【概率论基础进阶】多维随机变量及其分布-二维随机变量及其分布

189 阅读3分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

一、二维随机变量

定义:设X=X(ω),Y=Y(ω)X=X( \omega),Y=Y(\omega)是定义在样本空间Ω\Omega上的两个随机变量,则称向量(X,Y)(X,Y)为二维随机变量,或随机变量

 

定义:设二维随机变量(X,Y)(X,Y),对任意实数x,yx,y,二元函数

F(x,y)=P{Xx,Yy},<x,y<+ F(x,y)=P \left\{X \leq x,Y \leq y\right\},-\infty<x,y<+\infty

称为二维随机变量(X,Y)(X,Y)的分布函数,或称随机变量XXYY的联合分布函数

 

分布函数F(x,y)F(x,y)的性质

  • 对任意x,yx,y,均有0F(x,y)10\leq F(x,y)\leq 1

  • F(,y)=F(x,)=F(,)=0,F(+,+)=1F(-\infty,y)=F(x,-\infty)=F(-\infty,-\infty)=0,F(+\infty,+\infty)=1

  • F(x,y)F(x,y)关于xx和关于yy均单调不减

  • F(x,y)F(x,y)关于xx和关于yy是右连续的

  • P{a<Xb,c<Yd}=F(b,d)+F(a,c)F(b,c)F(a,d)P \left\{a<X \leq b,c<Y \leq d\right\}=F(b,d)+F(a,c)-F(b,c)-F(a,d)

 

二维随机变量(X,Y)(X,Y)的分布函数为F(x,y)F(x,y),分别称FX(x)=P{Xx}F_{X}(x)=P \left\{X \leq x\right\}FY(y)=P{Yy}F_{Y}(y)=P \left\{Y \leq y\right\}(X,Y)(X,Y)关于XX和关于YY的边缘分布

显然,边缘分布FX(x)F_{X}(x)FY(y)F_{Y}(y)与二维随机变量F(x,y)F(x,y)有如下关系:

  • FX(x)=P{Xx}=P{Xx,y<+}=F(x,+)F_{X}(x)=P \left\{X \leq x\right\}=P \left\{X \leq x,y<+\infty\right\}=F(x,+\infty)

  • FY(y)=P{Yy}=P{X<+,Yy}=F(+,y)F_{Y}(y)=P \left\{Y \leq y\right\}=P \left\{X < +\infty,Y \leq y\right\}=F(+\infty,y)

 

这里F(x,+)F(x,+\infty)应理解为limy+F(x,y)\lim\limits_{y \to +\infty}F(x,y)

 

定义:如果对于任意给定的ξ>0,P{yξ<Yy+ξ}>0\xi >0,P \left\{y-\xi <Y \leq y+\xi \right\}>0

limξ0+P{Xxyξ<Yy+ξ}=limξ 0+P{Xx,yξ<Yy+ξ}P{yξ<Yy+ξ} \lim\limits_{\xi \to 0^{+}}P \left\{X \leq x|y-\xi <Y \leq y+\xi \right\}=\lim\limits_{\xi  \to 0^{+}}\frac{P \left\{X \leq x,y-\xi <Y \leq y+\xi \right\}}{P \left\{y-\xi <Y \leq y+\xi \right\}}

存在,则称此极限为在条件Y=yY=yXX的条件分布,记作FXY(xy)F_{X|Y}(x|y)P{XxY=y}P \left\{X \leq x|Y=y\right\}

类似地可以定义FYX(yx)F_{Y|X}(y|x)

 

二、二维离散型随机变量

定义:如果随机变量(X,Y)(X,Y)可能取值为有限个或可数无穷个(xi,yi),(i,j=1,2,)(x_{i},y_{i}),(i,j=1,2,\cdots )则称(X,Y)(X,Y)为二维离散型随机变量

 

定义:二维离散型随机变量(X,Y)(X,Y)的可能取值为(xi,yi),(i,j=1,2,)(x_{i},y_{i}),(i,j=1,2,\cdots )

P{X=xi,Y=yi}=pij,i,i=1,2, P \left\{X=x_{i},Y=y_{i}\right\}=p_{ij},i,i=1,2,\cdots

为二维离散型随机变量(X,Y)(X,Y)的概率分布或分布律

也可以用表格表示分布律

 

分布律pijp_{ij}的性质

  • pij0,i,j=1,2,p_{ij}\geq 0,i,j=1,2,\cdots

  • ijpij=1\sum\limits_{i}^{}\sum\limits_{j}^{}p_{ij}=1

 

定义:pi=P{X=xi},i=1,2,p_{i \cdot }=P \left\{X=x_{i}\right\},i=1,2,\cdotspy=P{Y=yj},j=1,2,p_{\cdot y}=P \left\{Y=y_{j}\right\},j=1,2,\cdots分别被称为(X,Y)(X,Y)关于XX和关于YY的边缘分布

显然,边缘分布pip_{i \cdot }pjp_{\cdot j}与二维概率分布pijp_{ij}有如下关系

pi=P{X=xi}=j=1+P{X=xi,Y=yj}=j=1+pij,i=1,2,pj=P{Y=yj}=i=1+P{X=xi,Y=yj}=i=1+pij,j=1,2, \begin{aligned} p_{i \cdot }&=P \left\{X=x_{i}\right\}=\sum\limits_{j=1}^{+\infty}P \left\{X=x_{i},Y=y_{j}\right\}=\sum\limits_{j=1}^{+\infty }p_{ij},i=1,2,\cdots \\ p_{\cdot j}&=P \left\{Y=y_{j}\right\}=\sum\limits_{i=1}^{+\infty}P \left\{X=x_{i},Y=y_{j}\right\}=\sum\limits_{i=1}^{+\infty}p_{ij},j=1,2,\cdots \end{aligned}

 

定义:对给定的jj,如果P{Y=yj}>0,j=1,2,P \left\{Y=y_{j}\right\}>0,j=1,2,\cdots,则称

P{X=xiY=yj}=P{Xi,Y=yj}P{Y=yj}=pijpj P \left\{X=x_{i}|Y=y_{j}\right\}=\frac{P \left\{X_{i},Y=y_{j}\right\}}{P \left\{Y=y_{j}\right\}}=\frac{p_{ij}}{p_{\cdot j}}

Y=yjY=y_{j}条件下随机变量XX的条件分布

 

例1:袋中有11个红球,22个黑球,33个白球,现有放回地从袋中取两次,每次取一个球,以XXYY分别表示两次取球所得红球和黑球个数,试求

  • 二维随机变量(X,Y)(X,Y)的概率分布

  • (X,Y)(X,Y)的边缘分布

  • X=1X=1条件下YY的条件分布

 

概率分布显然可以用古典概型计算,这里省略步骤

 

   XX\ YY         00            11           22     pip_{i \cdot } 
      00     14\frac{1}{4} 13\frac{1}{3}19\frac{1}{9}2536\frac{25}{36}
      11     16\frac{1}{6} 19\frac{1}{9}      00     518\frac{5}{18} 
      22     136\frac{1}{36}      00           00     136\frac{1}{36} 
pjp_{\cdot j}49\frac{4}{9} 49\frac{4}{9}19\frac{1}{9}                              

 

因此边缘分布为

 

      XX             00            11            22      
pip_{i \cdot }2536\frac{25}{36}518\frac{5}{18}136\frac{1}{36}

 

      YY           00           11           22     
pjp_{\cdot j}49\frac{4}{9}49\frac{4}{9}19\frac{1}{9}

 

P{Y=iX=1}=P{X=1,Y=i}P{X=1}i=0,1,2P{X=1}=518P{Y=0X=1}=16518=35P{Y=1X=1}=19518=25P{Y=2X=1}=0518=0 \begin{aligned} P \left\{Y=i|X=1\right\}&=\frac{P \left\{X=1,Y=i\right\}}{P \left\{X=1\right\}}\quad i=0,1,2\\ P \left\{X=1\right\}&=\frac{5}{18}\\ P \left\{Y=0|X=1\right\}&=\frac{\frac{1}{6}}{\frac{5}{18}}=\frac{3}{5}\\ P \left\{Y=1|X=1\right\}&=\frac{\frac{1}{9}}{\frac{5}{18} }=\frac{2}{5}\\ P \left\{Y=2|X=1\right\}&=\frac{0}{\frac{5}{18}}=0\\ \end{aligned}

因此,在X=1X=1条件下YY的条件分布

 

               YY                     00           11     22
P{Y=iX=1}P \left\{Y=i \vert X=1\right\}35\frac{3}{5}25\frac{2}{5}00

 

三、二维连续型随机变量

定义:如果对随机变量(X,Y)(X,Y)的分布F(x,y)F(x,y)存在非负函数f(x,y)f(x,y),使得对于任意实数xxyy都有

F(x,y)=xyf(u,v)dudv,<x,y<+ F(x,y)=\int_{-\infty}^{x}\int_{-\infty}^{y}f(u,v)dudv,-\infty<x,y<+\infty

则称(X,Y)(X,Y)为二维连续型随机变量,函数f(x,y)f(x,y)称为(X,Y)(X,Y)的概率密度,或称为随机变量XXYY的联合概率密度

 

概率密度f(x,y)f(x,y)的性质

  • f(x,y)0f(x,y) \geq 0

  • ++f(x,y)dxdy=1\begin{aligned} \int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f(x,y)dxdy=1\end{aligned}

  • 随机变量(X,Y)(X,Y)落在区域DD内的概率

         P{(X,Y)D}=Df(x,y)dxdyP \left\{(X,Y)\in D\right\}=\iint\limits_{D}f(x,y)dxdy

 

例2:设二维连续型随机变量(X,Y)(X,Y)的概率密度为

f(x,y)={k(x+y)0<y<x<10其他 f(x,y)=\left\{\begin{aligned}&k(x+y)&0<y<x<1\\&0&其他\end{aligned}\right.

则常数k=()k=()

 

![[附件/Pasted image 20220914121648.png|200]]

 

由概率密度的性质

++f(x,y)dxdy=01dx0xk(x+y)dy=k01(x2+12x2)dx=k2=1k=2 \begin{aligned} \int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f(x,y)dxdy&=\int_{0}^{1}dx \int_{0}^{x}k(x+y)dy\\ &=k \int_{0}^{1}\left(x^{2}+ \frac{1}{2}x^{2}\right)dx\\ &=\frac{k}{2}=1 \Rightarrow k=2 \end{aligned}

 

对连续型随机变量(X,Y)(X,Y),设它的概率密度为f(x,y)f(x,y),由

FX(x)=F(x,+)=x[+f(x,y)dy]dx F_{X}(x)=F(x,+\infty)=\int_{-\infty}^{x}\left[\int_{-\infty}^{+\infty}f(x,y)dy\right]dx

可知,XX也是一个连续型变量,且其概率密度为fX(x)=+f(x,y)dy\begin{aligned} f_{X}(x)=\int_{-\infty}^{+\infty}f(x,y)dy\end{aligned}

 

定义:fX(x)=+f(x,y)dy\begin{aligned} f_{X}(x)=\int_{-\infty}^{+\infty}f(x,y)dy\end{aligned}fY(y)=+f(x,y)dx\begin{aligned} f_{Y}(y)=\int_{-\infty}^{+\infty}f(x,y)dx\end{aligned}分别称为(X,Y)(X,Y)关于XX和关于YY的边缘密度

 

定义:设f(x,y)f(x,y)在点(x,y)(x,y)连续,fY(y)f_{Y}(y)连续且fY(y)>0f_{Y}(y)>0,则条件分布

FXY(xy)=xf(s,y)fY(y)ds F_{X|Y}(x|y)=\int_{-\infty}^{x}\frac{f(s,y)}{f_{Y}(y)}ds

其中f(x,y)fY(y)\begin{aligned} \frac{f(x,y)}{f_{Y}(y)}\end{aligned}被称为在条件Y=yY=y下的条件密度,记作fXY(xy)f_{X|Y}(x|y),即

fXY(xy)=f(x,y)fY(y),fY(y)>0 f_{X|Y}(x|y)=\frac{f(x,y)}{f_{Y}(y)},f_{Y}(y)>0

类似可定义,当fX(x)>0f_{X}(x)>0

fYX(yx)=f(x,y)fX(x)FYX(yx)=yf(x,s)fX(x)ds f_Y|X(y|x)=\frac{f(x,y)}{f_{X}(x)}和F_{Y|X}(y|x)=\int_{-\infty}^{y}\frac{f(x,s)}{f_{X}(x)}ds

 

例3:设二维连续型随机变量(X,Y)(X,Y)的概率密度为

f(x,y)={2(x+y)0<y<x<10其他 f(x,y)=\left\{\begin{aligned}&2(x+y)&0<y<x<1\\&0&其他\end{aligned}\right.

试求

  • fX(x),fY(y)f_{X}(x),f_{Y}(y)

  • fXY(xy),fYX(yx)f_{X|Y}(x|y),f_{Y|X}(y|x)

 

fX(x)=+f(x,y)dy f_{X}(x)=\int_{-\infty}^{+\infty}f(x,y)dy

x0x \leq 0时,fX(x)=0f_{X}(x)=0

x1x \geq 1时,fX(x)=0f_{X}(x)=0

0<x<10< x<1时,

fX(x)=0x2(x+y)dy=3x2 f_{X}(x)=\int_{0}^{x}2(x+y)dy=3x^{2}

因此

fX(x)={3x20<x<10其他 f_{X}(x)=\left\{\begin{aligned}&3x^{2}&0<x<1\\&0&其他\end{aligned}\right.

同理

fY(y)={y12(x+y)dx=1+2y3y20<y<20其他 f_{Y}(y)=\left\{\begin{aligned}&\int_{y}^{1}2(x+y)dx=1+2y-3y^{2}&0<y<2\\&0&其他\end{aligned}\right.

由于

fXY(xy)=f(x,y)fY(y),fY(y)>0 f_{X|Y}(x|y)=\frac{f(x,y)}{f_{Y}(y)},f_{Y}(y)>0

故当0<y<10<y<1

fXY(xy)={2(x+y)1+2y3y20<y<x<10其他 f_{X|Y}(x|y)=\left\{\begin{aligned}&\frac{2(x+y)}{1+2y-3y^{2}}&0<y<x<1\\&0&其他\end{aligned}\right.

同理0<x<10<x<1

fYX(yx)={2(x+y)3x20<y<x<10其他 f_{Y|X}(y|x)=\left\{\begin{aligned}&\frac{2(x+y)}{3x^{2}}&0<y<x<1\\&0&其他\end{aligned}\right.

 

求条件概率密度时,一定要注意fY(y)>0,fX(x)>0f_{Y}(y)>0,f_{X}(x)>0的条件,即上面加粗的部分一定不能漏,否则fXY(xy)f_{X|Y}(x|y)中的其他会变为整个平面上的其他,而非0<y<10<y<1的其他

下题可能会有助于理解

 

例4:设(X,Y)(X,Y)是二维随机变量,XX的边缘密度为fX(x)={3x20<x<10其他f_{X}(x)=\left\{\begin{aligned}&3x^{2}&0<x<1\\&0&其他\end{aligned}\right.,在给定X=x(0<x<1)X=x(0<x<1)的条件下,YY的条件概率密度为

fYX(yx)={3y2x30<y<x0其他 f_{Y|X}(y|x)=\left\{\begin{aligned}&\frac{3y^{2}}{x^{3}}&0<y<x\\&0&其他\end{aligned}\right.
  • (X,Y)(X,Y)的概率密度f(x,y)f(x,y)

  • YY的边缘概率密度fY(y)f_{Y}(y)

  • P{X>2Y}P \left\{X>2Y\right\}

 

fYX(yx)=f(x,y)fX(x),其中fX(x)>0 f_{Y|X}(y|x)=\frac{f(x,y)}{f_{X}(x)},其中f_{X}(x)>0

0<x<10<x<1时,即fX(x)>0f_{X}(x)>0

f(x,y)=fX(x)fYX(yx)={9y2x0<y<x0其他,0<x<1 f(x,y)=f_{X}(x)\cdot f_{Y|X}(y|x)=\left\{\begin{aligned}& \frac{9y^{2}}{x}&0<y<x\\&0&其他\end{aligned}\right.,0<x<1

 

注意这里提前限制了当0<x<10<x<1时,即fX(x)>0f_{X}(x)>0时,指的是

![[附件/Pasted image 20220914155946.png|300]]

 

所有蓝色部分,0<y<x0<y<x指的是橙色部分,式子中的其他指的是除了橙色部分的蓝色部分

但实际上,f(x,y)f(x,y)要的是全平面上的,该式只是0<x<1,<y<+0<x<1,-\infty<y<+\infty上的,因此,需要说明其他部分的值

 

01dx0x9y2xdx=1 \int_{0}^{1}dx \int_{0}^{x}\frac{9y^{2}}{x}dx=1

因此可以确定在0<x<1,<y<+0<x<1,-\infty<y<+\infty以外的平面上f(x,y)0f(x,y)\equiv0,因此有

f(x,y)={9y2x0<y<x<10其他 f(x,y)=\left\{\begin{aligned}& \frac{9y^{2}}{x}&0<y<x<1\\&0&其他\end{aligned}\right.

fY(y)=+f(x,y)dx={y19y2xdx0<y<10其他={9y2lny0<y<10其他 \begin{aligned} f_{Y}(y)=\int_{-\infty}^{+\infty}f(x,y)dx&=\left\{\begin{aligned}&\int_{y}^{1} \frac{9y^{2}}{x}dx&0<y<1\\&0&其他\end{aligned}\right.\\ &=\left\{\begin{aligned}&-9y^{2}\ln y&0<y<1\\&0&其他\end{aligned}\right. \end{aligned}

 

在这里插入图片描述

P{X>2Y}=x>2yf(x,y)dxdy=01dx0x29y2xdy=18 P \left\{X>2Y\right\}=\iint\limits_{x>2y}f(x,y)dxdy=\int_{0}^{1}dx \int_{0}^{\frac{x}{2}} \frac{9y^{2}}{x}dy=\frac{1}{8}

 

例3是大的其他变成小的其他,例4是小的其他变成大的其他