【概率论】多维随机变量及其分布

102 阅读4分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

二维随机变量

一、二维随机变量的定义

EE是一个随机变量,它的样本空间是S={e}S=\{e\},设X=X(e)X=X(e)Y=Y(e)Y=Y(e)是定义在SS上的随机变量,由它们构成一个向量(X,Y)(X,Y)叫做二维随机变量

 

二、分布函数的定义

(X,Y)(X,Y)是二维随机变量,对于任意实数x,yx,y,均存在二元函数F(x,y)=P{(Xx)(Yy)}F(x,y)=P\{(X\leq x)\cap (Y\leq y)\}记作P{Xx,Yy}P\{X\leq x,Y\leq y\},故将F(x,y)F(x,y)称为二维随机变量(X,Y)(X,Y)的分布函数,或称为随机变量XXYY的联合分布函数

 

三、分布函数的性质

1. 单调不减

任意固定yy,当x2>x1x_{2}>x_{1}时,F(x2,y)F(x1,y)F(x_{2},y)\geq F(x_{1},y);任意固定xx,当y2>y1y_{2}>y_{1}时,F(x,y2)F(x,y1)F(x,y_{2})\geq F(x,y_{1})

 

2. 规范性

0F(x,y)10\leq F(x,y)\leq1,且F(,y)=F(x,)=F(,)=0,F(+,+)=1F(-\infty,y)=F(x,-\infty)=F(-\infty,-\infty)=0,F(+\infty,+\infty)=1

 

3. 右连续

F(x+0,y)=F(x,y),F(x,y+0)=F(x,y)F(x+0,y)=F(x,y),F(x,y+0)=F(x,y),即函数F(x,y)F(x,y)关于x,yx,y均右连续

 

4. 非负性

对于任意的x1<x2,y1<y2x_{1}<x_{2},y_{1}<y_{2},不等式F(x2,y2)F(x2,y1)+F(x1,y1)F(x1,y2)0F(x_{2},y_{2})-F(x_{2},y_{1})+F(x_{1},y_{1})-F(x_{1},y_{2})\geq 0成立

 

推导:

P{Xx2,Yy2}P{Xx2,Yy1}+P{Xx1,Yy1}P{Xx1,Yy2}=P{Xx2,y1<Yy2}P{Xx2,y1<Yy2}=P{x1<Xx2,y1<Yy2}\begin{aligned}\quad&P\{X\leq x_{2},Y\leq y_{2}\}-P\{X\leq x_{2},Y\leq y_{1}\}+P\{X\leq x_{1},Y\leq y_{1}\}-P\{X\leq x_{1},Y\leq y_{2}\}\\=&P\{X\leq x_{2},y_{1}<Y\leq y_{2}\}-P\{X\leq x_{2},y_{1}<Y\leq y_{2}\}\\=&P\{x_{1}<X\leq x_{2},y_{1}<Y\leq y_{2}\}\end{aligned}

 

四、二维离散型随机变量

1. 定义

如果二维随机变量(X,Y)(X,Y)全部可能取到的值是有限对或可列无限多对,则称(X,Y)(X,Y)是离散型的随机变量

 

2. 性质

  • 非负性:pij0p_{ij}\geq 0

  • 规范性:i=1j=1pij=1\sum\limits^{\infty}_{i=1}\sum\limits^{\infty}_{j=1}p_{ij}=1

 

3. 联合分布律

P{X=xi,Y=yj}=pij,i,j=1,2,P\{X=x_{i},Y=y_{j}\}=p_{ij},\quad i,j=1,2,\cdots为二维离散型随机变量(X,Y)(X,Y)联合分布律

 

例1:设随机变量XX1,2,3,41,2,3,4四个正数中等可能地取一个值,另一个随机变量YY11XX中等可能地取一整数值,试求(X,Y)(X,Y)的分布律

 

XX\ YY      11            22            33            44      
   11   14\frac{1}{4}       00            00            00      
   22   18\frac{1}{8} 18\frac{1}{8}       00            00      
   33   112\frac{1}{12}112\frac{1}{12}112\frac{1}{12}      00      
   44   116\frac{1}{16}116\frac{1}{16}116\frac{1}{16}116\frac{1}{16}

 

五、二维连续性随机变量

1. 定义

如果存在非负可积函数f(x,y)f(x,y),使对于任意x,yx,y都有F(x,y)=yxf(u,v)dudvF(x,y)=\int^{y}_{-\infty}\int^{x}_{-\infty}f(u,v)dudv,则称(X,Y)(X,Y)是连续型的二维随机变量,函数f(x,y)f(x,y)称为二维随机变量(X,Y)(X,Y)的概率密度,或者称为随机变量XXYY的联合概率密度

 

2. 性质

  • f(x,y)0f(x,y)\geq 0

  • 规范性:++f(x,y)dxdy=F(+,+)=1\int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}f(x,y)dxdy=F(+\infty,+\infty)=1

 

3. 求法

P{(X,Y)D}=(x,y)Df(x,y)P\{(X,Y)\in D\}=\iint_{(x,y)\in D}f(x,y)

 

例2:设二维随机变量(X,Y)(X,Y)具有概率密度f(x,y)={2e(2x+y),x>0,y>00,其他f(x,y)=\begin{cases}2e^{-(2x+y)},x>0,y>0\\0,\quad\text{其他}\end{cases},求

  • 分布函数F(x,y)F(x,y)

      F(x,y)=xduyf(u,v)dv={0xdu0y2e(2u+v)dv=(1e2x)(1ey),x>0,y>00,其他F(x,y)=\int^{x}_{-\infty}du\int^{y}_{-\infty}f(u,v)dv=\begin{cases}\int^{x}_{0}du\int^{y}_{0}2e^{-(2u+v)}dv=(1-e^{-2x})(1-e^{-y}),x>0,y>0\\0,\quad\text{其他}\end{cases}

  • P{YX}P\{Y\leq X\}的概率

      P{YX}=yxf(x,y)dxdy=0+dx0x2e(2x+y)dy=13\begin{aligned}P\{Y\leq X\}&=\iint\limits_{y\leq x}f(x,y)dxdy\\&=\int^{+\infty}_{0}dx\int^{x}_{0}2e^{-(2x+y)}dy\\&=\frac{1}{3}\end{aligned}

 

边缘分布

一、定义

1. 边缘分布函数

二维随机变量(X,Y)(X,Y)作为一个整体,具有分布函数F(x,y)F(x,y),而XXYY都是随机变量,各自也有分布函数,将它们分别记为FX(x),FY(y)F_{X}(x),F_{Y}(y),依次称为二维随机变量(X,Y)(X,Y)关于XX和关于YY的边缘分布函数。边缘分布函数可以由(X,Y)(X,Y)的分布函数F(x,y)F(x,y)所确定

 

2. 边缘分布律

  • XX的边缘分布律

      P{X=xi}=j=1pij,i=1,2,P\{X=x_{i}\}=\sum\limits^{\infty}_{j=1}p_{ij},i=1,2,\cdots。即第ii行的概率和

     

      推导:P{X=xi}=P{X=xi,jY=yi}=j=1nP{X=xi,Y=yi}P\{X=x_{i}\}=P\{X=x_{i},\bigcup\limits_{j}Y=y_{i}\}=\sum\limits^{n}_{j=1}P\{X=x_{i},Y=y_{i}\}

  • YY的边缘分布律

      P{Y=yi}=i=1pij,j=1,2,P\{Y=y_{i}\}=\sum\limits^{\infty}_{i=1}p_{ij},j=1,2,\cdots。即第jj列的概率和

 

3. 边缘概率密度

  • XX的边缘概率密度

      FX(x)=+f(x,y)dyF_{X}(x)=\int^{+\infty}_{-\infty}f(x,y)dy

     

      推导:

      F(x,+)=x+f(u,v)dvduF(x,+\infty)=\int^{x}_{-\infty}\int^{+\infty}_{-\infty}f(u,v)dvdu

      两侧同时对xx求导,得上式

  • YY的边缘概率密度

      FY(y)=+f(x,y)dxF_{Y}(y)=\int^{+\infty}_{-\infty}f(x,y)dx

 

例1:一整数NN等可能地在1,2,3,,101,2,3,\cdots,10十个值中取一个值,设D=D(N)D=D(N)是能整除NN的正整数的个数,F=F(N)F=F(N)是能整除NN的素数的个数(注:11不是素数),写出DDFF的联合分布律,并求边缘分布律

 

样本点1122334455667788991010
DD   11222233224422443344 
FF   00111111112211111122    

 

D={1,2,3,4},F={0,1,2}D=\{1,2,3,4\},F=\{0,1,2\}

 

  FF\ DD       11            22            33            44         P{F=j}P\{F=j\}  
    00    110\frac{1}{10}      00            00            00      110\frac{1}{10}
    11          00      25\frac{2}{5} 15\frac{1}{5} 110\frac{1}{10}710\frac{7}{10}
    22          00            00            00      210\frac{2}{10}210\frac{2}{10}
P{D=i}P\{D=i\}110\frac{1}{10}410\frac{4}{10}210\frac{2}{10}310\frac{3}{10}               

 

则边缘分布律为

 

DD      11            22           33      44           
PP110\frac{1}{10}25\frac{2}{5}15\frac{1}{5}310\frac{3}{10}
FF      00            11            22     
PP110\frac{1}{10}710\frac{7}{10}15\frac{1}{5}

 

例2:设随机变量XXYY具有联合概率密度f(x,y)={6,x2yx0,其他f(x,y)=\begin{cases}6,x^{2}\leq y\leq x\\0,\quad \text{其他}\end{cases},求边缘概率密度fX(x)f_{X}(x)fY(y)f_{Y}(y)

fX(x)=+f(x,y)dy={x2x6dy=6(xx2),0<x<10,其他f_X(x)=\int^{+\infty}_{-\infty}f(x,y)dy=\begin{cases}\int^{x}_{x^{2}}6dy=6(x-x^{2}),0<x<1\\0,\quad\text{其他}\end{cases}

fY(y)=+f(x,y)dx={yy6dx=6(yy),0<y<10,其他f_{Y}(y)=\int^{+\infty}_{-\infty}f(x,y)dx=\begin{cases}\int^{\sqrt{y}}_{y}6dx=6(\sqrt{y}-y),0<y<1\\0,\quad\text{其他}\end{cases}

 

条件分布

一、条件分布律的定义

(X,Y)(X,Y)是二维分散型随机变量,对于固定的jj,若P{Y=yj}>0P\{Y=y_{j}\}>0,则称P{X=xiY=yj}=P{X=xi,Y=yj}P{Y=yj}=pijpj,i=1,2,P\{X=x_{i}|Y=y_{j}\}=\frac{P\{X=x_{i},Y=y_{j}\}}{P\{Y=y_{j}\}}=\frac{p_{ij}}{p_{\cdot j}},i=1,2,\cdots为在Y=yjY=y_{j}的条件下随机变量XX的条件分布律。同样,对于固定的ii,若P{X=xi}>0P\{X=x_{i}\}>0,则称P{Y=yjX=xi}=P{X=xi,Y=yj}P{X=xi}=pijpi,j=1,2,P\{Y=y_{j}|X=x_{i}\}=\frac{P\{X=x_{i},Y=y_{j}\}}{P\{X=x_{i}\}}=\frac{p_{ij}}{p_{i\cdot }},j=1,2,\cdots为在X=xiX=x_{i}的条件下随机变量YY的条件分布律。

即条件分布律=联合概率/边缘概率

 

二、条件概率密度的定义

设二维随机变量(X,Y)(X,Y)的概率密度为f(x,y)f(x,y)(X,Y)(X,Y)关于YY的边缘概率密度为fY(y)f_{Y}(y),若对于固定的yyfY(y)>0f_{Y}(y)>0,则称f(x,y)fY(y)\frac{f(x,y)}{f_{Y}(y)}为在Y=yY=y的条件下XX的条件概率密度,记为fXY(xy)=f(x,y)fY(y)f_{X|Y}(x|y)=\frac{f(x,y)}{f_{Y}(y)}。称xfXY(xy)dx=xf(x,y)fY(y)dx\int^{x}_{-\infty}f_{X|Y}(x|y)dx=\int^{x}_{-\infty}\frac{f(x,y)}{f_{Y}(y)}dx为在Y=yY=y的条件下XX的条件分布函数,记为P{XxY=y}P\{X\leq x|Y=y\}FXY(xy)F_{X|Y}(x|y)。类似地,在X=xX=x的条件下YY的概率密度为f(x,y)fX(x)\frac{f(x,y)}{f_{X}(x)},记为fYX(yx)f_{Y|X}(y|x)X=xX=x的条件下YY的条件的条件分布函数为yf(x,y)fX(x)dy\int^{y}_{-\infty}\frac{f(x,y)}{f_{X}(x)}dy,记为P{YyX=x}P\{Y\leq y|X=x\}FYX(yx)F_{Y|X}(y|x)

 

三、两种重要的二维连续性随机变量

1. 均匀分布

GG是平面上的有界区域,其面积为AA,若二维随机变量(X,Y)(X,Y)具有概率密度f(x,y)={1A,(x,y)G0,其他f(x,y)=\begin{cases}\frac{1}{A},(x,y)\in G\\0,\quad\text{其他}\end{cases},则称(X,Y)(X,Y)GG上服从均匀分布,记作(X,Y)U(G)(X,Y)\sim U(G)

 

2. 二维正态分布

若二维连续型随机变量(X,Y)(X,Y)的概率密度为f(x,y)=12πσ1σ21ρ2e12(1ρ2)[(xμ1)2σ122ρ(xμ1)(yμ2)σ1σ2+(yσ2)2σ22],<x<+,<y<+f(x,y)=\frac{1}{2\pi \sigma_{1}\sigma_{2}\sqrt{1-\rho^{2}}}e^{-\frac{1}{2(1-\rho^{2})}\Big[\frac{(x-\mu_{1})^{2}}{\sigma_{1}^{2}}-\frac{2\rho(x-\mu_{1})(y-\mu_{2})}{\sigma_{1}\sigma_{2}}+\frac{(y-\sigma_{2})^{2}}{\sigma_{2}^{2}}\Big]},-\infty<x<+\infty,-\infty<y<+\infty,其中μ1,μ2,σ1>0,σ2>0,1<ρ<1\mu_{1},\mu_{2},\sigma_{1}>0,\sigma_{2}>0,-1<\rho<1均为常数,则称(X,Y)(X,Y)服从参数为μ1,μ2,σ1,σ2\mu_{1},\mu_{2},\sigma_{1},\sigma_{2}ρ\rho的二维正态分布,记作(X,Y)N(μ1,μ2;σ12,σ22;ρ)(X,Y)\sim N(\mu_{1},\mu_{2};\sigma_{1}^{2},\sigma_{2}^{2};\rho)

 

例1:设二维随机变量(X,Y)(X,Y)在圆域x2+y21x^{2}+y^{2}\leq1上服从均匀分布,求条件概率密度fXY(xy)f_{X|Y}(x|y)

S=πS=\pi

f(x,y)={1π,x2+y210,其他\therefore f(x,y)=\begin{cases}\frac{1}{\pi},x^{2}+y^{2}\leq1\\0,\text{其他}\end{cases}

fY(y)=+f(x,y)dx={1y21y21πdx=2π1y2,1<y<10,其他f_{Y}(y)=\int^{+\infty}_{-\infty}f(x,y)dx=\begin{cases}\int^{\sqrt{1-y^{2}}}_{-\sqrt{1-y^{2}}}\frac{1}{\pi}dx=\frac{2}{\pi}\sqrt{1-y^{2}},-1<y<1\\0,\quad\text{其他}\end{cases}

1<y<1-1<y<1

fXY(xy)=f(x,y)fY(y)={121y2,1y2<x<1y20,其他f_{X|Y}(x|y)=\frac{f(x,y)}{f_{Y}(y)}=\begin{cases}\frac{1}{2\sqrt{1-y^{2}}},-\sqrt{1-y^{2}}<x<\sqrt{1-y^{2}}\\0,\quad\text{其他}\end{cases}

 

例2:设XU(0,1)X\sim U(0,1),当观察到X=x(0<x<1)X=x(0<x<1)时,YY服从(x,1)(x,1)上的均匀分布,求YY的概率密度fY(y)f_{Y}(y)

fX(x)={11=1,0<x<10,其他f_{X}(x)=\begin{cases}\frac{1}{1}=1,0<x<1\\0,\quad\text{其他}\end{cases}

fYX(yx)={11x,0<x<y<10,其他f_{Y|X}(y|x)=\begin{cases}\frac{1}{1-x},0<x<y<1\\0,\quad\text{其他}\end{cases}

f(x,y)=fX(x)fYX(yx)={11x,0<x<y<10,其他f(x,y)=f_{X}(x)\cdot f_{Y|X}(y|x)=\begin{cases}\frac{1}{1-x},0<x<y<1\\0,\quad\text{其他}\end{cases}

fY(y)=+f(x,y)dx={0y11xdx=ln(1y),0<y<10,其他f_{Y}(y)=\int^{+\infty}_{-\infty}f(x,y)dx=\begin{cases}\int^{y}_{0}\frac{1}{1-x}dx=-\ln(1-y),0<y<1\\0,\quad\text{其他}\end{cases}

 

四、随机变量的相互独立

1. 定义

若对于所有的x,yx,y,均有P{Xx,Yy}=P{Xx}P{Yy}P\{X\leq x,Y\leq y\}=P\{X\leq x\}P\{Y\leq y\},即F(x,y)=FX(x)FY(y)F(x,y)=F_{X}(x)F_{Y}(y),则称随机变量XXYY是相互独立的

 

联合概率=边缘概率的乘积,即联合分布函数=边缘分布函数的乘积

 

2. 充要条件

  • (X,Y)(X,Y)是连续型随机变量,则XXYY相互独立f(x,y)=fX(x)fY(y)\Leftrightarrow f(x,y)=f_{X}(x)f_{Y}(y)

      即联合概率密度=边缘概率密度乘积

  • (X,Y)(X,Y)是离散型随机变量,则XXYY相互独立P{X=xi,Y=yj}=P{X=xi}P{Y=yi}\Leftrightarrow P\{X=x_{i},Y=y_{j}\}=P\{X=x_{i}\}P\{Y=y_{i}\}

      即联合概率=边缘概率乘积