本文已参与「新人创作礼」活动，一起开启掘金创作之路。

二维随机变量

一、二维随机变量的定义

设 $E$ 是一个随机变量，它的样本空间是 $S=\{e\}$ ，设 $X=X(e)$ 和 $Y=Y(e)$ 是定义在 $S$ 上的随机变量，由它们构成一个向量 $(X,Y)$ 叫做二维随机变量

二、分布函数的定义

设 $(X,Y)$ 是二维随机变量，对于任意实数 $x,y$ ，均存在二元函数 $F(x,y)=P\{(X\leq x)\cap (Y\leq y)\}$ 记作 $P\{X\leq x,Y\leq y\}$ ，故将 $F(x,y)$ 称为二维随机变量 $(X,Y)$ 的分布函数，或称为随机变量 $X$ 和 $Y$ 的联合分布函数

三、分布函数的性质

1. 单调不减

任意固定 $y$ ，当 $x_{2}>x_{1}$ 时， $F(x_{2},y)\geq F(x_{1},y)$ ；任意固定 $x$ ，当 $y_{2}>y_{1}$ 时， $F(x,y_{2})\geq F(x,y_{1})$

2. 规范性

$0\leq F(x,y)\leq1$ ，且 $F(-\infty,y)=F(x,-\infty)=F(-\infty,-\infty)=0,F(+\infty,+\infty)=1$

3. 右连续

$F(x+0,y)=F(x,y),F(x,y+0)=F(x,y)$ ，即函数 $F(x,y)$ 关于 $x,y$ 均右连续

4. 非负性

对于任意的 $x_{1}<x_{2},y_{1}<y_{2}$ ，不等式 $F(x_{2},y_{2})-F(x_{2},y_{1})+F(x_{1},y_{1})-F(x_{1},y_{2})\geq 0$ 成立

推导：

$\begin{aligned}\quad&P\{X\leq x_{2},Y\leq y_{2}\}-P\{X\leq x_{2},Y\leq y_{1}\}+P\{X\leq x_{1},Y\leq y_{1}\}-P\{X\leq x_{1},Y\leq y_{2}\}\\=&P\{X\leq x_{2},y_{1}<Y\leq y_{2}\}-P\{X\leq x_{2},y_{1}<Y\leq y_{2}\}\\=&P\{x_{1}<X\leq x_{2},y_{1}<Y\leq y_{2}\}\end{aligned}$

四、二维离散型随机变量

1. 定义

如果二维随机变量 $(X,Y)$ 全部可能取到的值是有限对或可列无限多对，则称 $(X,Y)$ 是离散型的随机变量

2. 性质

非负性： $p_{ij}\geq 0$
规范性： $\sum\limits^{\infty}_{i=1}\sum\limits^{\infty}_{j=1}p_{ij}=1$

3. 联合分布律

$P\{X=x_{i},Y=y_{j}\}=p_{ij},\quad i,j=1,2,\cdots$ 为二维离散型随机变量 $(X,Y)$ 联合分布律

例1：设随机变量 $X$ 在 $1,2,3,4$ 四个正数中等可能地取一个值，另一个随机变量 $Y$ 在 $1$ 到 $X$ 中等可能地取一整数值，试求 $(X,Y)$ 的分布律

$X$ \ $Y$	$1$	$2$	$3$	$4$
$1$	$\frac{1}{4}$	$0$	$0$	$0$
$2$	$\frac{1}{8}$	$\frac{1}{8}$	$0$	$0$
$3$	$\frac{1}{12}$	$\frac{1}{12}$	$\frac{1}{12}$	$0$
$4$	$\frac{1}{16}$	$\frac{1}{16}$	$\frac{1}{16}$	$\frac{1}{16}$

五、二维连续性随机变量

1. 定义

如果存在非负可积函数 $f(x,y)$ ，使对于任意 $x,y$ 都有 $F(x,y)=\int^{y}_{-\infty}\int^{x}_{-\infty}f(u,v)dudv$ ，则称 $(X,Y)$ 是连续型的二维随机变量，函数 $f(x,y)$ 称为二维随机变量 $(X,Y)$ 的概率密度，或者称为随机变量 $X$ 和 $Y$ 的联合概率密度

2. 性质

$f(x,y)\geq 0$
规范性： $\int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}f(x,y)dxdy=F(+\infty,+\infty)=1$

3. 求法

$P\{(X,Y)\in D\}=\iint_{(x,y)\in D}f(x,y)$

例2：设二维随机变量 $(X,Y)$ 具有概率密度 $f(x,y)=\begin{cases}2e^{-(2x+y)},x>0,y>0\\0,\quad\text{其他}\end{cases}$ ，求

分布函数 $F(x,y)$

$F(x,y)=\int^{x}_{-\infty}du\int^{y}_{-\infty}f(u,v)dv=\begin{cases}\int^{x}_{0}du\int^{y}_{0}2e^{-(2u+v)}dv=(1-e^{-2x})(1-e^{-y}),x>0,y>0\\0,\quad\text{其他}\end{cases}$

$P\{Y\leq X\}$ 的概率

$\begin{aligned}P\{Y\leq X\}&=\iint\limits_{y\leq x}f(x,y)dxdy\\&=\int^{+\infty}_{0}dx\int^{x}_{0}2e^{-(2x+y)}dy\\&=\frac{1}{3}\end{aligned}$

边缘分布

一、定义

1. 边缘分布函数

二维随机变量 $(X,Y)$ 作为一个整体，具有分布函数 $F(x,y)$ ，而 $X$ 和 $Y$ 都是随机变量，各自也有分布函数，将它们分别记为 $F_{X}(x),F_{Y}(y)$ ，依次称为二维随机变量 $(X,Y)$ 关于 $X$ 和关于 $Y$ 的边缘分布函数。边缘分布函数可以由 $(X,Y)$ 的分布函数 $F(x,y)$ 所确定

2. 边缘分布律

$X$ 的边缘分布律

$P\{X=x_{i}\}=\sum\limits^{\infty}_{j=1}p_{ij},i=1,2,\cdots$ 。即第 $i$ 行的概率和

推导： $P\{X=x_{i}\}=P\{X=x_{i},\bigcup\limits_{j}Y=y_{i}\}=\sum\limits^{n}_{j=1}P\{X=x_{i},Y=y_{i}\}$

$Y$ 的边缘分布律

$P\{Y=y_{i}\}=\sum\limits^{\infty}_{i=1}p_{ij},j=1,2,\cdots$ 。即第 $j$ 列的概率和

3. 边缘概率密度

$X$ 的边缘概率密度

$F_{X}(x)=\int^{+\infty}_{-\infty}f(x,y)dy$

推导：

$F(x,+\infty)=\int^{x}_{-\infty}\int^{+\infty}_{-\infty}f(u,v)dvdu$

两侧同时对 $x$ 求导，得上式

$Y$ 的边缘概率密度

$F_{Y}(y)=\int^{+\infty}_{-\infty}f(x,y)dx$

例1：一整数 $N$ 等可能地在 $1,2,3,\cdots,10$ 十个值中取一个值，设 $D=D(N)$ 是能整除 $N$ 的正整数的个数， $F=F(N)$ 是能整除 $N$ 的素数的个数（注： $1$ 不是素数），写出 $D$ 和 $F$ 的联合分布律，并求边缘分布律

样本点	$1$	$2$	$3$	$4$	$5$	$6$	$7$	$8$	$9$	$10$
$D$	$1$	$2$	$2$	$3$	$2$	$4$	$2$	$4$	$3$	$4$
$F$	$0$	$1$	$1$	$1$	$1$	$2$	$1$	$1$	$1$	$2$

则 $D=\{1,2,3,4\},F=\{0,1,2\}$

$F$ \ $D$	$1$	$2$	$3$	$4$	$P\{F=j\}$
$0$	$\frac{1}{10}$	$0$	$0$	$0$	$\frac{1}{10}$
$1$	$0$	$\frac{2}{5}$	$\frac{1}{5}$	$\frac{1}{10}$	$\frac{7}{10}$
$2$	$0$	$0$	$0$	$\frac{2}{10}$	$\frac{2}{10}$
$P\{D=i\}$	$\frac{1}{10}$	$\frac{4}{10}$	$\frac{2}{10}$	$\frac{3}{10}$

则边缘分布律为

$D$	$1$	$2$	$3$	$4$
$P$	$\frac{1}{10}$	$\frac{2}{5}$	$\frac{1}{5}$	$\frac{3}{10}$

$F$	$0$	$1$	$2$
$P$	$\frac{1}{10}$	$\frac{7}{10}$	$\frac{1}{5}$

例2：设随机变量 $X$ 和 $Y$ 具有联合概率密度 $f(x,y)=\begin{cases}6,x^{2}\leq y\leq x\\0,\quad \text{其他}\end{cases}$ ，求边缘概率密度 $f_{X}(x)$ 和 $f_{Y}(y)$

$f_X(x)=\int^{+\infty}_{-\infty}f(x,y)dy=\begin{cases}\int^{x}_{x^{2}}6dy=6(x-x^{2}),0<x<1\\0,\quad\text{其他}\end{cases}$

$f_{Y}(y)=\int^{+\infty}_{-\infty}f(x,y)dx=\begin{cases}\int^{\sqrt{y}}_{y}6dx=6(\sqrt{y}-y),0<y<1\\0,\quad\text{其他}\end{cases}$

条件分布

一、条件分布律的定义

设 $(X,Y)$ 是二维分散型随机变量，对于固定的 $j$ ，若 $P\{Y=y_{j}\}>0$ ，则称 $P\{X=x_{i}|Y=y_{j}\}=\frac{P\{X=x_{i},Y=y_{j}\}}{P\{Y=y_{j}\}}=\frac{p_{ij}}{p_{\cdot j}},i=1,2,\cdots$ 为在 $Y=y_{j}$ 的条件下随机变量 $X$ 的条件分布律。同样，对于固定的 $i$ ，若 $P\{X=x_{i}\}>0$ ，则称 $P\{Y=y_{j}|X=x_{i}\}=\frac{P\{X=x_{i},Y=y_{j}\}}{P\{X=x_{i}\}}=\frac{p_{ij}}{p_{i\cdot }},j=1,2,\cdots$ 为在 $X=x_{i}$ 的条件下随机变量 $Y$ 的条件分布律。

即条件分布律=联合概率/边缘概率

二、条件概率密度的定义

设二维随机变量 $(X,Y)$ 的概率密度为 $f(x,y)$ ， $(X,Y)$ 关于 $Y$ 的边缘概率密度为 $f_{Y}(y)$ ，若对于固定的 $y$ ， $f_{Y}(y)>0$ ，则称 $\frac{f(x,y)}{f_{Y}(y)}$ 为在 $Y=y$ 的条件下 $X$ 的条件概率密度，记为 $f_{X|Y}(x|y)=\frac{f(x,y)}{f_{Y}(y)}$ 。称 $\int^{x}_{-\infty}f_{X|Y}(x|y)dx=\int^{x}_{-\infty}\frac{f(x,y)}{f_{Y}(y)}dx$ 为在 $Y=y$ 的条件下 $X$ 的条件分布函数，记为 $P\{X\leq x|Y=y\}$ 或 $F_{X|Y}(x|y)$ 。类似地，在 $X=x$ 的条件下 $Y$ 的概率密度为 $\frac{f(x,y)}{f_{X}(x)}$ ，记为 $f_{Y|X}(y|x)$ ； $X=x$ 的条件下 $Y$ 的条件的条件分布函数为 $\int^{y}_{-\infty}\frac{f(x,y)}{f_{X}(x)}dy$ ，记为 $P\{Y\leq y|X=x\}$ 或 $F_{Y|X}(y|x)$

三、两种重要的二维连续性随机变量

1. 均匀分布

设 $G$ 是平面上的有界区域，其面积为 $A$ ，若二维随机变量 $(X,Y)$ 具有概率密度 $f(x,y)=\begin{cases}\frac{1}{A},(x,y)\in G\\0,\quad\text{其他}\end{cases}$ ，则称 $(X,Y)$ 在 $G$ 上服从均匀分布，记作 $(X,Y)\sim U(G)$

2. 二维正态分布

若二维连续型随机变量 $(X,Y)$ 的概率密度为 $f(x,y)=\frac{1}{2\pi \sigma_{1}\sigma_{2}\sqrt{1-\rho^{2}}}e^{-\frac{1}{2(1-\rho^{2})}\Big[\frac{(x-\mu_{1})^{2}}{\sigma_{1}^{2}}-\frac{2\rho(x-\mu_{1})(y-\mu_{2})}{\sigma_{1}\sigma_{2}}+\frac{(y-\sigma_{2})^{2}}{\sigma_{2}^{2}}\Big]},-\infty<x<+\infty,-\infty<y<+\infty$ ，其中 $\mu_{1},\mu_{2},\sigma_{1}>0,\sigma_{2}>0,-1<\rho<1$ 均为常数，则称 $(X,Y)$ 服从参数为 $\mu_{1},\mu_{2},\sigma_{1},\sigma_{2}$ 和 $\rho$ 的二维正态分布，记作 $(X,Y)\sim N(\mu_{1},\mu_{2};\sigma_{1}^{2},\sigma_{2}^{2};\rho)$

例1：设二维随机变量 $(X,Y)$ 在圆域 $x^{2}+y^{2}\leq1$ 上服从均匀分布，求条件概率密度 $f_{X|Y}(x|y)$

$S=\pi$

$\therefore f(x,y)=\begin{cases}\frac{1}{\pi},x^{2}+y^{2}\leq1\\0,\text{其他}\end{cases}$

$f_{Y}(y)=\int^{+\infty}_{-\infty}f(x,y)dx=\begin{cases}\int^{\sqrt{1-y^{2}}}_{-\sqrt{1-y^{2}}}\frac{1}{\pi}dx=\frac{2}{\pi}\sqrt{1-y^{2}},-1<y<1\\0,\quad\text{其他}\end{cases}$

当 $-1<y<1$ 时

$f_{X|Y}(x|y)=\frac{f(x,y)}{f_{Y}(y)}=\begin{cases}\frac{1}{2\sqrt{1-y^{2}}},-\sqrt{1-y^{2}}<x<\sqrt{1-y^{2}}\\0,\quad\text{其他}\end{cases}$

例2：设 $X\sim U(0,1)$ ，当观察到 $X=x(0<x<1)$ 时， $Y$ 服从 $(x,1)$ 上的均匀分布，求 $Y$ 的概率密度 $f_{Y}(y)$

$f_{X}(x)=\begin{cases}\frac{1}{1}=1,0<x<1\\0,\quad\text{其他}\end{cases}$

$f_{Y|X}(y|x)=\begin{cases}\frac{1}{1-x},0<x<y<1\\0,\quad\text{其他}\end{cases}$

则 $f(x,y)=f_{X}(x)\cdot f_{Y|X}(y|x)=\begin{cases}\frac{1}{1-x},0<x<y<1\\0,\quad\text{其他}\end{cases}$

则 $f_{Y}(y)=\int^{+\infty}_{-\infty}f(x,y)dx=\begin{cases}\int^{y}_{0}\frac{1}{1-x}dx=-\ln(1-y),0<y<1\\0,\quad\text{其他}\end{cases}$

四、随机变量的相互独立

1. 定义

若对于所有的 $x,y$ ，均有 $P\{X\leq x,Y\leq y\}=P\{X\leq x\}P\{Y\leq y\}$ ，即 $F(x,y)=F_{X}(x)F_{Y}(y)$ ，则称随机变量 $X$ 与 $Y$ 是相互独立的

联合概率=边缘概率的乘积，即联合分布函数=边缘分布函数的乘积

2. 充要条件

设 $(X,Y)$ 是连续型随机变量，则 $X$ 和 $Y$ 相互独立 $\Leftrightarrow f(x,y)=f_{X}(x)f_{Y}(y)$

即联合概率密度=边缘概率密度乘积

设 $(X,Y)$ 是离散型随机变量，则 $X$ 和 $Y$ 相互独立 $\Leftrightarrow P\{X=x_{i},Y=y_{j}\}=P\{X=x_{i}\}P\{Y=y_{i}\}$

即联合概率=边缘概率乘积

样本点	$1$	$2$	$3$	$4$	$5$	$6$	$7$	$8$	$9$	$10$
$D$	$1$	$2$	$2$	$3$	$2$	$4$	$2$	$4$	$3$	$4$
$F$	$0$	$1$	$1$	$1$	$1$	$2$	$1$	$1$	$1$	$2$

样本点	$1$	$2$	$3$	$4$	$5$	$6$	$7$	$8$	$9$	$10$
$D$	$1$	$2$	$2$	$3$	$2$	$4$	$2$	$4$	$3$	$4$
$F$	$0$	$1$	$1$	$1$	$1$	$2$	$1$	$1$	$1$	$2$

【概率论】多维随机变量及其分布

二维随机变量

一、二维随机变量的定义

二、分布函数的定义

三、分布函数的性质

1. 单调不减

2. 规范性

3. 右连续

4. 非负性

四、二维离散型随机变量

1. 定义

2. 性质

3. 联合分布律

五、二维连续性随机变量

1. 定义

2. 性质

3. 求法

边缘分布

一、定义

1. 边缘分布函数

2. 边缘分布律

3. 边缘概率密度

条件分布

一、条件分布律的定义

二、条件概率密度的定义

三、两种重要的二维连续性随机变量

1. 均匀分布

2. 二维正态分布

四、随机变量的相互独立

1. 定义

2. 充要条件

样本点	$1$	$2$	$3$	$4$	$5$	$6$	$7$	$8$	$9$	$10$
$D$	$1$	$2$	$2$	$3$	$2$	$4$	$2$	$4$	$3$	$4$
$F$	$0$	$1$	$1$	$1$	$1$	$2$	$1$	$1$	$1$	$2$