【概率论基础进阶】随机变量及其分布-随机变量函数的分布

1,521 阅读2分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

这里个人不是很理解,如果有错误指出一定及时改正

 

XX是一个随机变量,则它的函数Y=g(X)=g[X(ω)]Y=g(X)=g[X(\omega)]也是随机变量

 

XX是离散型随机变量时,设XX的分布律为P{X=xk}=pk,k=1,2,P \left\{X=x_{k}\right\}=p_{k},k=1,2,\cdots,显然YY也是离散型随机变量,其分布律为P{Y=g(xk)}pk,k=1,2,3,P \left\{Y=g(x_{k})\right\}p_{k},k=1,2,3,\cdots,如果在g(xk)g(x_{k})中有相同的数值,则将它们相应的概率和作为YY取该值的概率

XX时连续型随机变量时,设XX的概率密度函数为fX(x)f_{X}(x),显然一般YY也是连续型随机变量,记起概率密度为fY(y)f_{Y}(y),常常用两中方法来计算

  • 公式法:设y=g(x)y=g(x)是单调函数,导数不为零的可导函数,h(y)h(y)为它的反函数,则

         fY(y)={g(y)fX(h(y))α<y<β0其他f_{Y}(y)=\left\{\begin{aligned}&\left|g'(y)\right|f_X(h(y))&\alpha<y<\beta\\&0&其他\end{aligned}\right.

         其中(α,β)(\alpha,\beta)是函数g(x)g(x)xx可能取值的区间上的值域

  • 定义法:先求YY的分布函数FY(y)F_{Y}(y)

         FY(y)=P{Yy}=P{g(X)y}=g(x)yfX(x)dxF_{Y}(y)=P \left\{Y \leq y\right\}=P \left\{g(X)\leq y\right\}=\int\limits_{g(x)\leq y}f_{X}(x)dx

         然后fY(y)=FY(y)f_{Y}(y)=F'_{Y}(y)

 

一般很少用公式法,容易错,要求多,建议使用定义法

定义法要点:

  1. 定义

  2. 范围{离散:取值范围连续:积分范围\left\{\begin{aligned}&离散:取值范围\\&连续:积分范围\end{aligned}\right.

  3. 端点

 

例1:

Xf(x)={13x231x80其他 X \sim f(x)=\left\{\begin{aligned}& \frac{1}{3\sqrt[3]{x^{2}}}&1\leq x \leq 8\\&0&其他\end{aligned}\right.

F(x)F(x)XX的分布函数,求随机变量Y=F(X)Y=F(X)的分布函数

 

F(x)=xf(x)dx={0x<1x311x<818x F(x)=\int_{-\infty}^{x}f(x)dx=\left\{\begin{aligned}&0&x<1\\&\sqrt[3]{x}-1&1\leq x<8\\&1&8\leq x\end{aligned}\right.

Y=F(X)Y=F(X)的分布函数为FY(y)F_{Y}(y)。显然0Y10\leq Y \leq 1

 

这里注意F(X)F(X)还是一个随机变量,称之为随机变量XX的函数。

 

y<0y<0时,

FY(y)=P{Yy}=0 F_{Y}(y)=P \left\{Y \leq y\right\}=0

1<y1<y

FY(y)=1 F_{Y}(y)=1

 

这里可以这样理解,由于XX的概率密度函数f(x)f(x)告诉我们,XX只有可能出现在[1,8][1,8],那么当XX不在该范围时,即X<1,X>8X<1,X>8,其出现的概率为00

由于FF是单增的,经过FF的映射,X<1X<1对应Y=F(X)=0Y=F(X)=0X>8X>8对应Y=F(X)=1Y=F(X)=1,夹在该范围之间由于XX的概率密度函数不为00,分布函数一定有对应的函数曲线,那么经过映射的YY的概率密度也不为00,其分布函数一定也有对应的函数曲线

经过上面的分析,YY的概率密度函数只在[0,1][0,1]不为00,那么所求的分布函数在(,0)(-\infty,0)一定值为00,在(1,+)(1,+\infty)一定值为11

虽然YY对应的概率密度函数和分布函数中间不知道,但两端已经能算出来了

 

0<y<10 < y < 1

FY(y)=定义P{Yy}=P{F(X)y}Y只是X的映射=P{X31y}=P{X(y+1)3}F(x)定义靠=F[(y+1)3]=(y+1)331=y \begin{aligned} F_{Y}(y)&\overset{定义}{=}P \left\{Y \leq y\right\}\\ &=P \left\{F(X)\leq y\right\}\quad Y只是X的映射\\ &=P \left\{\sqrt[3]{X}-1\leq y\right\}\\ &=P \left\{X \leq (y+1)^{3}\right\}\quad 向F(x)定义靠\\ &=F[(y+1)^{3}]\\ &=\sqrt[3]{(y+1)^{3}}-1=y \end{aligned}

因此

FY(y)={0y<0y0y111<y F_{Y}(y)=\left\{\begin{aligned}&0&y<0\\&y&0\leq y \leq 1\\&1&1<y\end{aligned}\right.

 

如果Xf(x)X \sim f(x)的分布函数为F(x)F(x),则Y=F(X)U(0,1)Y=F(X)\sim U(0,1)

证明:

FY(y)=P{Yy}=P{F(X)y}=P{XF1(y)}=F(F1(y))=y\begin{aligned} F_{Y}(y)&=P \left\{Y \leq y\right\}\\&=P \left\{F(X)\leq y\right\}\\&=P \left\{X \leq F^{-1}(y)\right\}\\&=F(F^{-1}(y))=y\end{aligned}

显然上式y(0,1)y \in (0,1)(在此范围内才有Y=F(X)Y=F(X)

 

例2:已知随机变量Xf(x)={xx10其他X \sim f(x)=\left\{\begin{aligned}&|x|&|x|\leq 1\\&0&其他\end{aligned}\right.,求Y=X2+1Y=X^{2}+1的概率密度fY(y)f_{Y}(y)

 

y<1y<1

FY(y)=0 F_{Y}(y)=0

y>2y>2

FY(y)=1 F_{Y}(y)=1

1<y<21<y<2

FY(y)=P{Yy}=P{X2y1}=P{Xy1}=y1y1f(x)dx=20y1xdx=y1 \begin{aligned} F_{Y}(y)&=P \left\{Y \leq y\right\}\\ &=P \left\{X^{2}\leq y-1\right\}\\ &=P \left\{|X|\leq \sqrt{y-1}\right\}\\ &=\int_{-\sqrt{y-1}}^{\sqrt{y-1}}f(x)dx\\ &=2\int_{0}^{\sqrt{y-1}}xdx\\ &=y-1 \end{aligned}

因此

FY(y)={0y<1y11y212<y F_{Y}(y)=\left\{\begin{aligned}&0&y<1\\&y-1&1\leq y \leq 2\\&1&2<y\end{aligned}\right.

求导得

fY(y)=FY(y)={11y20其他 f_{Y}(y)=F'_{Y}(y)=\left\{\begin{aligned}&1&1\leq y \leq 2\\&0&其他\end{aligned}\right.

 

例3:设随机变量XX服从标准正态分布,说明随机变量Y=max{X,2}Y=\max \left\{X,2\right\}的分布函数恰有一个间断点

 

YY的分布函数为FY(y)F_{Y}(y)

y<2y<2时,

FY(y)=0 F_{Y}(y)=0

y>2y>2时,

FY(y)=P{Yy}=P{max(X,2)y}=P{Xy,2y}=P{Xy}=Φ(y) \begin{aligned} F_{Y}(y)&=P \left\{Y \leq y\right\}\\ &=P \left\{\max(X,2)\leq y\right\}\\ &=P \left\{X \leq y,2 \leq y\right\}\\ &=P \left\{X \leq y\right\}\\ &=\Phi (y) \end{aligned}

为保证右连续,条件应为y2y \geq 2,可得

FY(y)={0y<2Φ(y)y2 F_{Y}(y)=\left\{\begin{aligned}&0&y<2\\&\Phi (y)&y \geq 2\end{aligned}\right.

显然有一个间断点在y=2y=2

 

其实和上面的题一样,只是在Y=2Y=2这一点处的概率等于X2X\leq2概率的和,因此会出现间断点,有点类似于离散型随机变量