【概率论基础进阶】随机变量及其分布-随机变量及其分布函数本文已参与「新人创作礼」活动，一起开启掘金创作之路。一、分

本文已参与「新人创作礼」活动，一起开启掘金创作之路。

一、分布律

定义：在样本空间 $\Omega$ 上的实值函数 $X=X(\omega)$ ，称 $X(\omega),\omega \in \Omega$ ，称 $X(\omega)$ 为随机变量，简记 $X$

注： $X(\omega)$ 的定义域是 $\Omega$ ，常用 $X,Y,Z$ 等表示随机变量

定义：如果一个随机变量的可能取值是有限多个或可数无穷多个，则称它为离散型随机变量

定义：设离散型随机变量 $X$ 的可能取值是 $x_{1},x_{2},\cdots,x_{n},\cdots$ ， $X$ 取各可能值的概率为

P \left\{X=x_{k}\right\}=p_{k},k=1,2,\cdots

称上式为离散型随机变量 $X$ 的概率分布或分布律

分布律也有用列表方式给出的

$X$	$x_{1}$	$x_{2}$	$x_{3}$	$\cdots$	$x_{n}$	$\cdots$
$P$	$p_{1}$	$p_{2}$	$p_{3}$	$\cdots$	$p_{n}$	$\cdots$

或者

X \sim \begin{bmatrix} x_{1} & x_{2} & \cdots  & x_{n} & \cdots  \\ p_{1} & p_{2} & \cdots  & p_{n} & \cdots \end{bmatrix}

这里只给出 $X$ 可能取值可数无穷多个的情形。不难给出 $X$ 有限个可能取值的情形

严格来说， $P(A)$ 即用 $()$ 括起来的应该是事件， $P \left\{X=x_{k}\right\}$ 即用 $\left\{\right\}$ 括起来的应该是随机变量

分布律性质

$p_{k}\geq 0,k=1,2,\cdots$
$\sum\limits_{k=1 }^{\infty}p_{k}=1$

二、分布函数

定义：设 $X$ 是一个随机变量，对于任意实数 $x$ ，记函数

F(x)=P \left\{X \leq x\right\},-\infty <x < +\infty

称 $F(x)$ 为随机变量 $X$ 的分布函数

分布函数 $F(x)$ 是定义在 $(-\infty,+\infty)$ 上的一个实值函数， $F(x)$ 的值等于随机变量 $X$ 在区间 $(-\infty,x]$ 内取值的概率，即事件 $X \leq x$ 的概率

注意 $P \left\{X \leq x\right\}$ 有等号

注意几个定义 $P(A),X(\omega),F(x)$

分布函数的性质

$0\leq F(x)\leq1$
$F(x)$ 是单调非减函数，即当 $x_{1}\leq x_{2}$ 时， $F(x_{1})\leq F(x_{2})$
$\lim\limits_{x\to-\infty}F(x)=0$ ，记为 $F(-\infty)=0$ ； $\lim\limits_{x\to+\infty}F(x)=1$ ，记为 $F(+\infty)=1$
$F(x)$ 是右连续的，即 $F(x+0)=F(x)$

上述四条性质是函数 $F(x)$ 成为某一随机变量分布函数的充要条件

做题的时候常先用第三条

对于第四条

用简单的扔硬币试验来辅助说明，把正面朝上赋值为X=0，把反面朝上赋值为X=1，（不考虑硬币立起来）。那么这个试验结果的概率的分布函数为下图：

为什么最左侧红线落在负无穷到零的开区间，因为开区间的含义是无限趋近，P{X≤0}与P{X≤x | x趋向于零但不等于零} 二者在概念上有本质区别。也就是说，因为含义不同，导致计算范围不同，最终导致概率不一样。

当x趋向于零但不等于零时（X<0等价于X≤x时x趋向于零但不等于零），它的概率对于抛硬币试验来说一定是零。但是X≤0，含义和范围就发生了变化，变成了 X<0 或者 X=0，也就是不管是 X<0 还是 X=0 都算作这个事件发生了，行话讲叫和事件，所以概率就是0+0.5=0.5而不是0了。正是分布函数经过跳跃间断点时含义发生变化的特点，导致概率分布函数是右连续的。

作者：阿狸的一百种玩法

链接：为什么概率分布函数是右连续？个人对概率的理解 - 哔哩哔哩 (bilibili.com)

对任意的 $x_{1}<x_{2}$ ，有 $P \left\{x_{1}<X\leq x_{2}\right\}=F(x_{2})-F(x_{1})$
对任意的 $x$ ， $P \left\{X=x\right\}=F(x)-F(x-0)$

当 $F(x)$ 在 $x$ 处时连续时， $F(x)-F(x-0)=0$ ，根据性质 $5.$ 就有 $P \left\{X=x\right\}=0$

例1：从 $1,2,3,4$ 中随机取 $2$ 个数，则其中的小者 $X$ 的分布律为（）

从四个数中取两个有 $C_{4}^{2}$ 中情况，以选两个数为思考角度，有

\begin{aligned} P \left\{X=1\right\}&=\frac{C_{3}^{1}\cdot C_{1}^{1}}{C_{4}^{2}}=\frac{1}{2}\\ P \left\{X=2\right\}&=\frac{C_{2}^{1}\cdot C_{1}^{1}}{C_{4}^{2}}=\frac{1}{6}\\ P \left\{X=3\right\}&=\frac{C_{1}^{1}\cdot C_{1}^{1}}{C_{4}^{2}}=\frac{1}{6} \end{aligned}

结果为

$X$	$1$	$2$	$3$
$P$	$\frac{1}{2}$	$\frac{1}{3}$	$\frac{1}{6}$

依旧强调之前的，一定要保持分子分母考虑对象相同，例如本题分母任选两个数，分子就是任选两个符合要求的数

例2：设随机变量 $X$ 的分布函数为 $F(x)=\left\{\begin{aligned}&a+ \frac{b}{1+x}&x \geq 0\\ &c&x<0\end{aligned}\right.$ ，其中 $a,b,c$ 为常数，则 $b$ 可能的取值范围为（）

由 $F(-\infty)=0,F(+\infty)=1$ ， $c=0,a=1$ ，有

1+ \frac{b}{1+0}\geq 0\Rightarrow b \geq -1

由 $F(x)$ 单调非减， $b\leq0$

遇到分布函数性质相关题，一般做题的时候先用第三条，即 $F(-\infty)=0,F(+\infty)=1$

例3：设 $F_{1}(x)$ 与 $F_{2}(x)$ 分别为随机变量 $X_{1}$ 和 $X_{2}$ 的分布函数，为使 $F(x)=aF_{1}(x)-bF_{2}(x)$ 也是分布函数，说明 $a,b$ 满足的条件

\left\{\begin{aligned}&F(-\infty)=aF_{1}(-\infty)-bF_{2}(-\infty)=0\\ &F(+\infty)=aF_{1}(+\infty)-bF_{2}(+\infty)=1\\ &F(x)=aF_{1}(x)-bF_{2}(x)单调不减 \Rightarrow a>0,b<0\end{aligned}\right.

显然右连续，所以不写了。因此 $a,b$ 要满足

\left\{\begin{aligned}&a-b=1\\ &a>0,b<0\end{aligned}\right.

三、概率密度

定义：如果对随机变量 $X$ 的分布函数 $F(x)$ ，存在一个非负可积函数 $f(x)$ ，使得对任意实数 $x$ ，都有

F(x)=\int^{x}_{-\infty}f(t)dt,-\infty<x<+\infty

称 $X$ 为连续型随机变量，函数 $f(x)$ 称为 $X$ 的概率密度

连续型随机变量的 $F(x)$ 必连续，但 $f(x)$ 不一定是连续的

概率密度的性质

$f(x)\geq0$
$\int_{-\infty}^{+\infty}f(x)dx=1$ ，即 $F(+\infty)=1$

上述条件是函数 $f(x)$ 成为某一连续型随机变量的概率密度充要条件。

类似分布函数，做题的时候常先用第二条

对任意实数 $x_{1}<x_{2}$ ，有 $P \left\{x_{1}<X \leq x_{2}\right\}=\int_{x_{1}}^{x_{2}}f(t)dt$
在 $f(x)$ 的连续点处有 $F'(x)=f(x)$

如果 $X$ 是连续型随机变量，则显然有

P \left\{x_{1}<X \leq x_{2}\right\}=P \left\{x_{1}\leq X<x_{2}\right\}=P \left\{x_{1}<X<x_{2}\right\}=P \left\{x_{1}\leq X \leq x_{2}\right\}

例4：已知 $f(x)$ 为概率密度函数，说明 $f(-x)$ 也是概率密度函数， $f(2x)$ 不是概率密度函数

做题的时候常先用第二条 $\int_{-\infty}^{+\infty}f(x)dx=1$

\int_{-\infty}^{+\infty}f(-x)dx \overset{-x=t}{=}\int_{+\infty}^{-\infty}f(t)d(-t)=\int_{-\infty}^{+\infty}f(t)dt=1

又有 $f(-x)\geq 0$ ，因此 $f(-x)$ 是概率密度函数

\int_{-\infty}^{+\infty}f(2x)dx \overset{2x=t}{=}\int_{+\infty}^{-\infty}f(t)d \frac{t}{2}=\frac{1}{2}\int_{-\infty}^{+\infty}f(t)dt=\frac{1}{2}

显然 $f(2x)$ 不是概率密度函数

注意此处，如果

$\int_{-\infty}^{+\infty}f(-x)dx=-\int_{-\infty}^{+\infty}f(-x)d(-x)\ne -F(x)$

里面的字母不同，不定积分结果相同，但定积分结果不同，应该是

$\begin{aligned} \int_{-\infty}^{+\infty}f(-x)dx&=-\int_{-\infty}^{+\infty}f(-x)d(-x)\\&=-F(-x)\Big|_{-\infty}^{+\infty}\\&=-(F(-\infty)-F(+\infty))\\&=-(0-1)=1\end{aligned}$