【概率论基础进阶】随机变量及其分布-随机变量及其分布函数

273 阅读4分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

 

一、分布律

定义:在样本空间Ω\Omega上的实值函数X=X(ω)X=X(\omega),称X(ω),ωΩX(\omega),\omega \in \Omega,称X(ω)X(\omega)为随机变量,简记XX

注:X(ω)X(\omega)的定义域是Ω\Omega,常用X,Y,ZX,Y,Z等表示随机变量

 

定义:如果一个随机变量的可能取值是有限多个或可数无穷多个,则称它为离散型随机变量

 

定义:设离散型随机变量XX的可能取值是x1,x2,,xn,x_{1},x_{2},\cdots,x_{n},\cdotsXX取各可能值的概率为

P{X=xk}=pk,k=1,2, P \left\{X=x_{k}\right\}=p_{k},k=1,2,\cdots

称上式为离散型随机变量XX的概率分布或分布律

分布律也有用列表方式给出的

 

XXx1x_{1}x2x_{2}x3x_{3}\cdotsxnx_{n}\cdots
PPp1p_{1}p2p_{2}p3p_{3}\cdotspnp_{n}\cdots        

 

或者

X[x1x2 xn p1p2 pn] X \sim \begin{bmatrix} x_{1} & x_{2} & \cdots  & x_{n} & \cdots  \\ p_{1} & p_{2} & \cdots  & p_{n} & \cdots \end{bmatrix}

这里只给出XX可能取值可数无穷多个的情形。不难给出XX有限个可能取值的情形

 

严格来说,P(A)P(A)即用()()括起来的应该是事件,P{X=xk}P \left\{X=x_{k}\right\}即用{}\left\{\right\}括起来的应该是随机变量

 

分布律性质

  • pk0,k=1,2,p_{k}\geq 0,k=1,2,\cdots

  • k=1pk=1\sum\limits_{k=1 }^{\infty}p_{k}=1

 

二、分布函数

定义:设XX是一个随机变量,对于任意实数xx,记函数

F(x)=P{Xx},<x<+ F(x)=P \left\{X \leq x\right\},-\infty <x < +\infty

F(x)F(x)为随机变量XX的分布函数

分布函数F(x)F(x)是定义在(,+)(-\infty,+\infty)上的一个实值函数,F(x)F(x)的值等于随机变量XX在区间(,x](-\infty,x]内取值的概率,即事件XxX \leq x的概率

 

注意P{Xx}P \left\{X \leq x\right\}有等号

注意几个定义P(A),X(ω),F(x)P(A),X(\omega),F(x)

 

分布函数的性质

  1. 0F(x)10\leq F(x)\leq1

  2. F(x)F(x)是单调非减函数,即当x1x2x_{1}\leq x_{2}时,F(x1)F(x2)F(x_{1})\leq F(x_{2})

  3. limxF(x)=0\lim\limits_{x\to-\infty}F(x)=0,记为F()=0F(-\infty)=0limx+F(x)=1\lim\limits_{x\to+\infty}F(x)=1,记为F(+)=1F(+\infty)=1

  4. F(x)F(x)是右连续的,即F(x+0)=F(x)F(x+0)=F(x)

 

上述四条性质是函数F(x)F(x)成为某一随机变量分布函数的充要条件

 

做题的时候常先用第三条

对于第四条

用简单的扔硬币试验来辅助说明,把正面朝上赋值为X=0,把反面朝上赋值为X=1,(不考虑硬币立起来)。那么这个试验结果的概率的分布函数为下图:

![[附件/Pasted image 20220904101042.png|300]]

为什么最左侧红线落在负无穷到零的开区间,因为开区间的含义是无限趋近,P{X≤0}与P{X≤x | x趋向于零但不等于零}  二者在概念上有本质区别。也就是说,因为含义不同,导致计算范围不同,最终导致概率不一样。

当x趋向于零但不等于零时(X<0等价于X≤x时x趋向于零但不等于零),它的概率对于抛硬币试验来说一定是零。但是X≤0,含义和范围就发生了变化,变成了 X<0 或者 X=0,也就是不管是 X<0 还是 X=0 都算作这个事件发生了,行话讲叫和事件,所以概率就是0+0.5=0.5而不是0了。正是分布函数经过跳跃间断点时含义发生变化的特点,导致概率分布函数是右连续的。

作者:阿狸的一百种玩法

链接:为什么概率分布函数是右连续?个人对概率的理解 - 哔哩哔哩 (bilibili.com)

 

  1. 对任意的x1<x2x_{1}<x_{2},有P{x1<Xx2}=F(x2)F(x1)P \left\{x_{1}<X\leq x_{2}\right\}=F(x_{2})-F(x_{1})

  2. 对任意的xxP{X=x}=F(x)F(x0)P \left\{X=x\right\}=F(x)-F(x-0)

 

F(x)F(x)xx处时连续时,F(x)F(x0)=0F(x)-F(x-0)=0,根据性质5.5.就有P{X=x}=0P \left\{X=x\right\}=0

 

例1:从1,2,3,41,2,3,4中随机取22个数,则其中的小者XX的分布律为()

 

从四个数中取两个有C42C_{4}^{2}中情况,以选两个数为思考角度,有

P{X=1}=C31C11C42=12P{X=2}=C21C11C42=16P{X=3}=C11C11C42=16 \begin{aligned} P \left\{X=1\right\}&=\frac{C_{3}^{1}\cdot C_{1}^{1}}{C_{4}^{2}}=\frac{1}{2}\\ P \left\{X=2\right\}&=\frac{C_{2}^{1}\cdot C_{1}^{1}}{C_{4}^{2}}=\frac{1}{6}\\ P \left\{X=3\right\}&=\frac{C_{1}^{1}\cdot C_{1}^{1}}{C_{4}^{2}}=\frac{1}{6} \end{aligned}

结果为

 

XX11            22            33  
PP12\frac{1}{2}13\frac{1}{3}16\frac{1}{6}   

 

依旧强调之前的,一定要保持分子分母考虑对象相同,例如本题分母任选两个数,分子就是任选两个符合要求的数

 

 

例2:设随机变量XX的分布函数为F(x)={a+b1+xx0cx<0F(x)=\left\{\begin{aligned}&a+ \frac{b}{1+x}&x \geq 0\\ &c&x<0\end{aligned}\right.,其中a,b,ca,b,c为常数,则bb可能的取值范围为()

 

F()=0,F(+)=1F(-\infty)=0,F(+\infty)=1c=0,a=1c=0,a=1,有

1+b1+00b1 1+ \frac{b}{1+0}\geq 0\Rightarrow b \geq -1

F(x)F(x)单调非减,b0b\leq0

 

遇到分布函数性质相关题,一般做题的时候先用第三条,即F()=0,F(+)=1F(-\infty)=0,F(+\infty)=1

 

例3:设F1(x)F_{1}(x)F2(x)F_{2}(x)分别为随机变量X1X_{1}X2X_{2}的分布函数,为使F(x)=aF1(x)bF2(x)F(x)=aF_{1}(x)-bF_{2}(x)也是分布函数,说明a,ba,b满足的条件

 

{F()=aF1()bF2()=0F(+)=aF1(+)bF2(+)=1F(x)=aF1(x)bF2(x)单调不减a>0,b<0 \left\{\begin{aligned}&F(-\infty)=aF_{1}(-\infty)-bF_{2}(-\infty)=0\\ &F(+\infty)=aF_{1}(+\infty)-bF_{2}(+\infty)=1\\ &F(x)=aF_{1}(x)-bF_{2}(x)单调不减 \Rightarrow a>0,b<0\end{aligned}\right.

显然右连续,所以不写了。因此a,ba,b要满足

{ab=1a>0,b<0 \left\{\begin{aligned}&a-b=1\\ &a>0,b<0\end{aligned}\right.

 

三、概率密度

定义:如果对随机变量XX的分布函数F(x)F(x),存在一个非负可积函数f(x)f(x),使得对任意实数xx,都有

F(x)=xf(t)dt,<x<+ F(x)=\int^{x}_{-\infty}f(t)dt,-\infty<x<+\infty

XX为连续型随机变量,函数f(x)f(x)称为XX的概率密度

 

连续型随机变量的F(x)F(x)必连续,但f(x)f(x)不一定是连续的

 

概率密度的性质

  1. f(x)0f(x)\geq0

  2. +f(x)dx=1\int_{-\infty}^{+\infty}f(x)dx=1,即F(+)=1F(+\infty)=1

 

上述条件是函数f(x)f(x)成为某一连续型随机变量的概率密度充要条件。

 

类似分布函数,做题的时候常先用第二条

 

  1. 对任意实数x1<x2x_{1}<x_{2},有P{x1<Xx2}=x1x2f(t)dtP \left\{x_{1}<X \leq x_{2}\right\}=\int_{x_{1}}^{x_{2}}f(t)dt

  2. f(x)f(x)的连续点处有F(x)=f(x)F'(x)=f(x)

 

如果XX是连续型随机变量,则显然有

P{x1<Xx2}=P{x1X<x2}=P{x1<X<x2}=P{x1Xx2} P \left\{x_{1}<X \leq x_{2}\right\}=P \left\{x_{1}\leq X<x_{2}\right\}=P \left\{x_{1}<X<x_{2}\right\}=P \left\{x_{1}\leq X \leq x_{2}\right\}

 

例4:已知f(x)f(x)为概率密度函数,说明f(x)f(-x)也是概率密度函数,f(2x)f(2x)不是概率密度函数

 

做题的时候常先用第二条+f(x)dx=1\int_{-\infty}^{+\infty}f(x)dx=1

 

+f(x)dx=x=t+f(t)d(t)=+f(t)dt=1 \int_{-\infty}^{+\infty}f(-x)dx \overset{-x=t}{=}\int_{+\infty}^{-\infty}f(t)d(-t)=\int_{-\infty}^{+\infty}f(t)dt=1

又有f(x)0f(-x)\geq 0,因此f(x)f(-x)是概率密度函数

+f(2x)dx=2x=t+f(t)dt2=12+f(t)dt=12 \int_{-\infty}^{+\infty}f(2x)dx \overset{2x=t}{=}\int_{+\infty}^{-\infty}f(t)d \frac{t}{2}=\frac{1}{2}\int_{-\infty}^{+\infty}f(t)dt=\frac{1}{2}

显然f(2x)f(2x)不是概率密度函数

 

注意此处,如果

+f(x)dx=+f(x)d(x)F(x)\int_{-\infty}^{+\infty}f(-x)dx=-\int_{-\infty}^{+\infty}f(-x)d(-x)\ne -F(x)

里面的字母不同,不定积分结果相同,但定积分结果不同,应该是

+f(x)dx=+f(x)d(x)=F(x)+=(F()F(+))=(01)=1\begin{aligned} \int_{-\infty}^{+\infty}f(-x)dx&=-\int_{-\infty}^{+\infty}f(-x)d(-x)\\&=-F(-x)\Big|_{-\infty}^{+\infty}\\&=-(F(-\infty)-F(+\infty))\\&=-(0-1)=1\end{aligned}