本文已参与「新人创作礼」活动,一起开启掘金创作之路。
一、分布律
定义:在样本空间Ω上的实值函数X=X(ω),称X(ω),ω∈Ω,称X(ω)为随机变量,简记X
注:X(ω)的定义域是Ω,常用X,Y,Z等表示随机变量
定义:如果一个随机变量的可能取值是有限多个或可数无穷多个,则称它为离散型随机变量
定义:设离散型随机变量X的可能取值是x1,x2,⋯,xn,⋯,X取各可能值的概率为
P{X=xk}=pk,k=1,2,⋯
称上式为离散型随机变量X的概率分布或分布律
分布律也有用列表方式给出的
| X | x1 | x2 | x3 | ⋯ | xn | ⋯ |
|---|
| P | p1 | p2 | p3 | ⋯ | pn | ⋯ |
或者
X∼[x1p1x2p2⋯ ⋯ xnpn⋯ ⋯]
这里只给出X可能取值可数无穷多个的情形。不难给出X有限个可能取值的情形
严格来说,P(A)即用()括起来的应该是事件,P{X=xk}即用{}括起来的应该是随机变量
分布律性质
-
pk≥0,k=1,2,⋯
-
k=1∑∞pk=1
二、分布函数
定义:设X是一个随机变量,对于任意实数x,记函数
F(x)=P{X≤x},−∞<x<+∞
称F(x)为随机变量X的分布函数
分布函数F(x)是定义在(−∞,+∞)上的一个实值函数,F(x)的值等于随机变量X在区间(−∞,x]内取值的概率,即事件X≤x的概率
注意P{X≤x}有等号
注意几个定义P(A),X(ω),F(x)
分布函数的性质
-
0≤F(x)≤1
-
F(x)是单调非减函数,即当x1≤x2时,F(x1)≤F(x2)
-
x→−∞limF(x)=0,记为F(−∞)=0;x→+∞limF(x)=1,记为F(+∞)=1
-
F(x)是右连续的,即F(x+0)=F(x)
上述四条性质是函数F(x)成为某一随机变量分布函数的充要条件
做题的时候常先用第三条
对于第四条
用简单的扔硬币试验来辅助说明,把正面朝上赋值为X=0,把反面朝上赋值为X=1,(不考虑硬币立起来)。那么这个试验结果的概率的分布函数为下图:
![![[附件/Pasted image 20220904101042.png|300]]](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/fdd748dbe08c44f69af2011f28f7fcb8~tplv-k3u1fbpfcp-zoom-in-crop-mark:1512:0:0:0.awebp)
为什么最左侧红线落在负无穷到零的开区间,因为开区间的含义是无限趋近,P{X≤0}与P{X≤x | x趋向于零但不等于零} 二者在概念上有本质区别。也就是说,因为含义不同,导致计算范围不同,最终导致概率不一样。
当x趋向于零但不等于零时(X<0等价于X≤x时x趋向于零但不等于零),它的概率对于抛硬币试验来说一定是零。但是X≤0,含义和范围就发生了变化,变成了 X<0 或者 X=0,也就是不管是 X<0 还是 X=0 都算作这个事件发生了,行话讲叫和事件,所以概率就是0+0.5=0.5而不是0了。正是分布函数经过跳跃间断点时含义发生变化的特点,导致概率分布函数是右连续的。
作者:阿狸的一百种玩法
链接:为什么概率分布函数是右连续?个人对概率的理解 - 哔哩哔哩 (bilibili.com)
-
对任意的x1<x2,有P{x1<X≤x2}=F(x2)−F(x1)
-
对任意的x,P{X=x}=F(x)−F(x−0)
当F(x)在x处时连续时,F(x)−F(x−0)=0,根据性质5.就有P{X=x}=0
例1:从1,2,3,4中随机取2个数,则其中的小者X的分布律为()
从四个数中取两个有C42中情况,以选两个数为思考角度,有
P{X=1}P{X=2}P{X=3}=C42C31⋅C11=21=C42C21⋅C11=61=C42C11⋅C11=61
结果为
| X | 1 | 2 | 3 |
|---|
| P | 21 | 31 | 61 |
依旧强调之前的,一定要保持分子分母考虑对象相同,例如本题分母任选两个数,分子就是任选两个符合要求的数
例2:设随机变量X的分布函数为F(x)=⎩⎨⎧a+1+xbcx≥0x<0,其中a,b,c为常数,则b可能的取值范围为()
由F(−∞)=0,F(+∞)=1,c=0,a=1,有
1+1+0b≥0⇒b≥−1
由F(x)单调非减,b≤0
遇到分布函数性质相关题,一般做题的时候先用第三条,即F(−∞)=0,F(+∞)=1
例3:设F1(x)与F2(x)分别为随机变量X1和X2的分布函数,为使F(x)=aF1(x)−bF2(x)也是分布函数,说明a,b满足的条件
⎩⎨⎧F(−∞)=aF1(−∞)−bF2(−∞)=0F(+∞)=aF1(+∞)−bF2(+∞)=1F(x)=aF1(x)−bF2(x)单调不减⇒a>0,b<0
显然右连续,所以不写了。因此a,b要满足
{a−b=1a>0,b<0
三、概率密度
定义:如果对随机变量X的分布函数F(x),存在一个非负可积函数f(x),使得对任意实数x,都有
F(x)=∫−∞xf(t)dt,−∞<x<+∞
称X为连续型随机变量,函数f(x)称为X的概率密度
连续型随机变量的F(x)必连续,但f(x)不一定是连续的
概率密度的性质
-
f(x)≥0
-
∫−∞+∞f(x)dx=1,即F(+∞)=1
上述条件是函数f(x)成为某一连续型随机变量的概率密度充要条件。
类似分布函数,做题的时候常先用第二条
-
对任意实数x1<x2,有P{x1<X≤x2}=∫x1x2f(t)dt
-
在f(x)的连续点处有F′(x)=f(x)
如果X是连续型随机变量,则显然有
P{x1<X≤x2}=P{x1≤X<x2}=P{x1<X<x2}=P{x1≤X≤x2}
例4:已知f(x)为概率密度函数,说明f(−x)也是概率密度函数,f(2x)不是概率密度函数
做题的时候常先用第二条∫−∞+∞f(x)dx=1
∫−∞+∞f(−x)dx=−x=t∫+∞−∞f(t)d(−t)=∫−∞+∞f(t)dt=1
又有f(−x)≥0,因此f(−x)是概率密度函数
∫−∞+∞f(2x)dx=2x=t∫+∞−∞f(t)d2t=21∫−∞+∞f(t)dt=21
显然f(2x)不是概率密度函数
注意此处,如果
∫−∞+∞f(−x)dx=−∫−∞+∞f(−x)d(−x)=−F(x)
里面的字母不同,不定积分结果相同,但定积分结果不同,应该是
∫−∞+∞f(−x)dx=−∫−∞+∞f(−x)d(−x)=−F(−x)∣∣−∞+∞=−(F(−∞)−F(+∞))=−(0−1)=1