概率质量函数

430 阅读3分钟

概率论的一个重要应用是描述随机变量。根据取值空间的不同,随机变量可以分为:离散型随机变量和连续型随机变量。

概率质量函数: 离散变量的每个可能的取值都具有大于0的概率,取值和概率之间一一对应的关系就是离散型随机变量的分布规律,也称为概率质量函数。

概率质量函数的重要分布特性:两点分布、二项分布、泊松分布。

两点分布

两点分布:适用于随机试验结果是0或者1的情形,事件发生的概率为ρ\rho,事件不发生的概率为1ρ1-\rho。所以两点分布又称为0-1分布,由于只有两种可能结果的随机试验叫做伯努利试验,所以两点分布也叫做伯努利分布。

两点分布的规律可以写成数学表达式如下:
P(X=k)=ρk(1ρ)1k,0<ρ<1,k=(0,1)P(X=k)=\rho^k\cdot(1-\rho)^{1-k}, 0<\rho<1, k=(0,1)

期望:E(X)=i=1nχiρi=0(1ρ)+1ρ=ρE(X)=\sum_{i=1}^{n}\chi_i\rho_i=0*(1-\rho)+1*\rho=\rho
方差:D(X)=i=1n(χiE(X))2=(0ρ)2(1ρ)+(1ρ)2ρ=ρ(1ρ)D(X)=\sum_{i=1}^{n}(\chi_i-E(X))^2=(0-\rho)^2(1-\rho)+(1-\rho)^2\rho=\rho(1-\rho)

适用场景:任何只有两个结果的随机试验都可以用两点分布描述,如抛掷一次硬币的结果就可以视为等概率的两点分布。

二项分布

二项分布:将满足参数为ρ\rho的两点分布随机试验独立重复n次,事件发生的次数即满足参数为(n,ρ)(n,\rho)的二项分布,也称为n重伯努利试验。

二项分布的表达式如下:
P(X=k)=Cnkρk(1ρ)nk,0<ρ<1,0knP(X=k)=C_n^k\cdot\rho^k\cdot(1-\rho)^{n-k}, 0<\rho<1, 0\leq{k}\leq{n}

期望:E(X)=nE2(X)=nρE(X)=n\cdot{E_2(X)}=n\rho
方差:D(X)=nD2(X)=nρ(1ρ)D(X)=n\cdot{D_2(X)}=n\rho(1-\rho)

适用场景:我们研究的对象只产生两种结果,他们的分布规律就是二项分布。二项分布理论只适用于有放回的抽象,但是当n很大时,也可近似用于无放回抽样。

泊松分布

泊松分布:它表示在一个固定的时间段或空间中,一定数量的事件发生的概率,这些事件以一个已知的常数平均速率发生,并且独立于与上一个事件的间隔发生时间。如:放射性物质在规定时间内释放出的粒子数所满足的分布。

泊松分布的数学表达式如下:
P(X=k)=eλλkkP(X=k)=\frac{e^{-\lambda}\lambda^k}{k\bot}

参数λ\lambda是单位时间内随机事件的平均发生概率。

期望:E(X)=λE(X)=\lambda
方差:D(X)=λD(X)=\lambda

适用场景:泊松分布适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内受到的服务请求的次数,电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、自然灾害发生的次数、DNA序列的变异数、放射性原子核的衰变数、激光的光子数分布等等。

总结

本篇主要介绍概率论中随机变量离散分布规律的概率质量函数,并重点说明了几种常见的分布特性。应用中更多的场景可能会使用连续分布,下篇介绍随机变量连续分布规律的概率密度函数。