Distributions

70 阅读4分钟

分布

泊松分布

泊松分布是一种概率分布,用来描述在一个固定时间段内,某个事件发生的次数。它通常被用于描述一个单位时间内某种现象发生的次数,比如一个小时内某个地区的交通事故数量,或者一天内某个网站收到的点击量。

泊松分布的概率质量函数为:

P(X=k)=λkeλk!,k=0,1,2,P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k=0, 1, 2, \ldots

其中,XX 表示事件在一个固定时间段内发生的次数,λ\lambda 是这个事件在单位时间内的平均发生率。可以看出,泊松分布的参数 λ\lambda(也叫做均值参数)和方差相等。

我们可以用泊松分布来回答各种关于事件发生次数的问题,例如:

  • 在一个小时内平均有 10 个人光顾某个商店,那么特定的一个小时内,这个商店的顾客数为 0 的概率是多少?
  • 在一个小时内平均发生 2 次交通事故,那么在特定的一个小时内,发生了 4 起或者更多的交通事故的概率是多少?

通过使用泊松分布,我们可以计算这些问题的概率,并对这些概率进行建模和分析。

##正态分布(高斯分布)

Beta分布

Beta分布是概率论和统计学中一种重要的概率分布,它在概率密度函数形式上由两个参数α和β控制。Beta分布的定义域是在区间[0, 1]上。

Beta分布的概率密度函数(PDF)表示为:

f(x;α,β)=1B(α,β)xα1(1x)β1f(x;\alpha,\beta) = \frac{1}{B(\alpha,\beta)} \cdot x^{\alpha-1} \cdot (1-x)^{\beta-1}

其中,B(α,β)B(\alpha,\beta)是Beta函数,定义为:

B(α,β)=Γ(α)Γ(β)Γ(α+β)B(\alpha,\beta) = \frac{\Gamma(\alpha)\cdot\Gamma(\beta)}{\Gamma(\alpha+\beta)}

这里的Γ\Gamma表示Gamma函数。

参数α和β控制了Beta分布的形状。当α=β=1时,Beta分布就是均匀分布。当α>1且β>1时,Beta分布呈现出倾向于位于0和1之间的形状,且具有单峰形式。α和β的值越大,分布越集中。

Beta分布还具有一些重要的性质:

  1. 期望值:Beta分布的期望值为αα+β\frac{\alpha}{\alpha+\beta}

  2. 方差:Beta分布的方差为αβ(α+β)2(α+β+1)\frac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}

  3. Beta分布是共轭先验分布:当使用Beta分布作为先验分布,并结合似然函数,后验分布仍然是Beta分布。这种性质使得Beta分布在贝叶斯推断中非常有用。

  4. Beta分布可以用于描述概率参数的不确定性。例如,在二项分布的贝叶斯推断中,可以使用Beta分布作为参数的先验分布,然后通过观测数据来更新参数的后验分布。

Beta分布在许多领域都有广泛的应用,特别是在概率模型、贝叶斯统计和机器学习中。它可以用于建模概率事件的成功率、点击率、转化率等。

均匀分布 (uniform)

均匀分布是一种连续型概率分布,表示在一个给定的区间内,每个数值出现的概率是相等的。因此也被称为矩形分布。这种分布用于描述一些随机实验中某个随机变量的取值范围与每个取值发生的可能性相等的情况,例如在抛硬币、投骰子、随机抽取等各种随机实验中,每个结果出现的概率都是相等的。 均匀分布在统计学和概率论中有广泛的应用,特别是在模拟和随机抽样中。

均匀分布可以用一个简单的公式来描述:

在区间 [a,b][a, b] 内,均匀分布的概率密度函数 f(x)f(x) 可以表示为:

f(x)={1baif axb0otherwisef(x)= \begin{cases} \frac{1}{b-a} & \text{if }a \leq x \leq b\\ 0 & \text{otherwise} \end{cases}

其中,aabb 分别是分布的上限和下限。

均匀分布的累积分布函数 F(x)F(x) 可以表示为:

F(x)={0if x<axabaif axb1if x>bF(x)= \begin{cases} 0 & \text{if } x < a\\ \frac{x-a}{b-a} & \text{if }a \leq x \leq b\\ 1 & \text{if } x > b \end{cases}

均匀分布的期望值(均值)和方差分别为:

E(X)=a+b2E(X) = \frac{a+b}{2}

Var(X)=(ba)212Var(X) = \frac{(b-a)^2}{12}

其中,E(X)E(X) 表示 XX 的期望值,Var(X)Var(X) 表示 XX 的方差。

对于均匀分布,方差的计算公式是:

Var(X)=(ba)212Var(X) = \frac{(b-a)^2}{12}

其中,aabb 分别是均匀分布的上限和下限。

这个公式的推导可以通过使用二阶矩(即 E(X2)E(X^2))的公式进行。具体地,我们有:

E(X2)=x2f(x)dxE(X^2) = \int_{-\infty}^{\infty} x^2 f(x) dx

对于均匀分布,f(x)f(x) 在区间 [a,b][a, b] 内为常数 1ba\frac{1}{b-a},在区间外为 00,因此有:

E(X2)=abx21badxE(X^2) = \int_{a}^{b} x^2 \frac{1}{b-a} dx

计算上式的积分后,我们得到:

E(X2)=13(b3a3)/(ba)=b2+ab+a23E(X^2) = \frac{1}{3}(b^3 - a^3)/(b-a) = \frac{b^2+ab+a^2}{3}

然后,我们可以计算出 Var(X)Var(X),即:

Var(X)=E(X2)[E(X)]2=(ba)212Var(X) = E(X^2) - [E(X)]^2 = \frac{(b-a)^2}{12}

因此,我们可以得出结论,均匀分布的方差为 (ba)212\frac{(b-a)^2}{12}

a=0a=0b=1b=1 时,我们称其为标准均匀分布,其概率密度函数为:

f(x)={1if 0x10otherwisef(x)= \begin{cases} 1 & \text{if } 0 \leq x \leq 1\\ 0 & \text{otherwise} \end{cases}

标准均匀分布的期望值和方差分别为:

E(X)=12E(X) = \frac{1}{2}

Var(X)=112Var(X) = \frac{1}{12}

均匀分布在统计学和概率论中有许多应用,例如在随机抽样、模拟和优化等领域。

均匀分布的特点是,在分布区间内,每个数值出现的概率相等,这使得它在模拟实验、随机抽样、随机模拟等方面有着广泛的应用。

伯努利分布

二项分布

指数分布

Gamma 分布

学生 t 分布

F 分布