贝叶斯中的先验与后验：以抛硬币为例贝叶斯中的先验与后验：以抛硬币为例核心思想贝叶斯统计的核心是用先验（信念）乘上似然

贝叶斯中的先验与后验：以抛硬币为例

贝叶斯统计的核心是：

\text{后验} = \frac{\text{似然} \times \text{先验}}{\text{证据}}

即：

P(\theta | D) = \frac{P(D | \theta) P(\theta)}{P(D)}

先验代表我们在“看到数据之前”的主观相信。

在抛硬币问题中， $\theta \in [0,1]$ ，自然选择定义在 $[0,1]$ 区间的分布：

👉 Beta 分布：

Beta 分布是一个定义在 $[0,1]$ 区间上的概率分布。它可以表示“某个概率参数的不确定性”。

写作：

\theta \sim \text{Beta}(\alpha, \beta)

公式：

f(\theta; \alpha, \beta) = \frac{\theta^{\alpha - 1}(1 - \theta)^{\beta - 1}}{B(\alpha, \beta)}, \quad 0 \le \theta \le 1

\text{Beta}(\alpha, \beta) \propto \theta^{\alpha - 1}(1 - \theta)^{\beta - 1}

常见示例：

总结： $\alpha + \beta$ 越大，先验越“强”，越相信某个区间； $\alpha + \beta$ 越小，先验越弱，接近无偏见。

实际应用中：

数据来自 二项分布：

P(D | \theta) = \text{Binomial}(n, \theta) = C_n^k \, \theta^k (1 - \theta)^{n - k}

其中：

组合数 $C_n^k$ 与 $\theta$ 无关，因此在贝叶斯更新中通常被省略。

贝叶斯更新公式：

P(\theta | D) \propto P(D | \theta) P(\theta)

将似然和先验代入：

P(\theta | D) \propto \theta^{k} (1 - \theta)^{n - k} \cdot \theta^{\alpha - 1}(1 - \theta)^{\beta - 1}

\Rightarrow P(\theta | D) \propto \theta^{(\alpha + k) - 1}(1 - \theta)^{(\beta + n - k) - 1}

即：

\boxed{\theta | D \sim \text{Beta}(\alpha + k, \beta + n - k)}

这就是 Beta–二项分布的共轭关系：

Beta 分布是二项分布的共轭先验。乘上似然后，后验仍是 Beta 分布（形状参数只更新）。

所谓 共轭分布（Conjugate distribution），是指：

如果先验分布和似然分布的形式相乘后，得到的后验分布仍然是同一个分布族（只是参数不同）。

Example

抛硬币 10 次看到 7 次正面

先验：

\theta \sim \text{Beta}(2, 2)

数据：

D: 7\text{ 正面}, 3\text{ 反面}

后验：

\theta | D \sim \text{Beta}(2 + 7, 2 + 3) = \text{Beta}(9, 5)

蓝色曲线 —— Prior（先验）

橙色曲线 —— Likelihood（似然）

绿色曲线 —— Posterior（后验）

橙色阴影区 —— P(D)（证据）

贝叶斯推断就是：用先验（信念）乘上似然（证据），得到后验（更新的信念）。