概率|预备知识|动手学深度学习

77 阅读2分钟

1. 进行 m=500m=500 组实验,每组抽取 n=10n=10 个样本。改变 mmnn,观察和分析实验结果。

image.png

image.png

image.png

采样原则:少量多次

2. 给定两个概率为P(A)P(\mathcal{A})P(B)P(\mathcal{B})的事件,计算P(AB)P(\mathcal{A} \cup \mathcal{B})P(AB)P(\mathcal{A} \cap \mathcal{B})的上限和下限。(提示:使用友元图来展示这些情况。)

在概率论中,事件 A\mathcal{A}B\mathcal{B} 的并集 P(AB)P(\mathcal{A} \cup \mathcal{B}) 和交集 P(AB)P(\mathcal{A} \cap \mathcal{B}) 的计算可以通过友元图(Venn diagram)来直观表示。友元图是一种展示集合之间关系的图形表示方法,特别适用于表示事件的并集和交集。

对于给定的概率 P(A)P(\mathcal{A})P(B)P(\mathcal{B}),以下是计算 P(AB)P(\mathcal{A} \cup \mathcal{B})P(AB)P(\mathcal{A} \cap \mathcal{B}) 的一些基本规则:

  1. 并集的概率 P(AB)P(\mathcal{A} \cup \mathcal{B}) 的计算可以通过以下公式进行: P(AB)=P(A)+P(B)P(AB)P(\mathcal{A} \cup \mathcal{B}) = P(\mathcal{A}) + P(\mathcal{B}) - P(\mathcal{A} \cap \mathcal{B})

  2. 交集的概率 P(AB)P(\mathcal{A} \cap \mathcal{B}) 直接是两个事件同时发生的概率。

为了找到 P(AB)P(\mathcal{A} \cup \mathcal{B})P(AB)P(\mathcal{A} \cap \mathcal{B}) 的上限和下限,我们需要考虑事件 A\mathcal{A}B\mathcal{B} 之间的依赖关系:

  • 如果 A\mathcal{A}B\mathcal{B} 是互斥的(即它们不能同时发生),那么 P(AB)=0P(\mathcal{A} \cap \mathcal{B}) = 0,并且 P(AB)P(\mathcal{A} \cup \mathcal{B}) 的值就是 P(A)+P(B)P(\mathcal{A}) + P(\mathcal{B})。这是 P(AB)P(\mathcal{A} \cup \mathcal{B}) 的最大值。

  • 如果 A\mathcal{A}B\mathcal{B} 是独立的,那么 P(AB)=P(A)P(B)P(\mathcal{A} \cap \mathcal{B}) = P(\mathcal{A}) \cdot P(\mathcal{B})。在这种情况下,P(AB)P(\mathcal{A} \cup \mathcal{B}) 的值会小于 P(A)+P(B)P(\mathcal{A}) + P(\mathcal{B}),因为需要从总和中减去交集的概率。

  • 如果 A\mathcal{A}B\mathcal{B} 既不独立也不互斥,那么 P(AB)P(\mathcal{A} \cap \mathcal{B}) 的值会介于 0 和 P(A)P(B)P(\mathcal{A}) \cdot P(\mathcal{B}) 之间。此时,P(AB)P(\mathcal{A} \cup \mathcal{B}) 的值会介于 P(A)+P(B)P(A)P(B)P(\mathcal{A}) + P(\mathcal{B}) - P(\mathcal{A}) \cdot P(\mathcal{B})P(A)+P(B)P(\mathcal{A}) + P(\mathcal{B}) 之间。

3. 假设我们有一系列随机变量,例如AABBCC,其中BB只依赖于AA,而CC只依赖于BB,能简化联合概率P(A,B,C)P(A, B, C)吗?(提示:这是一个马尔可夫链。)

根据马尔可夫性质,联合概率 P(A,B,C)P(A, B, C) 可以表示为:

P(A,B,C)=P(A)P(BA)P(CB)P(A, B, C) = P(A) \cdot P(B | A) \cdot P(C | B)

这里:

  • P(A)P(A) 是随机变量 AA 的边缘概率。
  • P(BA)P(B | A) 是在给定 AA 的条件下 BB 的条件概率。
  • P(CB)P(C | B) 是在给定 BB 的条件下 CC 的条件概率。

这个简化的表达式利用了链式概率法则,它将联合概率分解为一系列条件概率的乘积,每个条件概率只依赖于它的直接前驱。这种分解大大简化了计算,因为每个条件概率通常比原始的联合概率更容易估计或计算。

在实际应用中,如果我们知道 AABBCC 的概率分布,以及它们之间的转移概率,我们就可以直接计算出联合概率 P(A,B,C)P(A, B, C)

4. 在艾滋病病毒(HIV)检测中,第一个检测更准确。为什么不运行第一个检测两次,而是同时运行第一个和第二个检测?

在贝叶斯统计的框架下,可以将先前检测的结果作为新的证据来更新对患病概率的估计。如果第一次检测的结果是阳性,那么根据贝叶斯定理,可以计算出在考虑第一次检测结果的情况下,第二次检测为阳性的条件概率。这种方法可以结合不同检测的优势,提高疾病预测的准确性。