概率论基础教程第2章概率论公理

62 阅读10分钟

第2章 概率论公理

2.1 引言

概率概念的建立需先掌握样本空间和事件的定义。本章通过公理化方法定义概率,避免相对频率定义的缺陷(如极限存在性和一致性问题),为概率论提供严格数学基础。

2.2 样本空间和事件

核心定义

  • 样本空间 SS:试验所有可能结果的集合。
    示例:
    • 掷两枚硬币:S={(H,H),(H,T),(T,H),(T,T)}S = \{(H,H), (H,T), (T,H), (T,T)\}
    • 掷两枚骰子:S={(i,j)i,j=1,2,3,4,5,6}S = \{(i,j) \mid i,j = 1,2,3,4,5,6\}
    • 晶体管寿命:S={x0x<}S = \{x \mid 0 \leq x < \infty\}
  • 事件:样本空间 SS 的子集。事件发生当试验结果属于该子集。
    示例:
    • 掷两枚硬币,事件 E={(H,H),(H,T)}E = \{(H,H), (H,T)\} 表示"第一枚硬币正面朝上"。
    • 掷两枚骰子,事件 E={(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)}E = \{(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)\} 表示"点数之和为7"。

事件运算

  • 并(EFE \cup F:发生当 EEFF 发生。
  • 交(EFE \cap FEFEF:发生当 EEFF 同时发生;若 EF=E \cap F = \emptyset,则 EEFF 互不相容。
  • 补(EcE^c:发生当 EE 不发生;Sc=S^c = \emptyset
  • 子集(EFE \subset FEE 发生蕴含 FF 发生。

德摩根律

(i=1nEi)c=i=1nEic,(i=1nEi)c=i=1nEic\left( \bigcup_{i=1}^n E_i \right)^c = \bigcap_{i=1}^n E_i^c, \quad \left( \bigcap_{i=1}^n E_i \right)^c = \bigcup_{i=1}^n E_i^c

证明
第一部分:证明 (i=1nEi)c=i=1nEic\left( \bigcup_{i=1}^n E_i \right)^c = \bigcap_{i=1}^n E_i^c

要证明两个集合相等,需验证双向包含关系:

  1. 证明 (i=1nEi)ci=1nEic\left( \bigcup_{i=1}^n E_i \right)^c \subseteq \bigcap_{i=1}^n E_i^c
    取任意 x(i=1nEi)cx \in \left( \bigcup_{i=1}^n E_i \right)^c,则 xi=1nEix \notin \bigcup_{i=1}^n E_i
    根据并集定义,xx 不属于任何 EiE_ii=1,2,,ni=1,2,\dots,n),即对所有 iixEix \notin E_i
    由补集定义,xEicx \in E_i^c 对所有 ii 成立,故 xi=1nEicx \in \bigcap_{i=1}^n E_i^c

  2. 证明 i=1nEic(i=1nEi)c\bigcap_{i=1}^n E_i^c \subseteq \left( \bigcup_{i=1}^n E_i \right)^c
    取任意 xi=1nEicx \in \bigcap_{i=1}^n E_i^c,则 xEicx \in E_i^c 对所有 ii 成立。
    即对所有 iixEix \notin E_i,故 xi=1nEix \notin \bigcup_{i=1}^n E_i
    由补集定义,x(i=1nEi)cx \in \left( \bigcup_{i=1}^n E_i \right)^c

第二部分:证明 (i=1nEi)c=i=1nEic\left( \bigcap_{i=1}^n E_i \right)^c = \bigcup_{i=1}^n E_i^c

可直接证明或利用第一部分结果:

  • 由第一部分,(i=1nEic)c=i=1n(Eic)c=i=1nEi\left( \bigcup_{i=1}^n E_i^c \right)^c = \bigcap_{i=1}^n (E_i^c)^c = \bigcap_{i=1}^n E_i
  • 对两边取补:((i=1nEic)c)c=(i=1nEi)c\left( \left( \bigcup_{i=1}^n E_i^c \right)^c \right)^c = \left( \bigcap_{i=1}^n E_i \right)^c
  • (Ec)c=E(E^c)^c = E,得 i=1nEic=(i=1nEi)c\bigcup_{i=1}^n E_i^c = \left( \bigcap_{i=1}^n E_i \right)^c

实际计算示例

例1:掷两枚硬币
样本空间 S={(H,H),(H,T),(T,H),(T,T)}S = \{(H,H), (H,T), (T,H), (T,T)\}

  • 定义事件:
    E1={(H,H),(H,T)}E_1 = \{(H,H), (H,T)\}(第一枚正面),
    E2={(H,H),(T,H)}E_2 = \{(H,H), (T,H)\}(第二枚正面)。
  • 计算:
    E1E2={(H,H),(H,T),(T,H)}E_1 \cup E_2 = \{(H,H), (H,T), (T,H)\}(至少一枚正面),
    (E1E2)c={(T,T)}(E_1 \cup E_2)^c = \{(T,T)\}
    E1c={(T,H),(T,T)}E_1^c = \{(T,H), (T,T)\}E2c={(H,T),(T,T)}E_2^c = \{(H,T), (T,T)\}
    E1cE2c={(T,T)}E_1^c \cap E_2^c = \{(T,T)\}
  • 验证:(E1E2)c=E1cE2c={(T,T)}(E_1 \cup E_2)^c = E_1^c \cap E_2^c = \{(T,T)\}

例2:掷三枚硬币
样本空间 S={HHH,HHT,HTH,HTT,THH,THT,TTH,TTT}S = \{HHH, HHT, HTH, HTT, THH, THT, TTH, TTT\}

  • 定义事件:
    E1={HHH,HHT,HTH,HTT}E_1 = \{HHH, HHT, HTH, HTT\}(第一枚正面),
    E2={HHH,HHT,THH,THT}E_2 = \{HHH, HHT, THH, THT\}(第二枚正面),
    E3={HHH,HTH,THH,TTH}E_3 = \{HHH, HTH, THH, TTH\}(第三枚正面)。
  • 计算:
    E1E2E3={HHH,HHT,HTH,HTT,THH,THT,TTH}E_1 \cup E_2 \cup E_3 = \{HHH, HHT, HTH, HTT, THH, THT, TTH\}(至少一枚正面),
    (E1E2E3)c={TTT}(E_1 \cup E_2 \cup E_3)^c = \{TTT\}
    E1c={THH,THT,TTH,TTT}E_1^c = \{THH, THT, TTH, TTT\}
    E2c={HTH,HTT,TTH,TTT}E_2^c = \{HTH, HTT, TTH, TTT\}
    E3c={HHT,HTT,THT,TTT}E_3^c = \{HHT, HTT, THT, TTT\}
    E1cE2cE3c={TTT}E_1^c \cap E_2^c \cap E_3^c = \{TTT\}
  • 验证:(E1E2E3)c=E1cE2cE3c={TTT}(E_1 \cup E_2 \cup E_3)^c = E_1^c \cap E_2^c \cap E_3^c = \{TTT\}

2.3 概率论公理

公理系统(对样本空间 SS 的事件 EE 定义概率 P(E)P(E)

  1. 0P(E)10 \leq P(E) \leq 1(概率值在 [0,1][0,1] 区间)。
  2. P(S)=1P(S) = 1(必然事件概率为 11)。
  3. 对互不相容事件序列 {Ei}\{E_i\}(即 iji \neq jEiEj=E_i \cap E_j = \emptyset),有 P(i=1Ei)=i=1P(Ei)P\left( \bigcup_{i=1}^\infty E_i \right) = \sum_{i=1}^\infty P(E_i)

重要推导

  • P()=0P(\emptyset) = 0
    证明:取 E1=SE_1 = SEi=E_i = \emptyseti>1i > 1),则 S=i=1EiS = \bigcup_{i=1}^\infty E_i。由公理 3:

    P(S)=P(S)+i=2P()    1=1+i=2P()    P()=0.P(S) = P(S) + \sum_{i=2}^\infty P(\emptyset) \implies 1 = 1 + \sum_{i=2}^\infty P(\emptyset) \implies P(\emptyset) = 0.
  • 有限可加性:对互不相容事件 E1,,EnE_1, \dots, E_n,有 P(i=1nEi)=i=1nP(Ei)P\left( \bigcup_{i=1}^n E_i \right) = \sum_{i=1}^n P(E_i)(由公理 3 令 Ei=E_i = \emptyseti>ni > n)即得)。

例题

  • 例 3a:掷硬币试验。

    • 公平硬币:P({H})=P({T})=12P(\{H\}) = P(\{T\}) = \frac{1}{2}
    • 有偏硬币(正面概率为反面的 2 倍):P({H})=23P(\{H\}) = \frac{2}{3}P({T})=13P(\{T\}) = \frac{1}{3}
  • 例 3b:掷骰子试验(等可能结果)。
    P({1})=P({2})==P({6})=16P(\{1\}) = P(\{2\}) = \cdots = P(\{6\}) = \frac{1}{6},故点数为偶数的概率:

    P({2,4,6})=P({2})+P({4})+P({6})=16+16+16=12.P(\{2,4,6\}) = P(\{2\}) + P(\{4\}) + P(\{6\}) = \frac{1}{6} + \frac{1}{6} + \frac{1}{6} = \frac{1}{2}.

技术注释 当样本空间不可数时,概率仅定义在可测事件上,但实际应用中所有事件均可测,故无实质影响。公理化方法确保概率定义严谨,且支持大数定律(事件频率以概率 1 收敛于 P(E)P(E))。

2.4 几个简单命题

核心命题

P(Ec)=1P(E)P(E^c) = 1 - P(E)

证明
由于 EEEcE^c 互不相容且 EEc=SE \cup E^c = S,由公理 2 和公理 3:

1=P(S)=P(EEc)=P(E)+P(Ec)1 = P(S) = P(E \cup E^c) = P(E) + P(E^c)

移项即得 P(Ec)=1P(E)P(E^c) = 1 - P(E)

应用示例:掷硬币时若正面概率为 3/83/8,则反面概率为 13/8=5/81 - 3/8 = 5/8

如果 EFE \subset F,那么 P(E)P(F)P(E) \leq P(F)

证明
由于 EFE \subset F,可将 FF 表示为:

F=EEcFF = E \cup E^c F

其中 EEEcFE^c F 互不相容,由公理 3:

P(F)=P(E)+P(EcF)P(F) = P(E) + P(E^c F)

由于 P(EcF)0P(E^c F) \geq 0,因此 P(E)P(F)P(E) \leq P(F)

应用示例:掷骰子时,出现 1 的概率小于等于出现奇数的概率。

P(EF)=P(E)+P(F)P(EF)P(E \cup F) = P(E) + P(F) - P(EF)

证明
首先,EFE \cup F 可表示为互不相容事件 EEEcFE^c F 的并:

P(EF)=P(E)+P(EcF)P(E \cup F) = P(E) + P(E^c F)

又因为 F=EFEcFF = EF \cup E^c F,所以:

P(F)=P(EF)+P(EcF)    P(EcF)=P(F)P(EF)P(F) = P(EF) + P(E^c F) \implies P(E^c F) = P(F) - P(EF)

代入上式即得:

P(EF)=P(E)+P(F)P(EF)P(E \cup F) = P(E) + P(F) - P(EF)

例题 4a: 某人度假带两本书,喜欢第一本的概率为 0.5,喜欢第二本的概率为 0.4,两本都喜欢的概率为 0.3,求两本都不喜欢的概率。


B1B_1B2B_2 分别表示喜欢第一本和第二本书的事件,则:

P(B1B2)=P(B1)+P(B2)P(B1B2)=0.5+0.40.3=0.6P(B_1 \cup B_2) = P(B_1) + P(B_2) - P(B_1 B_2) = 0.5 + 0.4 - 0.3 = 0.6

两本都不喜欢的概率为:

P(B1cB2c)=P((B1B2)c)=1P(B1B2)=0.4P(B_1^c B_2^c) = P((B_1 \cup B_2)^c) = 1 - P(B_1 \cup B_2) = 0.4

容斥恒等式

P(i=1nEi)=i=1nP(Ei)i1<i2P(Ei1Ei2)++(1)r+1i1<i2<<irP(Ei1Ei2Eir)++(1)n+1P(E1E2En)P\left(\bigcup_{i=1}^{n} E_i\right) = \sum_{i=1}^{n} P(E_i) - \sum_{i_1 < i_2} P(E_{i_1} E_{i_2}) + \cdots + (-1)^{r+1} \sum_{i_1 < i_2 < \cdots < i_r} P(E_{i_1} E_{i_2} \cdots E_{i_r}) + \cdots + (-1)^{n+1} P(E_1 E_2 \cdots E_n)

问题:掷三个均匀的骰子,求至少有一个骰子显示 1 点的概率。

: 设:

  • E1E_1:第一个骰子显示 1 点
  • E2E_2:第二个骰子显示 1 点
  • E3E_3:第三个骰子显示 1 点

我们需要计算 P(E1E2E3)P(E_1 \cup E_2 \cup E_3)

根据容斥恒等式:

P(E1E2E3)=P(E1)+P(E2)+P(E3)P(E1E2)P(E1E3)P(E2E3)+P(E1E2E3)P(E_1 \cup E_2 \cup E_3) = P(E_1) + P(E_2) + P(E_3) - P(E_1E_2) - P(E_1E_3) - P(E_2E_3) + P(E_1E_2E_3)

计算各项:

  • P(Ei)=16P(E_i) = \frac{1}{6}(单个骰子显示 1 点的概率),所以 P(Ei)=3×16=12\sum P(E_i) = 3 \times \frac{1}{6} = \frac{1}{2}
  • P(EiEj)=16×16=136P(E_iE_j) = \frac{1}{6} \times \frac{1}{6} = \frac{1}{36}(两个特定骰子都显示 1 点的概率),所以 P(EiEj)=3×136=112\sum P(E_iE_j) = 3 \times \frac{1}{36} = \frac{1}{12}
  • P(E1E2E3)=16×16×16=1216P(E_1E_2E_3) = \frac{1}{6} \times \frac{1}{6} \times \frac{1}{6} = \frac{1}{216}(三个骰子都显示 1 点的概率)

代入公式:

P(E1E2E3)=12112+1216=10821618216+1216=912160.4213P(E_1 \cup E_2 \cup E_3) = \frac{1}{2} - \frac{1}{12} + \frac{1}{216} = \frac{108}{216} - \frac{18}{216} + \frac{1}{216} = \frac{91}{216} \approx 0.4213

验证: 至少有一个骰子显示 1 点的概率 = 1 - 没有骰子显示 1 点的概率

=1(56)3=1125216=91216= 1 - \left(\frac{5}{6}\right)^3 = 1 - \frac{125}{216} = \frac{91}{216}

与容斥

[!IMPORTANT]

详细计算过程

  1. 首先,根据二项式定理:

    (x+y)m=i=0m(mi)xiymi(x + y)^m = \sum_{i=0}^{m} \binom{m}{i} x^i y^{m-i}
  2. x=1x = -1y=1y = 1,代入得:

    (1+1)m=i=0m(mi)(1)i(1)mi(-1 + 1)^m = \sum_{i=0}^{m} \binom{m}{i} (-1)^i (1)^{m-i}
  3. 左边简化为:

    0m=0(当 m>0 时)0^m = 0 \quad \text{(当 } m > 0 \text{ 时)}
  4. 右边为:

    i=0m(mi)(1)i1=i=0m(mi)(1)i\sum_{i=0}^{m} \binom{m}{i} (-1)^i \cdot 1 = \sum_{i=0}^{m} \binom{m}{i} (-1)^i
  5. 因此有:

    i=0m(mi)(1)i=0\sum_{i=0}^{m} \binom{m}{i} (-1)^i = 0
  6. 将求和式展开:

    (m0)(1)0+(m1)(1)1+(m2)(1)2++(mm)(1)m=0\binom{m}{0}(-1)^0 + \binom{m}{1}(-1)^1 + \binom{m}{2}(-1)^2 + \cdots + \binom{m}{m}(-1)^m = 0
  7. 由于 (m0)=1\binom{m}{0} = 1(1)0=1(-1)^0 = 1,所以:

    1(m1)+(m2)(m3)++(1)m(mm)=01 - \binom{m}{1} + \binom{m}{2} - \binom{m}{3} + \cdots + (-1)^m \binom{m}{m} = 0
  8. 移项得到:

    (m1)(m2)+(m3)+(1)m+1(mm)=1\binom{m}{1} - \binom{m}{2} + \binom{m}{3} - \cdots + (-1)^{m+1} \binom{m}{m} = 1

恒等式计算结果一致。

直观解释: 考虑样本空间中某个结果,若它恰好包含在 mm 个事件中(m>0m > 0),则它在 Ei\bigcup E_i 中应被计算一次。在等式右边,它被计算的次数为:

(m1)(m2)+(m3)+(1)m+1(mm)\binom{m}{1} - \binom{m}{2} + \binom{m}{3} - \cdots + (-1)^{m+1} \binom{m}{m}

我们需要证明这个和等于 1。由于 (m0)=1\binom{m}{0} = 1,只需证明:

i=0m(mi)(1)i=0\sum_{i=0}^{m} \binom{m}{i} (-1)^i = 0

这由二项式定理可得:

0=(1+1)m=i=0m(mi)(1)i(1)mi0 = (-1+1)^m = \sum_{i=0}^{m} \binom{m}{i} (-1)^i (1)^{m-i}

因此,容斥恒等式确保每个结果在等式两边被计算的次数相同。

上下界估计

在容斥恒等式中,如果只取前一项,那么得到事件并的概率的一个上界;如果取前两项,那么得到事件并的概率的一个下界;取前 3 项,得到一个上界;取前 4 项,得到一个下界,以此类推。具体而言:

  1. P(i=1nEi)i=1nP(Ei)P\left(\bigcup_{i=1}^{n} E_i\right) \leq \sum_{i=1}^{n} P(E_i)
  2. P(i=1nEi)i=1nP(Ei)i1<i2P(Ei1Ei2)P\left(\bigcup_{i=1}^{n} E_i\right) \geq \sum_{i=1}^{n} P(E_i) - \sum_{i_1 < i_2} P(E_{i_1} E_{i_2})
  3. P(i=1nEi)i=1nP(Ei)i1<i2P(Ei1Ei2)+i1<i2<i3P(Ei1Ei2Ei3)P\left(\bigcup_{i=1}^{n} E_i\right) \leq \sum_{i=1}^{n} P(E_i) - \sum_{i_1 < i_2} P(E_{i_1} E_{i_2}) + \sum_{i_1 < i_2 < i_3} P(E_{i_1} E_{i_2} E_{i_3})

证明思路
首先将 i=1nEi\bigcup_{i=1}^{n} E_i 表示为互不相容事件的并:

i=1nEi=E1E1cE2E1cE2cE3E1cEn1cEn\bigcup_{i=1}^{n} E_i = E_1 \cup E_1^c E_2 \cup E_1^c E_2^c E_3 \cup \cdots \cup E_1^c \cdots E_{n-1}^c E_n

由概率的可加性:

P(i=1nEi)=i=1nP(E1cEi1cEi)P\left(\bigcup_{i=1}^{n} E_i\right) = \sum_{i=1}^{n} P(E_1^c \cdots E_{i-1}^c E_i)

利用 P(Ei)=P(E1cEi1cEi)+P(Eij<iEj)P(E_i) = P(E_1^c \cdots E_{i-1}^c E_i) + P(E_i \cap \bigcup_{j<i} E_j),可得:

P(E1cEi1cEi)=P(Ei)P(Eij<iEj)P(E_1^c \cdots E_{i-1}^c E_i) = P(E_i) - P\left(E_i \cap \bigcup_{j<i} E_j\right)

代入上式:

P(i=1nEi)=i=1nP(Ei)i=1nP(Eij<iEj)P\left(\bigcup_{i=1}^{n} E_i\right) = \sum_{i=1}^{n} P(E_i) - \sum_{i=1}^{n} P\left(E_i \cap \bigcup_{j<i} E_j\right)

由于概率总是非负的,由上式可直接得到不等式 (4.1)。将不等式 (4.1) 应用到 P(j<iEiEj)P\left(\bigcup_{j<i} E_i E_j\right),可得:

P(j<iEiEj)j<iP(EiEj)P\left(\bigcup_{j<i} E_i E_j\right) \leq \sum_{j<i} P(E_i E_j)

结合上式,即可得到不等式 (4.2)。类似地,将不等式 (4.2) 应用到 P(j<iEiEj)P\left(\bigcup_{j<i} E_i E_j\right),可得:

P(j<iEiEj)j<iP(EiEj)k<j<iP(EiEjEk)P\left(\bigcup_{j<i} E_i E_j\right) \geq \sum_{j<i} P(E_i E_j) - \sum_{k<j<i} P(E_i E_j E_k)

由此可推导出不等式 (4.3)。其他不等式可通过类似方法证明。

2.5 等可能结果的样本空间

在有限样本空间 S={1,2,,N}S = \{1, 2, \ldots, N\} 中,若所有结果等可能,则:

P({i})=1N,i=1,2,,NP(\{i\}) = \frac{1}{N}, \quad i = 1, 2, \ldots, N

对任意事件 EE

P(E)=ESP(E) = \frac{|E|}{|S|}

其中 E|E| 表示 EE 中元素个数。

例 5a:掷两枚骰子,点数之和为 7 的概率。
:样本空间有 36 种等可能结果,和为 7 的结果有 6 种:(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)(1,6),(2,5),(3,4),(4,3),(5,2),(6,1),故:

P(和为 7)=636=16P(\text{和为 } 7) = \frac{6}{36} = \frac{1}{6}

例 5b:碗中有 6 个白球、5 个黑球,随机取 3 个,恰好 1 白 2 黑的概率。

  • 有序取法:3×(6×5×4)11×10×9=360990=411\frac{3 \times (6 \times 5 \times 4)}{11 \times 10 \times 9} = \frac{360}{990} = \frac{4}{11}
  • 无序取法:(61)(52)(113)=6×10165=411\frac{\binom{6}{1}\binom{5}{2}}{\binom{11}{3}} = \frac{6 \times 10}{165} = \frac{4}{11}

例 5c:从 6 男 9 女中选 5 人组成委员会,恰好 3 男 2 女的概率。

P=(63)(92)(155)=20×363003=2401001P = \frac{\binom{6}{3}\binom{9}{2}}{\binom{15}{5}} = \frac{20 \times 36}{3003} = \frac{240}{1001}

例 5d:坛中有 nn 个球(1 个标记),随机取 kk 个,标记球被取出的概率。

P=(11)(n1k1)(nk)=knP = \frac{\binom{1}{1}\binom{n-1}{k-1}}{\binom{n}{k}} = \frac{k}{n}

例 5e:生日问题 问题:房间有 nn 人,无人同一天生日的概率是多少?当 nn 多大时,此概率小于 1/21/2

P(无人同生日)=365×364××(365n+1)365nP(\text{无人同生日}) = \frac{365 \times 364 \times \cdots \times (365-n+1)}{365^n}

n23n \geq 23 时,此概率小于 1/21/2;当 n=50n = 50 时,至少两人同生日的概率约为 97%97\%

例 5m:配对问题 问题NN 人取帽子,无人拿到自己帽子的概率。 设 EiE_i 表示"第 ii 个人拿到自己帽子"的事件。根据容斥恒等式,至少有一人拿到自己帽子的概率为:

P(i=1NEi)=i=1NP(Ei)i1<i2P(Ei1Ei2)+i1<i2<i3P(Ei1Ei2Ei3)+(1)N+1P(E1E2EN)P\left(\bigcup_{i=1}^{N} E_i\right) = \sum_{i=1}^{N} P(E_i) - \sum_{i_1 < i_2} P(E_{i_1} E_{i_2}) + \sum_{i_1 < i_2 < i_3} P(E_{i_1} E_{i_2} E_{i_3}) - \cdots + (-1)^{N+1} P(E_1 E_2 \cdots E_N)

计算各项

  1. 单个事件的概率 P(Ei)P(E_i)

    • ii 个人拿到自己帽子的概率为 1N\frac{1}{N}
    • 共有 NN 个这样的事件
    • 所以 i=1NP(Ei)=N×1N=1\sum_{i=1}^{N} P(E_i) = N \times \frac{1}{N} = 1
  2. 两个事件交集的概率 P(Ei1Ei2)P(E_{i_1} E_{i_2})

    • i1i_1i2i_2 个人都拿到自己帽子的概率
    • 总的分配方式为 N!N!,满足条件的分配方式为 (N2)!(N-2)!(固定两人,其余人随机排列)
    • 所以 P(Ei1Ei2)=(N2)!N!=1N(N1)P(E_{i_1} E_{i_2}) = \frac{(N-2)!}{N!} = \frac{1}{N(N-1)}
    • 选择两个事件的方式有 (N2)=N(N1)2\binom{N}{2} = \frac{N(N-1)}{2}
    • 所以 i1<i2P(Ei1Ei2)=(N2)×1N(N1)=N(N1)2×1N(N1)=12!\sum_{i_1 < i_2} P(E_{i_1} E_{i_2}) = \binom{N}{2} \times \frac{1}{N(N-1)} = \frac{N(N-1)}{2} \times \frac{1}{N(N-1)} = \frac{1}{2!}
  3. kk 个事件交集的概率 P(Ei1Ei2Eik)P(E_{i_1} E_{i_2} \cdots E_{i_k})

    • kk 个人都拿到自己帽子的概率
    • P(Ei1Ei2Eik)=(Nk)!N!P(E_{i_1} E_{i_2} \cdots E_{i_k}) = \frac{(N-k)!}{N!}
    • 选择 kk 个事件的方式有 (Nk)=N!k!(Nk)!\binom{N}{k} = \frac{N!}{k!(N-k)!}
    • 所以 i1<i2<<ikP(Ei1Ei2Eik)=(Nk)×(Nk)!N!=N!k!(Nk)!×(Nk)!N!=1k!\sum_{i_1 < i_2 < \cdots < i_k} P(E_{i_1} E_{i_2} \cdots E_{i_k}) = \binom{N}{k} \times \frac{(N-k)!}{N!} = \frac{N!}{k!(N-k)!} \times \frac{(N-k)!}{N!} = \frac{1}{k!}

将这些结果代入容斥恒等式:

P(i=1NEi)=k=1N(1)k+11k!=112!+13!14!++(1)N+11N!P\left(\bigcup_{i=1}^{N} E_i\right) = \sum_{k=1}^{N} (-1)^{k+1} \frac{1}{k!} = 1 - \frac{1}{2!} + \frac{1}{3!} - \frac{1}{4!} + \cdots + (-1)^{N+1} \frac{1}{N!}

因此,没有人拿到自己帽子的概率为:

1P(i=1NEi)=1(112!+13!+(1)N+11N!)=k=0N(1)kk!1 - P\left(\bigcup_{i=1}^{N} E_i\right) = 1 - \left(1 - \frac{1}{2!} + \frac{1}{3!} - \cdots + (-1)^{N+1} \frac{1}{N!}\right) = \sum_{k=0}^{N} \frac{(-1)^k}{k!}

NN 较大时的近似值

根据指数函数 exe^x 的泰勒级数展开:

ex=k=0xkk!=1+x1!+x22!+x33!+e^x = \sum_{k=0}^{\infty} \frac{x^k}{k!} = 1 + \frac{x}{1!} + \frac{x^2}{2!} + \frac{x^3}{3!} + \cdots

x=1x = -1,得到:

e1=k=0(1)kk!=111!+12!13!+e^{-1} = \sum_{k=0}^{\infty} \frac{(-1)^k}{k!} = 1 - \frac{1}{1!} + \frac{1}{2!} - \frac{1}{3!} + \cdots

NN 很大时,k=0N(1)kk!\sum_{k=0}^{N} \frac{(-1)^k}{k!} 趋近于 e1e^{-1},即:

k=0N(1)kk!e10.3679\sum_{k=0}^{N} \frac{(-1)^k}{k!} \approx e^{-1} \approx 0.3679

这表明,当人数 NN 足够大时,没有人拿到自己帽子的概率趋近于 e10.3679e^{-1} \approx 0.3679,而不是许多人直觉认为的趋近于 0。

例 5n:10对夫妇坐成一圈问题的详细计算

问题:10对夫妇(共20人)坐成一圈,计算所有妻子都不坐在自己丈夫旁边的概率。

  1. 基本设定
  • 总人数:20人(10对夫妇)
  • 在圆桌排列中,由于旋转等价,固定一个人的位置,其余19人排列,所以总排列数为 (201)!=19!(20-1)! = 19!
  1. 定义事件

EiE_i 表示"第 ii 对夫妇坐在一起"的事件(i=1,2,,10i = 1, 2, \dots, 10

我们需要计算至少有一对夫妇坐在一起的概率 P(i=110Ei)P\left(\bigcup_{i=1}^{10} E_i\right),然后所求概率为 1P(i=110Ei)1 - P\left(\bigcup_{i=1}^{10} E_i\right)

  1. 计算 P(Ei1Ei2Ein)P(E_{i_1} E_{i_2} \cdots E_{i_n})

对于指定的 nn 对夫妇都坐在一起的情况:

  • 将每对夫妇视为一个"块",则总共有 20n20-n 个对象需要排列(nn 个"夫妇块" + 202n20-2n 个单独的人)

  • 在圆桌上,20n20-n 个对象的排列数为 (20n1)!=(19n)!(20-n-1)! = (19-n)! (因为圆桌排列中,固定一个对象的位置,其余 19n19-n 个对象排列)

  • 对于每个"夫妇块",夫妇两人可以有两种排列方式(丈夫左妻子右,或妻子左丈夫右),所以 nn 个"夫妇块"有 2n2^n 种排列方式

  • 因此,指定 nn 对夫妇都坐在一起的排列数为 2n(19n)!2^n \cdot (19-n)!

  • 总的排列数为 19!19!,所以:

    P(Ei1Ei2Ein)=2n(19n)!19!P(E_{i_1} E_{i_2} \cdots E_{i_n}) = \frac{2^n \cdot (19-n)!}{19!}
  • 选择 nn 对夫妇的方式有 (10n)\binom{10}{n}

  1. 应用容斥原理

根据命题 4.4(容斥恒等式):

P(i=110Ei)=n=110(1)n+1(10n)P(Ei1Ei2Ein)P\left(\bigcup_{i=1}^{10} E_i\right) = \sum_{n=1}^{10} (-1)^{n+1} \binom{10}{n} P(E_{i_1} E_{i_2} \cdots E_{i_n})
=n=110(1)n+1(10n)2n(19n)!19!= \sum_{n=1}^{10} (-1)^{n+1} \binom{10}{n} \frac{2^n (19-n)!}{19!}

书中给出的表达式为:

(101)21(18)!(19)!(102)22(17)!(19)!+(103)23(16)!(19)!(1010)2109!(19)!0.6605\binom{10}{1} 2^1 \frac{(18)!}{(19)!} - \binom{10}{2} 2^2 \frac{(17)!}{(19)!} + \binom{10}{3} 2^3 \frac{(16)!}{(19)!} - \dots - \binom{10}{10} 2^{10} \frac{9!}{(19)!} \approx 0.6605
  1. 简化计算

注意到:

(19n)!19!=119×18××(19n+1)\frac{(19-n)!}{19!} = \frac{1}{19 \times 18 \times \cdots \times (19-n+1)}

例如:

  • n=1n=118!19!=119\frac{18!}{19!} = \frac{1}{19}
  • n=2n=217!19!=119×18\frac{17!}{19!} = \frac{1}{19 \times 18}
  • n=3n=316!19!=119×18×17\frac{16!}{19!} = \frac{1}{19 \times 18 \times 17}
  • 以此类推

因此,容斥和可以写为:

P(i=110Ei)=n=110(1)n+1(10n)2n19×18××(19n+1)P\left(\bigcup_{i=1}^{10} E_i\right) = \sum_{n=1}^{10} (-1)^{n+1} \binom{10}{n} \frac{2^n}{19 \times 18 \times \cdots \times (19-n+1)}
  1. 计算结果

书中直接给出了计算结果:

P(i=110Ei)0.6605P\left(\bigcup_{i=1}^{10} E_i\right) \approx 0.6605

因此,所有妻子都不坐在丈夫旁边的概率为:

1P(i=110Ei)10.6605=0.33951 - P\left(\bigcup_{i=1}^{10} E_i\right) \approx 1 - 0.6605 = 0.3395

结论:10对夫妇坐成一圈,所有妻子都不坐在自己丈夫旁边的概率约为0.3395。

2.6 概率·连续集函数

定义

  • 递增序列:事件序列 {En,n1}\{E_n, n \geq 1\} 满足 E1E2EnEn+1E_1 \subset E_2 \subset \cdots \subset E_n \subset E_{n+1} \subset \cdots
  • 递减序列:事件序列 {En,n1}\{E_n, n \geq 1\} 满足 E1E2EnEn+1E_1 \supset E_2 \supset \cdots \supset E_n \supset E_{n+1} \supset \cdots

极限事件

  • {En,n1}\{E_n, n \geq 1\} 是递增序列,则定义:

    limnEn=i=1Ei\lim_{n\to\infty} E_n = \bigcup_{i=1}^{\infty} E_i
  • {En,n1}\{E_n, n \geq 1\} 是递减序列,则定义:

    limnEn=i=1Ei\lim_{n\to\infty} E_n = \bigcap_{i=1}^{\infty} E_i

连续性

如果 {En,n1}\{E_n, n \geq 1\} 是递增或递减事件序列,那么:

limnP(En)=P(limnEn)\lim_{n\to\infty} P(E_n) = P\left(\lim_{n\to\infty} E_n\right)

证明

情况1:递增序列

定义新事件序列 {Fn}\{F_n\}

  • F1=E1F_1 = E_1
  • Fn=En(i=1n1Ei)c=EnEn1cF_n = E_n \left(\bigcup_{i=1}^{n-1} E_i\right)^c = E_n E_{n-1}^c(当 n>1n > 1

FnF_n 由属于 EnE_n 但不属于 EiE_ii<ni < n)的元素组成,且 {Fn}\{F_n\} 是互不相容事件序列,满足:

i=1Fi=i=1Eii=1nFi=i=1nEi\bigcup_{i=1}^{\infty} F_i = \bigcup_{i=1}^{\infty} E_i \quad \text{且} \quad \bigcup_{i=1}^{n} F_i = \bigcup_{i=1}^{n} E_i

因此:

P(i=1Ei)=P(i=1Fi)=i=1P(Fi)P\left(\bigcup_{i=1}^{\infty} E_i\right) = P\left(\bigcup_{i=1}^{\infty} F_i\right) = \sum_{i=1}^{\infty} P(F_i)
=limni=1nP(Fi)=limnP(i=1nFi)=limnP(i=1nEi)= \lim_{n \to \infty} \sum_{i=1}^{n} P(F_i) = \lim_{n \to \infty} P\left(\bigcup_{i=1}^{n} F_i\right) = \lim_{n \to \infty} P\left(\bigcup_{i=1}^{n} E_i\right)
=limnP(En)= \lim_{n \to \infty} P(E_n)

情况2:递减序列

{En}\{E_n\} 是递减序列,则 {Enc}\{E_n^c\} 是递增序列。由情况1可知:

P(i=1Eic)=limnP(Enc)P\left(\bigcup_{i=1}^{\infty} E_i^c\right) = \lim_{n\to\infty} P(E_n^c)

由于 i=1Eic=(i=1Ei)c\bigcup_{i=1}^{\infty} E_i^c = \left(\bigcap_{i=1}^{\infty} E_i\right)^c,所以:

P((i=1Ei)c)=limnP(Enc)P\left(\left(\bigcap_{i=1}^{\infty} E_i\right)^c\right) = \lim_{n\to\infty} P(E_n^c)
1P(i=1Ei)=limn[1P(En)]=1limnP(En)1 - P\left(\bigcap_{i=1}^{\infty} E_i\right) = \lim_{n\to\infty} [1 - P(E_n)] = 1 - \lim_{n\to\infty} P(E_n)
P(i=1Ei)=limnP(En)P\left(\bigcap_{i=1}^{\infty} E_i\right) = \lim_{n\to\infty} P(E_n)

例 6a:概率与悖论

问题:考虑一个无限大的坛子和无限个编号为 1, 2, 3, … 的球,进行以下试验:

  • 在差 1 分到 12 P.M. 时,将 1 到 10 号球放入坛子,并随机取出一个球
  • 在差 1/2 分到 12 P.M. 时,将 11 到 20 号球放入坛子,并随机取出一个球
  • 在差 1/4 分到 12 P.M. 时,将 21 到 30 号球放入坛子,并随机取出一个球
  • 以此类推...

求 12 P.M. 时坛子为空的概率。

EnE_n 表示"进行 nn 次取球后,1 号球仍在坛子里"的事件。则:

P(En)=9×18×27××(9n)10×19×28××(9n+1)=k=1n9k9k+1P(E_n) = \frac{9 \times 18 \times 27 \times \cdots \times (9n)}{10 \times 19 \times 28 \times \cdots \times (9n+1)} = \prod_{k=1}^{n} \frac{9k}{9k+1}

在 12 P.M. 时,1 号球仍在坛子里的事件为 n=1En\bigcap_{n=1}^{\infty} E_n。由于 {En}\{E_n\} 是递减序列,由命题 6.1:

P(n=1En)=limnP(En)=n=19n9n+1P\left(\bigcap_{n=1}^{\infty} E_n\right) = \lim_{n\to\infty} P(E_n) = \prod_{n=1}^{\infty} \frac{9n}{9n+1}

证明 n=19n9n+1=0\prod_{n=1}^{\infty} \frac{9n}{9n+1} = 0

n=19n9n+1=[n=1(1+19n)]1\prod_{n=1}^{\infty} \frac{9n}{9n+1} = \left[\prod_{n=1}^{\infty} \left(1 + \frac{1}{9n}\right)\right]^{-1}

由于:

n=1m(1+19n)>19n=1m1n\prod_{n=1}^{m} \left(1 + \frac{1}{9n}\right) > \frac{1}{9} \sum_{n=1}^{m} \frac{1}{n}

mm \to \infty 且利用调和级数发散性 n=11n=\sum_{n=1}^{\infty} \frac{1}{n} = \infty,可得:

n=1(1+19n)=    n=19n9n+1=0\prod_{n=1}^{\infty} \left(1 + \frac{1}{9n}\right) = \infty \implies \prod_{n=1}^{\infty} \frac{9n}{9n+1} = 0

因此,1 号球在 12 P.M. 时仍在坛子里的概率为 0。类似地,对任意编号 ii 的球,其在 12 P.M. 时仍在坛子里的概率也为 0。

FiF_i 表示"ii 号球在 12 P.M. 时仍在坛子里"的事件,则坛子非空的概率为:

P(i=1Fi)i=1P(Fi)=0P\left(\bigcup_{i=1}^{\infty} F_i\right) \leq \sum_{i=1}^{\infty} P(F_i) = 0

因此,在 12 P.M. 时,坛子为空的概率为 1。

2.7 概率·确信程度的度量

概率不仅可以解释为事件发生的长期相对频率,还可以解释为确信程度的度量(主观概率)。

主观概率:人们对某一陈述的确信程度的度量。例如:

  • "有 90% 的可能性是莎士比亚真的写了《哈姆雷特》"
  • "奥斯瓦德独自暗杀肯尼迪总统的可能性为 80%"

关键点:无论将概率解释为频率还是确信程度,其数学属性都应满足概率论的公理。例如:

  • 如果有 70% 的把握认为《凯撒大帝》的作者是莎士比亚
  • 有 10% 的把握认为作者是马洛
  • 则应该有 80% 的把握认为作者是莎士比亚或马洛

例 7a

问题:假设 1 号和 2 号马各有 20% 的机会获胜,3 号和 4 号马各有 15% 的机会获胜,其余 3 匹各有 10% 的机会获胜。如果进行同等赌注的押赌,是赌"获胜者将是 1, 2, 3 号马之一"还是赌"获胜者将是 1, 5, 6, 7 号马之一"更好?

  • 赌第一种赢的概率:0.2+0.2+0.15=0.550.2 + 0.2 + 0.15 = 0.55
  • 赌第二种赢的概率:0.2+0.1+0.1+0.1=0.50.2 + 0.1 + 0.1 + 0.1 = 0.5

因此,赌第一种更好。

注意:主观概率也应符合概率论的公理。例如,如果某人对以下问题的回答是:

  • 今天下雨的可能性:30%
  • 明天下雨的可能性:40%
  • 今明两天都下雨的可能性:20%
  • 今天或明天会下雨的可能性:60%

这样的回答与概率论公理矛盾(因为 P(AB)=P(A)+P(B)P(AB)=0.3+0.40.2=0.50.6P(A \cup B) = P(A) + P(B) - P(AB) = 0.3 + 0.4 - 0.2 = 0.5 \neq 0.6)。合理的修正可能是:30%, 40%, 10%, 60%。