第2章 概率论公理
2.1 引言
概率概念的建立需先掌握样本空间和事件的定义。本章通过公理化方法定义概率,避免相对频率定义的缺陷(如极限存在性和一致性问题),为概率论提供严格数学基础。
2.2 样本空间和事件
核心定义
- 样本空间 S:试验所有可能结果的集合。
示例:
- 掷两枚硬币:S={(H,H),(H,T),(T,H),(T,T)}
- 掷两枚骰子:S={(i,j)∣i,j=1,2,3,4,5,6}
- 晶体管寿命:S={x∣0≤x<∞}
- 事件:样本空间 S 的子集。事件发生当试验结果属于该子集。
示例:
- 掷两枚硬币,事件 E={(H,H),(H,T)} 表示"第一枚硬币正面朝上"。
- 掷两枚骰子,事件 E={(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)} 表示"点数之和为7"。
事件运算
- 并(E∪F):发生当 E 或 F 发生。
- 交(E∩F 或 EF):发生当 E 和 F 同时发生;若 E∩F=∅,则 E 与 F 互不相容。
- 补(Ec):发生当 E 不发生;Sc=∅。
- 子集(E⊂F):E 发生蕴含 F 发生。
德摩根律
(i=1⋃nEi)c=i=1⋂nEic,(i=1⋂nEi)c=i=1⋃nEic
证明:
第一部分:证明 (⋃i=1nEi)c=⋂i=1nEic
要证明两个集合相等,需验证双向包含关系:
-
证明 (⋃i=1nEi)c⊆⋂i=1nEic:
取任意 x∈(⋃i=1nEi)c,则 x∈/⋃i=1nEi。
根据并集定义,x 不属于任何 Ei(i=1,2,…,n),即对所有 i,x∈/Ei。
由补集定义,x∈Eic 对所有 i 成立,故 x∈⋂i=1nEic。
-
证明 ⋂i=1nEic⊆(⋃i=1nEi)c:
取任意 x∈⋂i=1nEic,则 x∈Eic 对所有 i 成立。
即对所有 i,x∈/Ei,故 x∈/⋃i=1nEi。
由补集定义,x∈(⋃i=1nEi)c。
第二部分:证明 (⋂i=1nEi)c=⋃i=1nEic
可直接证明或利用第一部分结果:
- 由第一部分,(⋃i=1nEic)c=⋂i=1n(Eic)c=⋂i=1nEi。
- 对两边取补:((⋃i=1nEic)c)c=(⋂i=1nEi)c。
- 由 (Ec)c=E,得 ⋃i=1nEic=(⋂i=1nEi)c。
实际计算示例
例1:掷两枚硬币
样本空间 S={(H,H),(H,T),(T,H),(T,T)}。
- 定义事件:
E1={(H,H),(H,T)}(第一枚正面),
E2={(H,H),(T,H)}(第二枚正面)。
- 计算:
E1∪E2={(H,H),(H,T),(T,H)}(至少一枚正面),
(E1∪E2)c={(T,T)}。
E1c={(T,H),(T,T)},E2c={(H,T),(T,T)},
E1c∩E2c={(T,T)}。
- 验证:(E1∪E2)c=E1c∩E2c={(T,T)}。
例2:掷三枚硬币
样本空间 S={HHH,HHT,HTH,HTT,THH,THT,TTH,TTT}。
- 定义事件:
E1={HHH,HHT,HTH,HTT}(第一枚正面),
E2={HHH,HHT,THH,THT}(第二枚正面),
E3={HHH,HTH,THH,TTH}(第三枚正面)。
- 计算:
E1∪E2∪E3={HHH,HHT,HTH,HTT,THH,THT,TTH}(至少一枚正面),
(E1∪E2∪E3)c={TTT}。
E1c={THH,THT,TTH,TTT},
E2c={HTH,HTT,TTH,TTT},
E3c={HHT,HTT,THT,TTT},
E1c∩E2c∩E3c={TTT}。
- 验证:(E1∪E2∪E3)c=E1c∩E2c∩E3c={TTT}。
2.3 概率论公理
公理系统(对样本空间 S 的事件 E 定义概率 P(E))
- 0≤P(E)≤1(概率值在 [0,1] 区间)。
- P(S)=1(必然事件概率为 1)。
- 对互不相容事件序列 {Ei}(即 i=j 时 Ei∩Ej=∅),有 P(⋃i=1∞Ei)=∑i=1∞P(Ei)。
重要推导
-
P(∅)=0
证明:取 E1=S,Ei=∅(i>1),则 S=⋃i=1∞Ei。由公理 3:
P(S)=P(S)+i=2∑∞P(∅)⟹1=1+i=2∑∞P(∅)⟹P(∅)=0.
-
有限可加性:对互不相容事件 E1,…,En,有 P(⋃i=1nEi)=∑i=1nP(Ei)(由公理 3 令 Ei=∅(i>n)即得)。
例题
技术注释
当样本空间不可数时,概率仅定义在可测事件上,但实际应用中所有事件均可测,故无实质影响。公理化方法确保概率定义严谨,且支持大数定律(事件频率以概率 1 收敛于 P(E))。
2.4 几个简单命题
核心命题
P(Ec)=1−P(E)
证明:
由于 E 和 Ec 互不相容且 E∪Ec=S,由公理 2 和公理 3:
1=P(S)=P(E∪Ec)=P(E)+P(Ec)
移项即得 P(Ec)=1−P(E)。
应用示例:掷硬币时若正面概率为 3/8,则反面概率为 1−3/8=5/8。
如果 E⊂F,那么 P(E)≤P(F)。
证明:
由于 E⊂F,可将 F 表示为:
F=E∪EcF
其中 E 和 EcF 互不相容,由公理 3:
P(F)=P(E)+P(EcF)
由于 P(EcF)≥0,因此 P(E)≤P(F)。
应用示例:掷骰子时,出现 1 的概率小于等于出现奇数的概率。
P(E∪F)=P(E)+P(F)−P(EF)
证明:
首先,E∪F 可表示为互不相容事件 E 和 EcF 的并:
P(E∪F)=P(E)+P(EcF)
又因为 F=EF∪EcF,所以:
P(F)=P(EF)+P(EcF)⟹P(EcF)=P(F)−P(EF)
代入上式即得:
P(E∪F)=P(E)+P(F)−P(EF)
例题 4a:
某人度假带两本书,喜欢第一本的概率为 0.5,喜欢第二本的概率为 0.4,两本都喜欢的概率为 0.3,求两本都不喜欢的概率。
解:
设 B1、B2 分别表示喜欢第一本和第二本书的事件,则:
P(B1∪B2)=P(B1)+P(B2)−P(B1B2)=0.5+0.4−0.3=0.6
两本都不喜欢的概率为:
P(B1cB2c)=P((B1∪B2)c)=1−P(B1∪B2)=0.4
容斥恒等式
P(i=1⋃nEi)=i=1∑nP(Ei)−i1<i2∑P(Ei1Ei2)+⋯+(−1)r+1i1<i2<⋯<ir∑P(Ei1Ei2⋯Eir)+⋯+(−1)n+1P(E1E2⋯En)
问题:掷三个均匀的骰子,求至少有一个骰子显示 1 点的概率。
解:
设:
- E1:第一个骰子显示 1 点
- E2:第二个骰子显示 1 点
- E3:第三个骰子显示 1 点
我们需要计算 P(E1∪E2∪E3)。
根据容斥恒等式:
P(E1∪E2∪E3)=P(E1)+P(E2)+P(E3)−P(E1E2)−P(E1E3)−P(E2E3)+P(E1E2E3)
计算各项:
- P(Ei)=61(单个骰子显示 1 点的概率),所以 ∑P(Ei)=3×61=21
- P(EiEj)=61×61=361(两个特定骰子都显示 1 点的概率),所以 ∑P(EiEj)=3×361=121
- P(E1E2E3)=61×61×61=2161(三个骰子都显示 1 点的概率)
代入公式:
P(E1∪E2∪E3)=21−121+2161=216108−21618+2161=21691≈0.4213
验证:
至少有一个骰子显示 1 点的概率 = 1 - 没有骰子显示 1 点的概率
=1−(65)3=1−216125=21691
与容斥
[!IMPORTANT]
详细计算过程:
-
首先,根据二项式定理:
(x+y)m=i=0∑m(im)xiym−i
-
令 x=−1,y=1,代入得:
(−1+1)m=i=0∑m(im)(−1)i(1)m−i
-
左边简化为:
0m=0(当 m>0 时)
-
右边为:
i=0∑m(im)(−1)i⋅1=i=0∑m(im)(−1)i
-
因此有:
i=0∑m(im)(−1)i=0
-
将求和式展开:
(0m)(−1)0+(1m)(−1)1+(2m)(−1)2+⋯+(mm)(−1)m=0
-
由于 (0m)=1 且 (−1)0=1,所以:
1−(1m)+(2m)−(3m)+⋯+(−1)m(mm)=0
-
移项得到:
(1m)−(2m)+(3m)−⋯+(−1)m+1(mm)=1
恒等式计算结果一致。
直观解释:
考虑样本空间中某个结果,若它恰好包含在 m 个事件中(m>0),则它在 ⋃Ei 中应被计算一次。在等式右边,它被计算的次数为:
(1m)−(2m)+(3m)−⋯+(−1)m+1(mm)
我们需要证明这个和等于 1。由于 (0m)=1,只需证明:
i=0∑m(im)(−1)i=0
这由二项式定理可得:
0=(−1+1)m=i=0∑m(im)(−1)i(1)m−i
因此,容斥恒等式确保每个结果在等式两边被计算的次数相同。
上下界估计:
在容斥恒等式中,如果只取前一项,那么得到事件并的概率的一个上界;如果取前两项,那么得到事件并的概率的一个下界;取前 3 项,得到一个上界;取前 4 项,得到一个下界,以此类推。具体而言:
- P(⋃i=1nEi)≤∑i=1nP(Ei)
- P(⋃i=1nEi)≥∑i=1nP(Ei)−∑i1<i2P(Ei1Ei2)
- P(⋃i=1nEi)≤∑i=1nP(Ei)−∑i1<i2P(Ei1Ei2)+∑i1<i2<i3P(Ei1Ei2Ei3)
证明思路:
首先将 ⋃i=1nEi 表示为互不相容事件的并:
i=1⋃nEi=E1∪E1cE2∪E1cE2cE3∪⋯∪E1c⋯En−1cEn
由概率的可加性:
P(i=1⋃nEi)=i=1∑nP(E1c⋯Ei−1cEi)
利用 P(Ei)=P(E1c⋯Ei−1cEi)+P(Ei∩⋃j<iEj),可得:
P(E1c⋯Ei−1cEi)=P(Ei)−P(Ei∩j<i⋃Ej)
代入上式:
P(i=1⋃nEi)=i=1∑nP(Ei)−i=1∑nP(Ei∩j<i⋃Ej)
由于概率总是非负的,由上式可直接得到不等式 (4.1)。将不等式 (4.1) 应用到 P(⋃j<iEiEj),可得:
P(j<i⋃EiEj)≤j<i∑P(EiEj)
结合上式,即可得到不等式 (4.2)。类似地,将不等式 (4.2) 应用到 P(⋃j<iEiEj),可得:
P(j<i⋃EiEj)≥j<i∑P(EiEj)−k<j<i∑P(EiEjEk)
由此可推导出不等式 (4.3)。其他不等式可通过类似方法证明。
2.5 等可能结果的样本空间
在有限样本空间 S={1,2,…,N} 中,若所有结果等可能,则:
P({i})=N1,i=1,2,…,N
对任意事件 E:
P(E)=∣S∣∣E∣
其中 ∣E∣ 表示 E 中元素个数。
例 5a:掷两枚骰子,点数之和为 7 的概率。
解:样本空间有 36 种等可能结果,和为 7 的结果有 6 种:(1,6),(2,5),(3,4),(4,3),(5,2),(6,1),故:
P(和为 7)=366=61
例 5b:碗中有 6 个白球、5 个黑球,随机取 3 个,恰好 1 白 2 黑的概率。
解:
- 有序取法:11×10×93×(6×5×4)=990360=114
- 无序取法:(311)(16)(25)=1656×10=114
例 5c:从 6 男 9 女中选 5 人组成委员会,恰好 3 男 2 女的概率。
解:
P=(515)(36)(29)=300320×36=1001240
例 5d:坛中有 n 个球(1 个标记),随机取 k 个,标记球被取出的概率。
解:
P=(kn)(11)(k−1n−1)=nk
例 5e:生日问题
问题:房间有 n 人,无人同一天生日的概率是多少?当 n 多大时,此概率小于 1/2?
解:
P(无人同生日)=365n365×364×⋯×(365−n+1)
当 n≥23 时,此概率小于 1/2;当 n=50 时,至少两人同生日的概率约为 97%。
例 5m:配对问题
问题:N 人取帽子,无人拿到自己帽子的概率。
设 Ei 表示"第 i 个人拿到自己帽子"的事件。根据容斥恒等式,至少有一人拿到自己帽子的概率为:
P(i=1⋃NEi)=i=1∑NP(Ei)−i1<i2∑P(Ei1Ei2)+i1<i2<i3∑P(Ei1Ei2Ei3)−⋯+(−1)N+1P(E1E2⋯EN)
计算各项:
-
单个事件的概率 P(Ei):
- 第 i 个人拿到自己帽子的概率为 N1
- 共有 N 个这样的事件
- 所以 ∑i=1NP(Ei)=N×N1=1
-
两个事件交集的概率 P(Ei1Ei2):
- 第 i1 和 i2 个人都拿到自己帽子的概率
- 总的分配方式为 N!,满足条件的分配方式为 (N−2)!(固定两人,其余人随机排列)
- 所以 P(Ei1Ei2)=N!(N−2)!=N(N−1)1
- 选择两个事件的方式有 (2N)=2N(N−1) 种
- 所以 ∑i1<i2P(Ei1Ei2)=(2N)×N(N−1)1=2N(N−1)×N(N−1)1=2!1
-
k 个事件交集的概率 P(Ei1Ei2⋯Eik):
- k 个人都拿到自己帽子的概率
- P(Ei1Ei2⋯Eik)=N!(N−k)!
- 选择 k 个事件的方式有 (kN)=k!(N−k)!N! 种
- 所以 ∑i1<i2<⋯<ikP(Ei1Ei2⋯Eik)=(kN)×N!(N−k)!=k!(N−k)!N!×N!(N−k)!=k!1
将这些结果代入容斥恒等式:
P(i=1⋃NEi)=k=1∑N(−1)k+1k!1=1−2!1+3!1−4!1+⋯+(−1)N+1N!1
因此,没有人拿到自己帽子的概率为:
1−P(i=1⋃NEi)=1−(1−2!1+3!1−⋯+(−1)N+1N!1)=k=0∑Nk!(−1)k
当 N 较大时的近似值:
根据指数函数 ex 的泰勒级数展开:
ex=k=0∑∞k!xk=1+1!x+2!x2+3!x3+⋯
令 x=−1,得到:
e−1=k=0∑∞k!(−1)k=1−1!1+2!1−3!1+⋯
当 N 很大时,∑k=0Nk!(−1)k 趋近于 e−1,即:
k=0∑Nk!(−1)k≈e−1≈0.3679
这表明,当人数 N 足够大时,没有人拿到自己帽子的概率趋近于 e−1≈0.3679,而不是许多人直觉认为的趋近于 0。
例 5n:10对夫妇坐成一圈问题的详细计算
问题:10对夫妇(共20人)坐成一圈,计算所有妻子都不坐在自己丈夫旁边的概率。
- 基本设定
- 总人数:20人(10对夫妇)
- 在圆桌排列中,由于旋转等价,固定一个人的位置,其余19人排列,所以总排列数为 (20−1)!=19!
- 定义事件
设 Ei 表示"第 i 对夫妇坐在一起"的事件(i=1,2,…,10)
我们需要计算至少有一对夫妇坐在一起的概率 P(⋃i=110Ei),然后所求概率为 1−P(⋃i=110Ei)
- 计算 P(Ei1Ei2⋯Ein)
对于指定的 n 对夫妇都坐在一起的情况:
-
将每对夫妇视为一个"块",则总共有 20−n 个对象需要排列(n 个"夫妇块" + 20−2n 个单独的人)
-
在圆桌上,20−n 个对象的排列数为 (20−n−1)!=(19−n)!
(因为圆桌排列中,固定一个对象的位置,其余 19−n 个对象排列)
-
对于每个"夫妇块",夫妇两人可以有两种排列方式(丈夫左妻子右,或妻子左丈夫右),所以 n 个"夫妇块"有 2n 种排列方式
-
因此,指定 n 对夫妇都坐在一起的排列数为 2n⋅(19−n)!
-
总的排列数为 19!,所以:
P(Ei1Ei2⋯Ein)=19!2n⋅(19−n)!
-
选择 n 对夫妇的方式有 (n10) 种
- 应用容斥原理
根据命题 4.4(容斥恒等式):
P(i=1⋃10Ei)=n=1∑10(−1)n+1(n10)P(Ei1Ei2⋯Ein)
=n=1∑10(−1)n+1(n10)19!2n(19−n)!
书中给出的表达式为:
(110)21(19)!(18)!−(210)22(19)!(17)!+(310)23(19)!(16)!−⋯−(1010)210(19)!9!≈0.6605
- 简化计算
注意到:
19!(19−n)!=19×18×⋯×(19−n+1)1
例如:
- 当 n=1:19!18!=191
- 当 n=2:19!17!=19×181
- 当 n=3:19!16!=19×18×171
- 以此类推
因此,容斥和可以写为:
P(i=1⋃10Ei)=n=1∑10(−1)n+1(n10)19×18×⋯×(19−n+1)2n
- 计算结果
书中直接给出了计算结果:
P(i=1⋃10Ei)≈0.6605
因此,所有妻子都不坐在丈夫旁边的概率为:
1−P(i=1⋃10Ei)≈1−0.6605=0.3395
结论:10对夫妇坐成一圈,所有妻子都不坐在自己丈夫旁边的概率约为0.3395。
2.6 概率·连续集函数
定义
- 递增序列:事件序列 {En,n≥1} 满足 E1⊂E2⊂⋯⊂En⊂En+1⊂⋯
- 递减序列:事件序列 {En,n≥1} 满足 E1⊃E2⊃⋯⊃En⊃En+1⊃⋯
极限事件:
-
若 {En,n≥1} 是递增序列,则定义:
n→∞limEn=i=1⋃∞Ei
-
若 {En,n≥1} 是递减序列,则定义:
n→∞limEn=i=1⋂∞Ei
连续性
如果 {En,n≥1} 是递增或递减事件序列,那么:
n→∞limP(En)=P(n→∞limEn)
证明:
情况1:递增序列
定义新事件序列 {Fn}:
- F1=E1
- Fn=En(⋃i=1n−1Ei)c=EnEn−1c(当 n>1)
Fn 由属于 En 但不属于 Ei(i<n)的元素组成,且 {Fn} 是互不相容事件序列,满足:
i=1⋃∞Fi=i=1⋃∞Ei且i=1⋃nFi=i=1⋃nEi
因此:
P(i=1⋃∞Ei)=P(i=1⋃∞Fi)=i=1∑∞P(Fi)
=n→∞limi=1∑nP(Fi)=n→∞limP(i=1⋃nFi)=n→∞limP(i=1⋃nEi)
=n→∞limP(En)
情况2:递减序列
若 {En} 是递减序列,则 {Enc} 是递增序列。由情况1可知:
P(i=1⋃∞Eic)=n→∞limP(Enc)
由于 ⋃i=1∞Eic=(⋂i=1∞Ei)c,所以:
P((i=1⋂∞Ei)c)=n→∞limP(Enc)
1−P(i=1⋂∞Ei)=n→∞lim[1−P(En)]=1−n→∞limP(En)
P(i=1⋂∞Ei)=n→∞limP(En)
例 6a:概率与悖论
问题:考虑一个无限大的坛子和无限个编号为 1, 2, 3, … 的球,进行以下试验:
- 在差 1 分到 12 P.M. 时,将 1 到 10 号球放入坛子,并随机取出一个球
- 在差 1/2 分到 12 P.M. 时,将 11 到 20 号球放入坛子,并随机取出一个球
- 在差 1/4 分到 12 P.M. 时,将 21 到 30 号球放入坛子,并随机取出一个球
- 以此类推...
求 12 P.M. 时坛子为空的概率。
解:
设 En 表示"进行 n 次取球后,1 号球仍在坛子里"的事件。则:
P(En)=10×19×28×⋯×(9n+1)9×18×27×⋯×(9n)=k=1∏n9k+19k
在 12 P.M. 时,1 号球仍在坛子里的事件为 ⋂n=1∞En。由于 {En} 是递减序列,由命题 6.1:
P(n=1⋂∞En)=n→∞limP(En)=n=1∏∞9n+19n
证明 ∏n=1∞9n+19n=0:
n=1∏∞9n+19n=[n=1∏∞(1+9n1)]−1
由于:
n=1∏m(1+9n1)>91n=1∑mn1
令 m→∞ 且利用调和级数发散性 ∑n=1∞n1=∞,可得:
n=1∏∞(1+9n1)=∞⟹n=1∏∞9n+19n=0
因此,1 号球在 12 P.M. 时仍在坛子里的概率为 0。类似地,对任意编号 i 的球,其在 12 P.M. 时仍在坛子里的概率也为 0。
设 Fi 表示"i 号球在 12 P.M. 时仍在坛子里"的事件,则坛子非空的概率为:
P(i=1⋃∞Fi)≤i=1∑∞P(Fi)=0
因此,在 12 P.M. 时,坛子为空的概率为 1。
2.7 概率·确信程度的度量
概率不仅可以解释为事件发生的长期相对频率,还可以解释为确信程度的度量(主观概率)。
主观概率:人们对某一陈述的确信程度的度量。例如:
- "有 90% 的可能性是莎士比亚真的写了《哈姆雷特》"
- "奥斯瓦德独自暗杀肯尼迪总统的可能性为 80%"
关键点:无论将概率解释为频率还是确信程度,其数学属性都应满足概率论的公理。例如:
- 如果有 70% 的把握认为《凯撒大帝》的作者是莎士比亚
- 有 10% 的把握认为作者是马洛
- 则应该有 80% 的把握认为作者是莎士比亚或马洛
例 7a
问题:假设 1 号和 2 号马各有 20% 的机会获胜,3 号和 4 号马各有 15% 的机会获胜,其余 3 匹各有 10% 的机会获胜。如果进行同等赌注的押赌,是赌"获胜者将是 1, 2, 3 号马之一"还是赌"获胜者将是 1, 5, 6, 7 号马之一"更好?
解:
- 赌第一种赢的概率:0.2+0.2+0.15=0.55
- 赌第二种赢的概率:0.2+0.1+0.1+0.1=0.5
因此,赌第一种更好。
注意:主观概率也应符合概率论的公理。例如,如果某人对以下问题的回答是:
- 今天下雨的可能性:30%
- 明天下雨的可能性:40%
- 今明两天都下雨的可能性:20%
- 今天或明天会下雨的可能性:60%
这样的回答与概率论公理矛盾(因为 P(A∪B)=P(A)+P(B)−P(AB)=0.3+0.4−0.2=0.5=0.6)。合理的修正可能是:30%, 40%, 10%, 60%。