二项分布详解:从抛硬币到概率计算
一、基础知识准备
1. 阶乘(Factorial)
阶乘是一个数与比它小的所有正整数的乘积。
- 符号:
n! - 定义:
n! = n × (n-1) × (n-2) × ... × 2 × 1 - 特殊规定:
0! = 1
例子:
5! = 5 × 4 × 3 × 2 × 1 = 120
3! = 3 × 2 × 1 = 6
1! = 1
0! = 1
2. 排列组合(组合数)
- 组合数
C(n,k):从n个不同元素中,不考虑顺序地选取k个元素的方法数。 - 公式:
C(n,k) = n! / [k! × (n-k)!]
例子:从5个学生中选2个参加比赛,有多少种选法?
C(5,2) = 5! / [2! × (5-2)!] = 120 / [2 × 6] = 120 / 12 = 10
3. 概率的乘法和加法规则
-
乘法规则:独立事件同时发生的概率 = 各自概率的乘积
- 例子:抛硬币2次都正面朝上的概率 = 0.5 × 0.5 = 0.25
-
加法规则:互斥事件(不能同时发生)的概率 = 各自概率的和
- 例子:抛硬币1次,正面或反面的概率 = 0.5 + 0.5 = 1
二、二项分布的核心案例:抛5次硬币
案例设定
- 试验:抛一枚均匀硬币5次
- 每次结果:正面(H)或反面(T),概率各为0.5
- 随机变量X:正面朝上的次数
- X的可能值:0, 1, 2, 3, 4, 5
二项分布公式
对于抛n次硬币,恰好有k次正面的概率:
P(X = k) = C(n,k) × pᵏ × (1-p)ⁿ⁻ᵏ
n= 总试验次数 = 5k= 正面次数(0到5)p= 每次试验正面的概率 = 0.5C(5,k)= 从5次抛掷中选k次为正面的方法数
三、详细计算每一个概率
第1步:计算组合数 C(5,k)
| k | C(5,k) 计算 | 结果 |
|---|---|---|
| 0 | 5!/(0!×5!) = 1 | 1 |
| 1 | 5!/(1!×4!) = 120/(1×24) | 5 |
| 2 | 5!/(2!×3!) = 120/(2×6) | 10 |
| 3 | 5!/(3!×2!) = 120/(6×2) | 10 |
| 4 | 5!/(4!×1!) = 120/(24×1) | 5 |
| 5 | 5!/(5!×0!) = 1 | 1 |
第2步:计算每个概率 P(X=k)
通用部分:pᵏ × (1-p)ⁿ⁻ᵏ = 0.5ᵏ × 0.5⁵⁻ᵏ = 0.5⁵ = 1/32 = 0.03125
情况1:X=0(0次正面,5次反面)
P(X=0) = C(5,0) × 0.5⁰ × 0.5⁵
= 1 × 1 × 0.03125
= 0.03125
所有可能结果:TTTTT(只有这1种)
情况2:X=1(1次正面,4次反面)
P(X=1) = C(5,1) × 0.5¹ × 0.5⁴
= 5 × 0.5 × 0.0625
= 5 × 0.03125
= 0.15625
所有可能结果(5种):
HTTTT, THTTT, TTHTT, TTTHT, TTTTH
情况3:X=2(2次正面,3次反面)
P(X=2) = C(5,2) × 0.5² × 0.5³
= 10 × 0.25 × 0.125
= 10 × 0.03125
= 0.3125
部分可能结果(10种中的几种):
HHTTT, HTHTT, HTTHT, HTTTH,
THHTT, THTHT, THTTH,
TTHHT, TTHTH,
TTTHH
情况4:X=3(3次正面,2次反面)
P(X=3) = C(5,3) × 0.5³ × 0.5²
= 10 × 0.125 × 0.25
= 10 × 0.03125
= 0.3125
部分可能结果(10种中的几种):
HHHTT, HHTHT, HHTTH,
HTHHT, HTHTH, HTTHH,
THHHT, THHTH, THTHH,
TTHHH
情况5:X=4(4次正面,1次反面)
P(X=4) = C(5,4) × 0.5⁴ × 0.5¹
= 5 × 0.0625 × 0.5
= 5 × 0.03125
= 0.15625
所有可能结果(5种):
HHHHT, HHHTH, HHTHH, HTHHH, THHHH
情况6:X=5(5次正面,0次反面)
P(X=5) = C(5,5) × 0.5⁵ × 0.5⁰
= 1 × 0.03125 × 1
= 0.03125
所有可能结果:HHHHH(只有这1种)
四、概率分布表与验证
完整的概率分布表
| 正面次数(k) | 计算过程 | 概率P(X=k) | 百分比 |
|---|---|---|---|
| 0 | 1 × 0.03125 | 0.03125 | 3.125% |
| 1 | 5 × 0.03125 | 0.15625 | 15.625% |
| 2 | 10 × 0.03125 | 0.3125 | 31.25% |
| 3 | 10 × 0.03125 | 0.3125 | 31.25% |
| 4 | 5 × 0.03125 | 0.15625 | 15.625% |
| 5 | 1 × 0.03125 | 0.03125 | 3.125% |
验证:所有概率之和应为1
总和 = 0.03125 + 0.15625 + 0.3125 + 0.3125 + 0.15625 + 0.03125
= (0.03125×2) + (0.15625×2) + (0.3125×2)
= 0.0625 + 0.3125 + 0.625
= 1.0000 ✓
五、为什么组合数C(n,k)会出现?
以X=2为例详细解释
当我们要计算"恰好2次正面"的概率时:
-
固定一种特定顺序的概率:比如
HHTTT的概率P(HHTTT) = 0.5 × 0.5 × 0.5 × 0.5 × 0.5 = 0.5⁵ = 0.03125(乘法规则:每次抛掷独立)
-
有多少种不同的顺序:
- 我们需要从5个位置中选出2个位置放"H"
- 剩余3个位置自动放"T"
- 这相当于:从5个位置中选2个,有多少种选法?
- 答案:
C(5,2) = 10种
-
总概率:
P(X=2) = 10 × 0.03125 = 0.3125(加法规则:这10种情况互斥,不能同时发生)
六、二项分布的通用公式总结
对于任何二项试验(n次独立试验,每次成功概率为p):
P(恰好k次成功) = C(n,k) × pᵏ × (1-p)ⁿ⁻ᵏ
记忆技巧:
- C(n,k) :有多少种不同的成功/失败排列方式
- pᵏ:k次成功的概率(乘法规则)
- (1-p)ⁿ⁻ᵏ:(n-k)次失败的概率(乘法规则)
- 三者相乘:得到恰好k次成功的总概率
七、实际应用例子
例子1:投篮问题
- 某球员投篮命中率60%
- 投10次,恰好命中7次的概率是多少?
n=10, k=7, p=0.6
P(X=7) = C(10,7) × 0.6⁷ × 0.4³
= 120 × 0.0279936 × 0.064
≈ 0.215
例子2:质量控制
- 生产线产品不良率5%
- 抽检20个,没有不良品的概率是多少?
n=20, k=0, p=0.05
P(X=0) = C(20,0) × 0.05⁰ × 0.95²⁰
= 1 × 1 × 0.95²⁰
≈ 0.3585
八、常见问题解答
Q1:为什么0! = 1?
A:这是数学上的规定,为了保持公式的一致性。比如C(n,0)应该等于1(从n个中选0个只有1种方法:什么都不选)。
Q2:C(n,k)和C(n,n-k)为什么相等?
A:从n个中选k个成功,等价于选(n-k)个失败。在我们的例子中,C(5,2)=C(5,3)=10。
Q3:如果硬币不均匀(p≠0.5)呢?
A:公式仍然适用!只是pᵏ × (1-p)ⁿ⁻ᵏ不再等于0.5ⁿ。例如,如果p=0.7(正面概率70%),那么P(X=2)要重新计算。
通过这个抛硬币的例子,你应该已经完全理解了:
- 阶乘和组合数的计算
- 概率的乘法和加法规则
- 二项分布公式的每个部分含义
- 如何实际计算二项概率
记住这个模式,你就可以解决任何二项分布问题了!