概率世界的“乐高”:手把手教你拆解二项分布

92 阅读5分钟

二项分布详解:从抛硬币到概率计算

一、基础知识准备

1. 阶乘(Factorial)

阶乘是一个数与比它小的所有正整数的乘积。

  • 符号n!
  • 定义n! = n × (n-1) × (n-2) × ... × 2 × 1
  • 特殊规定0! = 1

例子

5! = 5 × 4 × 3 × 2 × 1 = 120
3! = 3 × 2 × 1 = 6
1! = 1
0! = 1

2. 排列组合(组合数)

  • 组合数 C(n,k):从n个不同元素中,不考虑顺序地选取k个元素的方法数。
  • 公式C(n,k) = n! / [k! × (n-k)!]

例子:从5个学生中选2个参加比赛,有多少种选法?

C(5,2) = 5! / [2! × (5-2)!] = 120 / [2 × 6] = 120 / 12 = 10

3. 概率的乘法和加法规则

  • 乘法规则独立事件同时发生的概率 = 各自概率的乘积

    • 例子:抛硬币2次都正面朝上的概率 = 0.5 × 0.5 = 0.25
  • 加法规则互斥事件(不能同时发生)的概率 = 各自概率的和

    • 例子:抛硬币1次,正面或反面的概率 = 0.5 + 0.5 = 1

二、二项分布的核心案例:抛5次硬币

案例设定

  • 试验:抛一枚均匀硬币5次
  • 每次结果:正面(H)或反面(T),概率各为0.5
  • 随机变量X:正面朝上的次数
  • X的可能值:0, 1, 2, 3, 4, 5

二项分布公式

对于抛n次硬币,恰好有k次正面的概率:

P(X = k) = C(n,k) × pᵏ × (1-p)ⁿ⁻ᵏ
  • n = 总试验次数 = 5
  • k = 正面次数(0到5)
  • p = 每次试验正面的概率 = 0.5
  • C(5,k) = 从5次抛掷中选k次为正面的方法数

三、详细计算每一个概率

第1步:计算组合数 C(5,k)

kC(5,k) 计算结果
05!/(0!×5!) = 11
15!/(1!×4!) = 120/(1×24)5
25!/(2!×3!) = 120/(2×6)10
35!/(3!×2!) = 120/(6×2)10
45!/(4!×1!) = 120/(24×1)5
55!/(5!×0!) = 11

第2步:计算每个概率 P(X=k)

通用部分pᵏ × (1-p)ⁿ⁻ᵏ = 0.5ᵏ × 0.5⁵⁻ᵏ = 0.5⁵ = 1/32 = 0.03125

情况1:X=0(0次正面,5次反面)
P(X=0) = C(5,0) × 0.5⁰ × 0.5⁵
       = 1 × 1 × 0.03125
       = 0.03125

所有可能结果:TTTTT(只有这1种)

情况2:X=1(1次正面,4次反面)
P(X=1) = C(5,1) × 0.5¹ × 0.5⁴
       = 5 × 0.5 × 0.0625
       = 5 × 0.03125
       = 0.15625

所有可能结果(5种):

HTTTT, THTTT, TTHTT, TTTHT, TTTTH
情况3:X=2(2次正面,3次反面)
P(X=2) = C(5,2) × 0.5² × 0.5³
       = 10 × 0.25 × 0.125
       = 10 × 0.03125
       = 0.3125

部分可能结果(10种中的几种):

HHTTT, HTHTT, HTTHT, HTTTH,
THHTT, THTHT, THTTH,
TTHHT, TTHTH,
TTTHH
情况4:X=3(3次正面,2次反面)
P(X=3) = C(5,3) × 0.5³ × 0.5²
       = 10 × 0.125 × 0.25
       = 10 × 0.03125
       = 0.3125

部分可能结果(10种中的几种):

HHHTT, HHTHT, HHTTH,
HTHHT, HTHTH, HTTHH,
THHHT, THHTH, THTHH,
TTHHH
情况5:X=4(4次正面,1次反面)
P(X=4) = C(5,4) × 0.5⁴ × 0.5¹
       = 5 × 0.0625 × 0.5
       = 5 × 0.03125
       = 0.15625

所有可能结果(5种):

HHHHT, HHHTH, HHTHH, HTHHH, THHHH
情况6:X=5(5次正面,0次反面)
P(X=5) = C(5,5) × 0.5⁵ × 0.5⁰
       = 1 × 0.03125 × 1
       = 0.03125

所有可能结果:HHHHH(只有这1种)


四、概率分布表与验证

完整的概率分布表

image.png

正面次数(k)计算过程概率P(X=k)百分比
01 × 0.031250.031253.125%
15 × 0.031250.1562515.625%
210 × 0.031250.312531.25%
310 × 0.031250.312531.25%
45 × 0.031250.1562515.625%
51 × 0.031250.031253.125%

验证:所有概率之和应为1

总和 = 0.03125 + 0.15625 + 0.3125 + 0.3125 + 0.15625 + 0.03125
    = (0.03125×2) + (0.15625×2) + (0.3125×2)
    = 0.0625 + 0.3125 + 0.625
    = 1.0000 ✓

五、为什么组合数C(n,k)会出现?

以X=2为例详细解释

当我们要计算"恰好2次正面"的概率时:

  1. 固定一种特定顺序的概率:比如HHTTT的概率

    P(HHTTT) = 0.5 × 0.5 × 0.5 × 0.5 × 0.5
             = 0.5⁵
             = 0.03125
    

    (乘法规则:每次抛掷独立)

  2. 有多少种不同的顺序

    • 我们需要从5个位置中选出2个位置放"H"
    • 剩余3个位置自动放"T"
    • 这相当于:从5个位置中选2个,有多少种选法?
    • 答案:C(5,2) = 10
  3. 总概率

    P(X=2) = 10 × 0.03125 = 0.3125
    

    (加法规则:这10种情况互斥,不能同时发生)


六、二项分布的通用公式总结

对于任何二项试验(n次独立试验,每次成功概率为p):

P(恰好k次成功) = C(n,k) × pᵏ × (1-p)ⁿ⁻ᵏ

记忆技巧

  1. C(n,k) :有多少种不同的成功/失败排列方式
  2. pᵏ:k次成功的概率(乘法规则)
  3. (1-p)ⁿ⁻ᵏ:(n-k)次失败的概率(乘法规则)
  4. 三者相乘:得到恰好k次成功的总概率

七、实际应用例子

例子1:投篮问题

  • 某球员投篮命中率60%
  • 投10次,恰好命中7次的概率是多少?

image.png

n=10, k=7, p=0.6
P(X=7) = C(10,7) × 0.6⁷ × 0.4³
       = 120 × 0.0279936 × 0.064
       ≈ 0.215

例子2:质量控制

  • 生产线产品不良率5%
  • 抽检20个,没有不良品的概率是多少?

image.png

n=20, k=0, p=0.05
P(X=0) = C(20,0) × 0.05⁰ × 0.95²⁰
       = 1 × 1 × 0.95²⁰
       ≈ 0.3585

八、常见问题解答

Q1:为什么0! = 1?
A:这是数学上的规定,为了保持公式的一致性。比如C(n,0)应该等于1(从n个中选0个只有1种方法:什么都不选)。

Q2:C(n,k)和C(n,n-k)为什么相等?
A:从n个中选k个成功,等价于选(n-k)个失败。在我们的例子中,C(5,2)=C(5,3)=10

Q3:如果硬币不均匀(p≠0.5)呢?
A:公式仍然适用!只是pᵏ × (1-p)ⁿ⁻ᵏ不再等于0.5ⁿ。例如,如果p=0.7(正面概率70%),那么P(X=2)要重新计算。


通过这个抛硬币的例子,你应该已经完全理解了:

  1. 阶乘和组合数的计算
  2. 概率的乘法和加法规则
  3. 二项分布公式的每个部分含义
  4. 如何实际计算二项概率

记住这个模式,你就可以解决任何二项分布问题了!