离散型随机变量期望值 E(X) 详解:从投硬币到投资的来龙去脉

327 阅读8分钟

离散型随机变量期望值 E(X) 详解:从投硬币到投资的来龙去脉

一、从一个简单的赌博游戏开始

想象这样一个游戏:
规则:抛一枚均匀硬币。如果正面朝上,你赢5元;如果反面朝上,你输3元。
问题:这个游戏对你有利吗?长期玩下去,你会赚钱还是赔钱?

手动模拟(先建立直觉)

假设玩10次,结果可能是:

  • 正面:赢5元
  • 反面:输3元

如果10次中有5次正面、5次反面:
总收益 = 5×5 + 5×(-3) = 25 - 15 = 10元
平均每次收益 = 10/10 = 1元

但这是固定的5正5反。实际上,每次抛硬币结果是随机的。期望值 E(X) 就是告诉我们:如果无限次重复这个游戏,平均每次能赢/输多少钱。


二、期望值的定义与计算

1. 数学定义

对于离散随机变量 X(如抛硬币游戏的结果),期望值 E(X) 是:
所有可能结果 × 对应概率 的总和

用公式表示:

E(X) = Σ [xᵢ × P(X = xᵢ)]
  • xᵢ:第 i 种可能的结果值
  • P(X = xᵢ):结果 xᵢ 发生的概率
  • Σ:求和符号(把所有情况加起来)

2. 计算抛硬币游戏的 E(X)

设随机变量 X = 玩一次游戏的收益(单位:元)

结果收益 xᵢ概率 P(X=xᵢ)xᵢ × P(X=xᵢ)
正面+5元0.55 × 0.5 = 2.5
反面-3元0.5(-3) × 0.5 = -1.5

计算期望值

E(X) = 2.5 + (-1.5) = 1.0

结论:期望值 E(X) = 1元,意味着:

  • 如果玩很多很多次,平均每次你能赢1元
  • 这是一个对你有利的游戏(庄家不利)

三、期望值的三种直观理解方式

1. 长期平均值(频率学派)

玩 N 次(N很大),总收益 ≈ N × E(X),平均每次收益 ≈ E(X)。

2. 概率加权平均

每个可能结果按概率加权平均。

3. 分布的重心

把概率看作质量,结果值看作位置,期望值就是整个系统的重心

四、期望值计算实战案例

案例1:六面骰子游戏

规则:掷一个公平骰子,出现的点数就是你的奖金(元)。

设 X = 获得的奖金

点数 x概率 P(X=x)x × P(X=x)
11/61 × 1/6 = 1/6
21/62 × 1/6 = 2/6
31/63 × 1/6 = 3/6
41/64 × 1/6 = 4/6
51/65 × 1/6 = 5/6
61/66 × 1/6 = 6/6
E(X) = (1+2+3+4+5+6)/6 = 21/6 = 3.5

解读:长期玩这个游戏,平均每次获得3.5元。

案例2:彩票投资分析

规则

  • 彩票售价:2元/张
  • 中奖概率:0.1%(1/1000)
  • 奖金:500元

设 X = 购买一张彩票的净收益(奖金 - 成本)

结果净收益 x概率 P(X=x)x × P(X=x)
中奖500-2 = 498元0.001498 × 0.001 = 0.498
不中奖0-2 = -2元0.999-2 × 0.999 = -1.998
E(X) = 0.498 + (-1.998) = -1.5

解读:每买一张彩票,平均亏损1.5元。彩票发行方靠这个期望值差赚钱。

案例3:二项分布的期望值(进阶)

场景:考试有10道选择题(4选1),完全瞎蒙。
设 X = 蒙对的题数,每道题蒙对概率 p = 0.25

二项分布期望值公式:E(X) = n × p

E(X) = 10 × 0.25 = 2.5

解读:如果很多人完全瞎蒙,平均每人能蒙对2.5题。

五、期望值的性质(重要!)

性质1:线性性质

E(aX + b) = a × E(X) + b (a, b 是常数)

例子:如果抛硬币游戏奖金翻倍,同时收取1元入场费:
新收益 Y = 2X - 1,其中 X 是原收益

E(Y) = 2 × E(X) - 1 = 2×1 - 1 = 1

性质2:和的期望 = 期望的和

E(X + Y) = E(X) + E(Y) (即使 X, Y 不独立也成立)

例子:玩两次抛硬币游戏,总收益期望:

E(总收益) = E(第一次收益) + E(第二次收益) = 1 + 1 = 2

性质3:乘积的期望(仅当独立时简单)

如果 X 和 Y 独立,E(XY) = E(X) × E(Y)


七、期望值在决策中的应用

投资决策案例

有两个投资项目:

项目可能收益概率期望收益计算
A100万元0.6100×0.6 + (-20)×0.4
-20万元0.4= 60 - 8 = 52万元
B60万元0.960×0.9 + 0×0.1
0万元0.1= 54 + 0 = 54万元
E(A) = 52万元
E(B) = 54万元

仅看期望值:B项目更好(54 > 52)

但风险考虑

  • A项目:可能大赚(100万),也可能小亏(-20万)
  • B项目:比较稳定,大概率赚60万

风险偏好者可能选A,风险厌恶者可能选B。

保险定价案例

背景:保险公司设计车险

  • 假设平均每1000辆车中,1辆会发生事故,赔偿10万元
  • 每辆车的期望理赔成本:E(理赔) = 100,000 × (1/1000) = 100元
  • 保险公司定价:保费 = 期望成本 + 运营费用 + 利润 ≈ 150元

这就是保险公司用期望值定价的原理。


八、常见误区与注意事项

误区1:期望值 ≠ 最可能值

例子:抛硬币游戏 E(X)=1元,但实际每次要么赢5元要么输3元,永远不会正好赢1元。

误区2:期望值不一定是有可能的值

例子:掷骰子奖金 E(X)=3.5元,但骰子不可能出现3.5点。

误区3:忽略方差/风险

高期望值可能伴随高风险。需要结合方差/标准差评估。


九、总结:期望值思维框架

1. 遇到随机问题时的思考步骤

实际问题 → 定义随机变量X → 列出所有可能结果 → 
确定每个结果的概率 → 计算E(X) → 解释现实意义

2. 期望值告诉我们什么

  • 赌博/投资:长期平均收益率
  • 产品质量:平均寿命、平均缺陷数
  • 保险:平均理赔成本
  • 游戏设计:玩家平均收益(确保庄家优势)

3. 重要公式记忆

离散型:E(X) = Σ [xᵢ × P(X=xᵢ)]
二项分布:E(X) = n×p

4. 一句话定义

期望值 E(X) 是随机变量 X 所有可能取值以概率为权重的加权平均值,代表长期重复试验中的平均结果。


十、动手练习

练习1:抽奖游戏

一个盒子中有:

  • 8个白球(无奖)
  • 1个红球(奖金10元)
  • 1个金球(奖金50元)

抽一次球(抽后放回),设 X 为奖金。

  1. 计算 E(X)
  2. 如果抽一次要付8元,还应该玩吗?

答案

P(白球)=0.8, P(红球)=0.1, P(金球)=0.1
E(X) = 0×0.8 + 10×0.1 + 50×0.1 = 0+1+5 = 6元
净收益期望 = 6 - 8 = -2元 → 不应该玩

练习2:选择题策略

考试有5道4选1选择题。策略A:完全瞎蒙。策略B:排除1个错误选项后猜。
问:两种策略的期望得分是多少?(每题5分)

答案
策略A:E(得分) = 5题 × (1/4) × 5分 = 6.25分
策略B:E(得分) = 5题 × (1/3) × 5分 ≈ 8.33分


二项分布期望值 E(X) = n × p 的推导详解

我们通过两种方法推导这个重要公式:一种是严密的代数推导,另一种是更直观的 “分而治之”方法

一、基础准备:二项分布回顾

二项试验条件

  1. 固定试验次数 n
  2. 每次试验只有两种结果:成功(概率 p)或失败(概率 q=1-p)
  3. 各次试验相互独立
  4. 随机变量 X = 成功次数

概率公式

P(X = k) = C(n,k) × p^k × (1-p)^(n-k)

其中 C(n,k) = n!/(k!(n-k)!) 是从 n 次试验中选 k 次成功的组合数。

二、方法一:严密的代数推导(用定义)

1. 期望值的定义

期望值定义:E(X) = Σ [k × P(X=k)],对所有可能的 k 求和。

对于二项分布,k 从 0 到 n:

E(X) = Σ_{k=0}^{n} [k × C(n,k) × p^k × (1-p)^(n-k)]

2. 关键技巧:处理 k=0 项

当 k=0 时,k × P(X=0) = 0,所以我们可以从 k=1 开始求和:

E(X) = Σ_{k=1}^{n} [k × C(n,k) × p^k × (1-p)^(n-k)]

3. 使用组合恒等式:k×C(n,k) = n×C(n-1,k-1)

证明这个等式

k × C(n,k) = k × [n! / (k!(n-k)!)]
           = n × [(n-1)! / ((k-1)!(n-k)!)]
           = n × C(n-1, k-1)

代入公式

E(X) = Σ_{k=1}^{n} [n × C(n-1, k-1) × p^k × (1-p)^(n-k)]
     = n × Σ_{k=1}^{n} [C(n-1, k-1) × p^k × (1-p)^(n-k)]

4. 提取因子 p

将 p^k 写成 p × p^{k-1}:

E(X) = n × p × Σ_{k=1}^{n} [C(n-1, k-1) × p^{k-1} × (1-p)^(n-k)]

5. 变量替换:令 j = k-1

当 k=1 时,j=0;当 k=n 时,j=n-1。
另外,n-k = n - (j+1) = (n-1) - j

代入:

E(X) = n × p × Σ_{j=0}^{n-1} [C(n-1, j) × p^j × (1-p)^((n-1)-j)]

6. 识别二项式求和

看这个求和部分:Σ_{j=0}^{n-1} [C(n-1, j) × p^j × (1-p)^((n-1)-j)]

这正是二项式定理的形式!根据二项式定理:
(a + b)^m = Σ_{j=0}^{m} [C(m, j) × a^j × b^{m-j}]

这里 a=p, b=1-p, m=n-1,所以:

Σ_{j=0}^{n-1} [C(n-1, j) × p^j × (1-p)^((n-1)-j)] = (p + (1-p))^(n-1) = 1^(n-1) = 1

7. 最终结果

E(X) = n × p × 1 = n × p

推导完成!

通过以上讲解,你应该已经理解了:

  1. 期望值是什么(长期平均值)
  2. 如何计算期望值
  3. 期望值在现实决策中的应用
  4. 期望值的局限性(需结合风险考虑)

期望值是概率论中最重要的概念之一,是连接概率理论与现实决策的桥梁。掌握它,你就有了分析不确定性的强大工具!