离散型随机变量期望值 E(X) 详解:从投硬币到投资的来龙去脉
一、从一个简单的赌博游戏开始
想象这样一个游戏:
规则:抛一枚均匀硬币。如果正面朝上,你赢5元;如果反面朝上,你输3元。
问题:这个游戏对你有利吗?长期玩下去,你会赚钱还是赔钱?
手动模拟(先建立直觉)
假设玩10次,结果可能是:
- 正面:赢5元
- 反面:输3元
如果10次中有5次正面、5次反面:
总收益 = 5×5 + 5×(-3) = 25 - 15 = 10元
平均每次收益 = 10/10 = 1元
但这是固定的5正5反。实际上,每次抛硬币结果是随机的。期望值 E(X) 就是告诉我们:如果无限次重复这个游戏,平均每次能赢/输多少钱。
二、期望值的定义与计算
1. 数学定义
对于离散随机变量 X(如抛硬币游戏的结果),期望值 E(X) 是:
所有可能结果 × 对应概率 的总和
用公式表示:
E(X) = Σ [xᵢ × P(X = xᵢ)]
xᵢ:第 i 种可能的结果值P(X = xᵢ):结果 xᵢ 发生的概率Σ:求和符号(把所有情况加起来)
2. 计算抛硬币游戏的 E(X)
设随机变量 X = 玩一次游戏的收益(单位:元)
| 结果 | 收益 xᵢ | 概率 P(X=xᵢ) | xᵢ × P(X=xᵢ) |
|---|---|---|---|
| 正面 | +5元 | 0.5 | 5 × 0.5 = 2.5 |
| 反面 | -3元 | 0.5 | (-3) × 0.5 = -1.5 |
计算期望值:
E(X) = 2.5 + (-1.5) = 1.0 元
结论:期望值 E(X) = 1元,意味着:
- 如果玩很多很多次,平均每次你能赢1元
- 这是一个对你有利的游戏(庄家不利)
三、期望值的三种直观理解方式
1. 长期平均值(频率学派)
玩 N 次(N很大),总收益 ≈ N × E(X),平均每次收益 ≈ E(X)。
2. 概率加权平均
每个可能结果按概率加权平均。
3. 分布的重心
把概率看作质量,结果值看作位置,期望值就是整个系统的重心。
四、期望值计算实战案例
案例1:六面骰子游戏
规则:掷一个公平骰子,出现的点数就是你的奖金(元)。
设 X = 获得的奖金
| 点数 x | 概率 P(X=x) | x × P(X=x) |
|---|---|---|
| 1 | 1/6 | 1 × 1/6 = 1/6 |
| 2 | 1/6 | 2 × 1/6 = 2/6 |
| 3 | 1/6 | 3 × 1/6 = 3/6 |
| 4 | 1/6 | 4 × 1/6 = 4/6 |
| 5 | 1/6 | 5 × 1/6 = 5/6 |
| 6 | 1/6 | 6 × 1/6 = 6/6 |
E(X) = (1+2+3+4+5+6)/6 = 21/6 = 3.5元
解读:长期玩这个游戏,平均每次获得3.5元。
案例2:彩票投资分析
规则:
- 彩票售价:2元/张
- 中奖概率:0.1%(1/1000)
- 奖金:500元
设 X = 购买一张彩票的净收益(奖金 - 成本)
| 结果 | 净收益 x | 概率 P(X=x) | x × P(X=x) |
|---|---|---|---|
| 中奖 | 500-2 = 498元 | 0.001 | 498 × 0.001 = 0.498 |
| 不中奖 | 0-2 = -2元 | 0.999 | -2 × 0.999 = -1.998 |
E(X) = 0.498 + (-1.998) = -1.5元
解读:每买一张彩票,平均亏损1.5元。彩票发行方靠这个期望值差赚钱。
案例3:二项分布的期望值(进阶)
场景:考试有10道选择题(4选1),完全瞎蒙。
设 X = 蒙对的题数,每道题蒙对概率 p = 0.25
二项分布期望值公式:E(X) = n × p
E(X) = 10 × 0.25 = 2.5题
解读:如果很多人完全瞎蒙,平均每人能蒙对2.5题。
五、期望值的性质(重要!)
性质1:线性性质
E(aX + b) = a × E(X) + b (a, b 是常数)
例子:如果抛硬币游戏奖金翻倍,同时收取1元入场费:
新收益 Y = 2X - 1,其中 X 是原收益
E(Y) = 2 × E(X) - 1 = 2×1 - 1 = 1元
性质2:和的期望 = 期望的和
E(X + Y) = E(X) + E(Y) (即使 X, Y 不独立也成立)
例子:玩两次抛硬币游戏,总收益期望:
E(总收益) = E(第一次收益) + E(第二次收益) = 1 + 1 = 2元
性质3:乘积的期望(仅当独立时简单)
如果 X 和 Y 独立,E(XY) = E(X) × E(Y)
七、期望值在决策中的应用
投资决策案例
有两个投资项目:
| 项目 | 可能收益 | 概率 | 期望收益计算 |
|---|---|---|---|
| A | 100万元 | 0.6 | 100×0.6 + (-20)×0.4 |
| -20万元 | 0.4 | = 60 - 8 = 52万元 | |
| B | 60万元 | 0.9 | 60×0.9 + 0×0.1 |
| 0万元 | 0.1 | = 54 + 0 = 54万元 |
E(A) = 52万元
E(B) = 54万元
仅看期望值:B项目更好(54 > 52)
但风险考虑:
- A项目:可能大赚(100万),也可能小亏(-20万)
- B项目:比较稳定,大概率赚60万
风险偏好者可能选A,风险厌恶者可能选B。
保险定价案例
背景:保险公司设计车险
- 假设平均每1000辆车中,1辆会发生事故,赔偿10万元
- 每辆车的期望理赔成本:
E(理赔) = 100,000 × (1/1000) = 100元 - 保险公司定价:保费 = 期望成本 + 运营费用 + 利润 ≈ 150元
这就是保险公司用期望值定价的原理。
八、常见误区与注意事项
误区1:期望值 ≠ 最可能值
例子:抛硬币游戏 E(X)=1元,但实际每次要么赢5元要么输3元,永远不会正好赢1元。
误区2:期望值不一定是有可能的值
例子:掷骰子奖金 E(X)=3.5元,但骰子不可能出现3.5点。
误区3:忽略方差/风险
高期望值可能伴随高风险。需要结合方差/标准差评估。
九、总结:期望值思维框架
1. 遇到随机问题时的思考步骤:
实际问题 → 定义随机变量X → 列出所有可能结果 →
确定每个结果的概率 → 计算E(X) → 解释现实意义
2. 期望值告诉我们什么:
- 赌博/投资:长期平均收益率
- 产品质量:平均寿命、平均缺陷数
- 保险:平均理赔成本
- 游戏设计:玩家平均收益(确保庄家优势)
3. 重要公式记忆:
离散型:E(X) = Σ [xᵢ × P(X=xᵢ)]
二项分布:E(X) = n×p
4. 一句话定义:
期望值 E(X) 是随机变量 X 所有可能取值以概率为权重的加权平均值,代表长期重复试验中的平均结果。
十、动手练习
练习1:抽奖游戏
一个盒子中有:
- 8个白球(无奖)
- 1个红球(奖金10元)
- 1个金球(奖金50元)
抽一次球(抽后放回),设 X 为奖金。
- 计算 E(X)
- 如果抽一次要付8元,还应该玩吗?
答案:
P(白球)=0.8, P(红球)=0.1, P(金球)=0.1
E(X) = 0×0.8 + 10×0.1 + 50×0.1 = 0+1+5 = 6元
净收益期望 = 6 - 8 = -2元 → 不应该玩
练习2:选择题策略
考试有5道4选1选择题。策略A:完全瞎蒙。策略B:排除1个错误选项后猜。
问:两种策略的期望得分是多少?(每题5分)
答案:
策略A:E(得分) = 5题 × (1/4) × 5分 = 6.25分
策略B:E(得分) = 5题 × (1/3) × 5分 ≈ 8.33分
二项分布期望值 E(X) = n × p 的推导详解
我们通过两种方法推导这个重要公式:一种是严密的代数推导,另一种是更直观的 “分而治之”方法。
一、基础准备:二项分布回顾
二项试验条件:
- 固定试验次数 n
- 每次试验只有两种结果:成功(概率 p)或失败(概率 q=1-p)
- 各次试验相互独立
- 随机变量 X = 成功次数
概率公式:
P(X = k) = C(n,k) × p^k × (1-p)^(n-k)
其中 C(n,k) = n!/(k!(n-k)!) 是从 n 次试验中选 k 次成功的组合数。
二、方法一:严密的代数推导(用定义)
1. 期望值的定义
期望值定义:E(X) = Σ [k × P(X=k)],对所有可能的 k 求和。
对于二项分布,k 从 0 到 n:
E(X) = Σ_{k=0}^{n} [k × C(n,k) × p^k × (1-p)^(n-k)]
2. 关键技巧:处理 k=0 项
当 k=0 时,k × P(X=0) = 0,所以我们可以从 k=1 开始求和:
E(X) = Σ_{k=1}^{n} [k × C(n,k) × p^k × (1-p)^(n-k)]
3. 使用组合恒等式:k×C(n,k) = n×C(n-1,k-1)
证明这个等式:
k × C(n,k) = k × [n! / (k!(n-k)!)]
= n × [(n-1)! / ((k-1)!(n-k)!)]
= n × C(n-1, k-1)
代入公式:
E(X) = Σ_{k=1}^{n} [n × C(n-1, k-1) × p^k × (1-p)^(n-k)]
= n × Σ_{k=1}^{n} [C(n-1, k-1) × p^k × (1-p)^(n-k)]
4. 提取因子 p
将 p^k 写成 p × p^{k-1}:
E(X) = n × p × Σ_{k=1}^{n} [C(n-1, k-1) × p^{k-1} × (1-p)^(n-k)]
5. 变量替换:令 j = k-1
当 k=1 时,j=0;当 k=n 时,j=n-1。
另外,n-k = n - (j+1) = (n-1) - j
代入:
E(X) = n × p × Σ_{j=0}^{n-1} [C(n-1, j) × p^j × (1-p)^((n-1)-j)]
6. 识别二项式求和
看这个求和部分:Σ_{j=0}^{n-1} [C(n-1, j) × p^j × (1-p)^((n-1)-j)]
这正是二项式定理的形式!根据二项式定理:
(a + b)^m = Σ_{j=0}^{m} [C(m, j) × a^j × b^{m-j}]
这里 a=p, b=1-p, m=n-1,所以:
Σ_{j=0}^{n-1} [C(n-1, j) × p^j × (1-p)^((n-1)-j)] = (p + (1-p))^(n-1) = 1^(n-1) = 1
7. 最终结果
E(X) = n × p × 1 = n × p
推导完成!
通过以上讲解,你应该已经理解了:
- 期望值是什么(长期平均值)
- 如何计算期望值
- 期望值在现实决策中的应用
- 期望值的局限性(需结合风险考虑)
期望值是概率论中最重要的概念之一,是连接概率理论与现实决策的桥梁。掌握它,你就有了分析不确定性的强大工具!