博弈论—看韩剧还是看足球?

1,869 阅读2分钟

小知识,大挑战!本文正在参与“程序员必备小知识”创作活动。

问题是夫妻双方只有一台电视机,妻子想看舞蹈而丈夫想看足球,如果双方达成看足球或者舞蹈就有一定收益,如果没有达成收益均为 0。显然并不存在纯策略纳什均衡,存在两个均衡点。

舞蹈足球
舞蹈1,20,0
足球0,02,1

混合策略下纳什均衡,妻子看舞蹈概率 p 看足球的概率就是 1 - p,丈夫看舞蹈概率 q 看足球的概率就是 1 - q。

  • 丈夫选择看足球的策略的期望收益 U1(看足球,t)=2(1p)+0×p=22pU_1(看足球,t) = 2 (1-p) + 0 \times p =2-2p

丈夫选择了看足球,当妻子以概率 1-p 也选择了看足球会得到收益 2

  • 丈夫选择看舞蹈策略的期望收益 U1(看舞蹈,t)=0×(1p)+1×p=pU_1(看舞蹈,t) = 0 \times (1-p) + 1 \times p = p

妻子随机性的目的: 使丈夫无机可乘,不管丈夫选择哪个策略,其期望收益均相同

22p=pp=232-2p = p \rightarrow p=\frac{2}{3}

  • 妻子选择看足球策略的期望收益 U2(看足球,t)=1×(1q)+0×q=1pU_2(看足球,t) = 1 \times (1-q) + 0 \times q =1-p

妻子选择了看足球,当丈夫以概率 1-q 也选择了看足球会得到收益 1

  • 妻子选择看舞蹈策略的期望收益 U2(看舞蹈,t)=2×q+0×(1q)=2qU_2(看舞蹈,t) = 2 \times q + 0 \times (1-q) = 2q

1q=2qq=131-q = 2q \rightarrow q=\frac{1}{3}

纯策略纳什均衡(Pure-Strategy Nash Equilibrium)与混合策略纳什均衡(Mixed-Strategy Nash Equilibrium)的区别就在于此,任何一个有限的博弈都有一个混合策略纳什均衡(这个证明来自于纳什定理),但不是每一个博弈都有纯策略纳什均衡。在这里,我们表述为:任何二元矩阵博弈都有纳什均衡

混合策略意义下的纳什均衡

在任意一个给定的二人零和博弈中,局中人 1 和局中人 2 的最如果存在最优策略,优策略分别是 XX^*YY^*

Vs1=VG=VS2V_{s_1} = V_{G} = V_{S_2} 这里 VGV_G 表示局中人 1 在均衡下的期望收益 博弈 G 的值

E(X,Y)VS1,YS2E(X,Y)VS2,YS1\begin{aligned} \mathbb{E}(X^*,Y) \le V_{S_1},\forall Y \in S_2^*\\ \mathbb{E}(X,Y^*) \le V_{S_2},\forall Y \in S_1^*\\ \end{aligned}

当丈夫给出概率分布不会让妻子在看足球和看,关于 以我对丈夫了解他更喜欢看足球。

  • 2/3 的概率会选择去看足球
  • 1/3 的概率会选择去看舞蹈