小知识,大挑战!本文正在参与“程序员必备小知识”创作活动。
零和博弈
零和博弈,又称零和游戏或零和赛局,与非零和博弈相对,是博弈论的一个概念,属非合作博弈。零和博弈表示所有博弈方的利益之和为零或一个常数,即一方有收入,其他方必有所失。
在一个有限零和游戏之中,不同的博弈理论如纳什均衡和最小化极大算法都给予同样的解决办法。玩家需使用一个混合策略。零和博弈的例子有赌博、期货和选举等。
纯策略纳什均衡
在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略(pure strategy) 。 纯策略是混合策略的特例。 纯策略的收益可以用效用表示,混合策略的收益只能以预期效用表示。
完全信息博弈中,参与者(局中人)只能在策略空间选取唯一确定的策略
二人联合博弈,局中人如何选择自己策略在博弈中得到更好收益
零和博弈的表达
G={S1,S2;A}
二人非合作博弈中两个居中人,甲和乙的策略集是 S1 和 S2
S1={A1,A2,A3}S2={B1,B2,B3}
收益矩阵
| B1 | B2 | B3 |
|---|
| A1 | 6,-6 | -1,1 | 0,0 |
| A2 | 3,-3 | 1,-1 | 2,-2 |
| A3 | -3,3 | 0,0 | -1,1 |
局中人甲的收益矩阵为 A
⎣⎡(6,−6)(3,−3)(−3,3)(−1,1)(1,−1)(0,0)(0,0)(2,−2)(−1,1)⎦⎤
A=⎣⎡63−3−11002−1⎦⎤
各局中人应该如何选择自己的策略保证自己博弈中取得有利的地位
-
对矩阵每行取最小值,在最小值中取最大值
max1≤j≤3min1≤i≤3={−1,1,−3}=1=a22
-
对矩阵每列取最大值,在最大值中取最小值
收益矩阵有鞍点元素,鞍点 a22 鞍点元素
min1≤j≤3max1≤i≤3={6,1,2}=1=a22