中国队的BP真的很死板吗?

284 阅读7分钟
原文链接: zhuanlan.zhihu.com

​经常听到一种说法:中国队BP死板、打法僵硬,选来选去就这么几个英雄,不会!不学!不练!但凡中国DOTA2国难日,很多粉丝、解说、教练都会谈到这个问题。
那么,这个说法有道理吗?能不能找一些数据支撑或证伪?​可以的!刚刚结束的TI8各赛区预选赛就是一个很好的数据源——各大赛区参赛队伍数量相仿,进行的比赛场数相当,游戏版本相同,比赛时间相近。本文就以TI8预选赛数据为基础,探讨一下中国队的BP到底死不死板。
​先看一个简单粗暴的数据,TI8预算赛各赛区英雄上场数量。


中国区42场比赛一共出场了73名英雄,一不小心就垫底了。出场英雄数量甚至比不上只有7支队伍参赛一共打了34场比赛的南美赛区。另外,由EEsama领衔的东南亚区出场英雄达到92名排名第一,想必又搞了一波文艺复兴~

水友们不要着急喷!我们先走程序问个问题:出场英雄数量最少是不是就能说明中国队伍的BP最死板?​——这两者之间似乎好像大概并不能划等号,因为出场英雄数量只包含了「英雄是否上场」这个信息,而没有包含「英雄的出场频次(概率)」。举个例子,A、B两支队伍各打了100场比赛,两支队伍的选人是这样的:

  • A队伍就会一套阵容,前面99场比赛都选了相同的五名英雄,只在最后一场已经失去了悬念的回家局中,选了五名新英雄娱乐一把。A队100场比赛一共用了10名英雄。
  • B队伍100场比赛只用了9名英雄,但是这9名英雄出场次数很平均,都使用了45次左右。

那么这两支队伍谁的BP更死板?靠直觉判断的话,相信认为A队更死板的刀友会多一些。
没错,答案正是A队更死板(虽然上场的英雄更多)。接下来我们讲理论:信息论中有一个概念叫做熵(entropy),用来衡量随机变量的不确定性。一个离散型随机变量X的熵H(X)定义为:

​看到公式,是不是有点晕?不要慌,我向冰蛙保证,一定用DOTA2的例子把道理给大家讲明白。我们以松总major比赛为背景,假设松总major一共打了8场比赛,每个选手挑选英雄都有其独特的风格。
先看松总,在8场比赛中,假设松总有4场选了绝活TK,另外4场选了绝活巫医。那么​松总选择TK、巫医的概率为{1/2,1/2}。

​​​我们将松总选择哪名英雄视为一个随机变量X,然后思考一个问题:给定松总选择各英雄的概率,尝试用最少的二元问题确定某场比赛中松总选择的英雄。(所谓二元问题,可以理解为松总只能回答是或否)
例如,每次我们都问松总:你选择的英雄是TK吗?会有两种可能:

  • X=TK(概率=1/2),需要问一个问题,松总回答:是
  • X=巫医(概率=1/2),需要问一个问题,松总回答:否

那么很容易计算出,为确定X取值需要的二元问题数量为:

​也就是平均要问一个问题,就可以确定松总选择了哪名英雄。然而神奇的是:我们把松总选英雄的概率{1/2,1/2}带入到熵的公式中进行计算,居然得到了同样的结果。

​是巧合?是​因为松总牛逼?还是暗藏了某些深刻的道理?
事情是这样的:熵用来测量不确定性,如果我们要在二进制计算机的世界里衡量这个不确定性,可以使用比特进行编码。计算出来熵等于1比特,说明我们只需要用1个比特就能描述「松总选英雄」事件。而1个比特位可以取值0或1,其实就代表了松总回答是或否
还是有点晕?不要慌,我们再用稍微复杂一点的「球神选英雄」事件来说明。8场比赛中,假设球神选了4次屠夫、2次赏金、白虎猛犸各一次。


​​和问松总类似,我们可以依次问球神3个问题:1、你选择的英雄是屠夫吗?2、你选择的英雄是赏金吗?3、你选择的英雄是白虎吗?(最后的猛犸不用问,因为有排除法)一共有四种可能:

  1. X=屠夫(概率=1/2),总共需要问1个问题,球神回答:是
  2. X=赏金(概率=1/4),总共需要问2个问题,球神回答:否,是
  3. X=白虎(概率=1/8),总共需要问3个问题,球神回答:否,否,是
  4. X=猛犸(概率=1/8),总共需要问3个问题,球神回答:否,否,否

计算出平均需要问问题的个数为7/4,又一次等于熵!(只要你每次设计的问题集都能保证平均提问次数最少,就一定会等于熵,因为熵是数据压缩的临界值。)

然后看燕总。燕总和球神一样,8场比赛也是用了4名英雄,但各英雄出场概率相同,都是1/4。按照相同的方法计算出燕总选英雄的熵为2。(2大于7/4,说明燕总和球神虽然都选了4名英雄,但燕总选英雄的不确定性更高

​那么问题来了:在8场比赛的前提下,熵的上限是多少?在什么情况下达到最大熵?——当8场比赛都选择了不同的英雄时,熵最大。冠绝一世西西鱼就是这样的存在,熵为3。


​那么问题又来了:熵最小值是多少?对应的最僵硬死板的选人策略是什么?
是我啊!我!老何!影魔亡!每局比赛选影魔,没有任何不确定性,熵等于0!(胜率也为0...)

​收!这个例子讲完,相信大家都理解了什么叫做信息熵。有了这个武器之后,我们回到正题接着讨论:TI8预选赛到底哪个赛区选人最死板?
这下实锤了,还是中国区选人最死板...

​洗是洗不动了,不如我们来分锅吧!我觉得至少有这么几个理由是可以找的:

  1. 中国区实力更强的四支直邀队伍(LGD\VG\NB\VG.J)没有参加预算赛,他们是遮羞布,他们套路多。
  2. 这个游戏野路子多不一定有用,我们选出来的英雄扎实啊!能赢就行!
  3. 中国DOTA2玩家非常看重输赢,国内天梯很僵硬,职业选手受大环境影响也练不出绝活。
  4. 我们是慢热型赛区,厉害的套路藏到最后~

但是!正经来讲,选的英雄虽然不是越多越好,但「知己知彼,百战不殆」肯定是没错的。多看看其他赛区在打什么套路,肯定有助于我们提高。比如:美杜莎、大圣和小黑是其他五个赛区都在使用的英雄,却没有出现在TI8中国区预选赛的赛场。另外一些胜率超高(大于70%)的英雄(如:JUGG、谜团、哈斯卡等)也没有出现。值得谨惕!

​今天的文章到这里就结束了。做个小调查:
当爹之后,用来写文章的时间就少了。所以我改变了策略:只写利人利己、有新东西的干货文章,不再写纯娱乐内容,也不再重复自己。但是!我发现硬货文章写起来很费劲(20~30小时写一篇),但是大家并不赏脸——收藏很多,但赞和打赏变少了。是我太硬了吗?在线等~