王者荣耀职业联赛数据分析|青训营笔记

886 阅读11分钟

王者荣耀职业联赛数据分析|青训营笔记

这是我参与「第四届青训营 」笔记创作活动的的第38天

1.引言

1.1.问题研究的背景

    当今国内火热持续度最久的手游当王者荣耀莫属了, 王者荣耀这款手游自其推出之后,就持续火爆,一直都是朋友聚会必备的娱乐消遣。而如今的王者荣耀已有上亿的注册量,每天的日活量也估计有几千万之多。因为电竞行业越来越正规化,所以模仿着电脑游戏举办的电竞比赛,手游也开始向电竞的圈子中发展。2015年推出的王者荣耀的手游,在2016年的下半年就开始举办半年一届的电竞联赛,将一年分为春季赛和秋季赛。

王者荣耀职业联赛(简称KPL)是官方最高规格专业晋级赛事。全年分别为春季赛和秋季赛两个赛季,每个赛季分为常规赛、季后赛及总决赛三部分。2019年王者荣耀职业联赛春季赛于3月6日在成都量子光打响。2019年KPL春季赛分为常规赛、季后赛及总决赛三部分,仍然采取东西部分区赛制,队伍数量由14支扩军至15支。赛区间对抗将采用单循环赛制,每个俱乐部在常规赛期间与其他所有对手仅有一次交手机会,常规赛采用BO5全局BP模式。季后赛开始启用BO7全局BP+巅峰对决模式,东西部队伍将按照对应名次直接相互交手,共同争夺春季赛总冠军。

       当一年又一年的比赛落幕,留下来了许多的比赛数据,通过这些数据,可以总结出一些规律,使这些数据可视化,例如战队之间的核心位置和每个战队的优势和劣势,和战队成员的kda比较,每个位置各个成员人头数目比较等等

       分析这些数据可以让kpl观众亦或是王者荣耀玩家们直观的感受出每个队伍的特点和每个选手的特点,从而更容易的抉择出自己所喜欢的战队或者成员。战队和成员也可以通过这些分析结果调整自己的打法,改进自己的不足。

1.2 数据

1.2.1数据来源

数据采集于王者荣耀官网、玩加电竞和王者荣耀营地app,以excel文件格式保存下来

1.2.2数据基本情况

包含五个数据文件,kpl春季赛表中有160条数据,kpl战队数据表里包含128条数据,花海表里包含38条数据,fly表里包含了38条数据。将网页数据导入新建excel表中并分别命名为kpl春季赛、kpl战队数据表、花海、fly,这里统计的是2019年的数据。另外还有240位职业选手的比赛信息。人气值采集与王者营地手动录入excel表中。

2.KPL比赛各项数据分析

2.1数据导入

首先要将表中信息导入Jupyter中,以此来显示它们的大致信息。

image.png

image.png

图表 2-1.1kpl 春季赛各项数据表

image.png

image.png

图表2-1.2 kpl战队数据表

image.png

image.png

图表2-1.3花海胜率表

2.2战队分析

2.2.1计算战队kda

分析一个战队必须先计算出改战队的kda,kda可以大致判断该战队的综合实力,KDA在对局结束后会以评分的形式显示出来,而KDA的每一个字母都代表了每一个数值。

K——Kill(杀人)

D——Death(死亡)

A——Assist(助攻)

这三个数值是在游戏对局结束后最终所产生的一个整数值,每个玩家都会有这三个值。

而KDA的评分结果所得,则需要通过一个公式计算得来,那么这个公式是怎样的呢?

【公式】 (K+A)/D=KDA评分

也就是(人头+助攻)÷死亡数=KDA

KDA的数值越大,也就是说明你的水平越高,从而获得MVP的机会也就越大。

其实有很多人会误认为在游戏中只要杀得人越多,那么KDA也就越高,获得MVP的几率也就越大,虽然KDA的值与杀人数有关,但是并非全部是按杀人数来算的,死亡数和助攻数也是很重要的,而数值之间的比例对于KDA最后的计算结果是很重要的。

也就是说如果玩家没有杀人也没有死亡,但是助攻很多,那么玩家KDA的值就会很高,获得MVP的机会也会很大。但是如果杀人数和死亡数成正比,那么无论再多的杀人数,KDA的值都不会很高。

总的来说,KDA是游戏中的一个整体表现,想要获得MVP,就要保障游戏内KDA的值才有机会。

理解了KDA,接下来就利用Jupyter来计算这些战队的KDA:

image.png

image.png

图表2-2.1每个战队的kda

2.2.2 人气值的排序

计算出了KDA,可以由此得出这张表是由KDA由大到小的先后顺序排列出来的。

人气和受欢迎程度是成正相关的,只需要将所有战队按人气降序排序就可以直观地看出哪一个战队是最受人们欢迎的,以下就是排序的代码

Ascending为True是升序False是降序

image.png

图表2-2.2人气值降序

2.2.3 数据之间相关系数分析

由图表2-2.2可以直观的看出estarPro战队的人气值最高尽管他的kda不是最高,其中可能有许多原因,包括宣传力度、战队成员的人气值、比赛中亮眼的表现等等,那它到底和KDA有没有关系呢?

可以用相关系数来分析人气值与KDA的关联程度。

相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母 r 表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。

Pearson相关系数 (Pearson CorrelationCoefficient)是用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系。

求相关系数之前先修改将该表的索引修改为现在的排序状态

image.png

image.png

图表2-2.3改完索引之后的表

由图表2-2.3可以看出BA黑凤梨战队的人气值为0,是因为此战队在比赛结束后被AG超玩会收购,那么人气值和KDA就会受改组数据影响。由此就要删除这组数据,以下为代码:

image.png

image.png

图表2-2.4删除十五行后的表

现在就可以计算人气值和KDA之间的相关系数。

image.png

image.png

相关系数

0.8-1.0 极强相关

0.6-0.8 强相关

0.4-0.6 中等程度相关

0.2-0.4 弱相关

0.0-0.2 极弱相关或无相关

由此得出,人气值与KDA为弱相关

对于玩过王者荣耀的人来说,一定知道只要一个人击杀敌方英雄,那么其他对此敌方英雄造成伤害的队友都会有助攻,所以不难猜测出场均击杀与场均助攻存在着很大的相关性,因此,为了验证猜想,我们用代码计算出场均击杀与场均助攻的相关系数:

由此可以看出场均击杀与场均助攻有极强的相关性。这意味着知道其中一个的值就可以大致推断出另一个值的大致区间。

为了验证数据源的真实性,可以看出图表2-1.1和图表2-1.2均有场均击杀这一项,由此来排序,跟据战队顺序来判断两个表数据是否存在分歧。

image.png

图表2-2.5

image.png

图表2-2.6

由图表2-2.5和图表2-2.6可以看出数据源的真实性。

两张表中也可以求其数据相关系数。

胜率和KDA的相关系数为

image.png

image.png

说明KDA与胜率强相关。

2.2.4 各战队人气值占比饼状图

跟据人气值可以作饼图来反映各个战队粉丝数占总粉丝数的多少。

image.png

image.png

图表2-2.7人气占比图

由此可以更加直观的看出各个战队粉丝数占总人数的比重

饼图是一种应该避免使用的图表,因为肉眼对面积大小不敏感。饼状图能很直观的看到每一个部分在整体中所占的比例,但是只能反映某一时点上的情况,如果想看到一段时间内的变化趋势、增长幅度之类的就很麻烦了。

所以用柱状图再一次统计每个战队的人气。如图2-2.8

2.2.5 各战队人气柱状图

image.png

image.png

图表2-2.8人气柱状图

2.3战队成员分析

接下来单独分析战队成员。

花海,曾是两区巅峰赛第一的选手,有着“路人王”的称号,在选秀大会被eStarPro俱乐部直签,但是之前从未在kpl赛场出现,在2019kpl春季赛的首场比赛,eStarPro战队以绝对的优势3-0闪电零封Topm战队,取得了开门红。经历了几个赛季的低迷之后,战队终于迎来了自己的“春天”,尤其是首发新秀打野花海,更是让粉丝盛赞,首秀拿“五杀”,不得不服!,也是让大家“大开眼界”,首次亮相就拿到了“五连绝世”,更是登上了微博的热搜榜,斩获MVP,作为一位新人有这样的成绩和表现实属难得!

2.3.1花海胜率随场数的变化趋势

通过上面的内容可以看出花海的第一场比赛带领着队伍走向胜利,从图表2-1.3中也可以看出。那么接下来就要作出花海胜率随场数的变化趋势。

image.png

image.png

图表2-3.1胜率随场数变化趋势图

从图中可以看出胜率在场数较少的情况下,波动幅度比较大,随着场数的增加,波动幅度有明显下降最后趋于水平,可以在图中看出曲线维持在0.68到0.71之间,表示出花海的可以将胜率维持在68%~71%之间,在kpl选手中算的上是不错的了。

2.3.2成员胜率变化趋势之间的比较

和QGhappy成员fly相比较

image.png 可以发现蓝色线相较于红色线波动起伏不大,蓝色为花海,红色为fly。

说明花海发挥比fly更加稳定一些。如图2-3.2

image.png

图表2-3.2两位选手胜率比较图

2.4部分游戏机制分析

在王者荣耀里面有一个装备叫学识宝石,一般为辅助出装,此装备目的在于线上发育不吃队友的经济,所以一般来讲辅助的经济都是最低的而其他位置都会有经济来源为小兵或者野怪

在没有改版之前都相差无几。下面就来看看每分钟经济的直方图。

首先读取240位职业选手信息:

image.png

image.png

图表2-4.1  240位职业选手信息

画出他们‘每分钟经济’的频率分布直方图。

image.png

image.png

图表2-4.2 每分钟经济频率分布直方图

由图像可以看出在400左右和600左右频率最高,呈现出两个正态分布,由此不难判断出400左右为辅助位置的每分钟经济情况,600左右分布区间更大,为其他位置每分钟经济情况。

这说明王者荣耀游戏本质机制没有改变,每局都会有辅助出现。

2.3 模型评价

此次建模数据来源出自官网较多,数据来源都真实可靠,可以体现出模型的真实性。本次建模数据采集较少,模型可能会出现不精确等问题,但大体上满足分析要求。采集的数据有很大一部分为数据存在浪费现象,应找到其他方法更加利用好这些数据。

3.结论

通过本次建模,可以得出王者荣耀和其他moba游戏一样就是在游戏中靠着击杀敌方英雄,购买装备,拆掉敌人基地为胜利条件。游戏的本质机制并没有非常大的变化。

通过数据分析,可以得出可以上kpl职业赛场上的每个战队的实力水平都相差无几,KDA高的选手或战队不一定会赢得比赛,比赛还是以推塔为目的不是以击杀敌方英雄为目的。为了不吃经济和经验,辅助位置的英雄都会出学识宝石装备。人气战队并不一定是冠军战队,还有着诸多因素影响着。选手胜率随场数的变化趋势都会随场数的增多而趋于稳定,选手的好坏并不完全取决与随场数增多趋于稳定的胜率,还要看趋于稳定的同时胜率波动起伏的大小。

参考文献

[1]      baijiahao.baidu.com/s?id=160710…

[2]      m.sohu.com/a/297447065…

[3]      baike.baidu.com/item/相关系数/3…

[4]      baike.baidu.com/item/Pearso…

[5]      blog.csdn.net/caixiajia/a…

[6]      baijiahao.baidu.com/s?id=162735…

[7]      其他部分依据游戏体制得出