机器学习如何评估冰球射门质量?“机会分析”带来数据驱动的答案
每周的NHL(国家冰球联盟)赛季中,球迷们都会看到电视上播放的“本周最佳进球”集锦,并就此展开争论。大多数人认同,伟大的射门是那些成功概率很低的射门,而伟大的扑救则是阻止了高成功概率射门的扑救。但这些概率究竟是多少呢?
一项由某中心云服务支持的全新NHL EDGE IQ指标为这些乃至更多辩论提供了新的素材,并有望在整个体育领域带来新的见解。这项名为“机会分析”的指标,结合了历史和实时数据,基于众多不同因素来判断一次射门的难度。
在比赛直播中,“机会分析”利用来自NHL EDGE冰球和球员追踪系统的数据,精确到每次射门释放的瞬间,以衡量对比赛最关键的因素。“机会分析是第一个全面且严谨的分析方法,可用于近实时地理解射门的组织、机会及其形成环境,”某中心首席云架构师Leon Li表示。该指标可能催生新的、更以数据驱动的球迷辩论——NHL欢迎这一发展,因为它正寻求让比赛对球迷更易理解的方式。
“我们将能够利用这个指标作为球迷和解说员的工具,帮助他们增进理解,并使他们能够形成自己的观点,”NHL教练与总经理应用高级总监Brant Berglund解释道。“这不是给人们答案,而是依靠数据的准确性,尽可能去除主观性,并赋能人们评估数据并做出自己的判断。我们很高兴听到人们辩论数据——讨论本身才是最好的部分。”
“机会分析”评估构成一次射门的各种因素,输出高、中、低三个等级的排名,其中“高”表示射门转化为进球的机会最大。这些因素包括射门者的角度、与球门的接近程度,以及守门员需要移动多远来阻挡这次射门等。“机会分析”将前所未有的数据量——数十个因素,许多以亚秒级延迟追踪——提炼成一个综合指标。
“通过整个赛季可用的海量实时NHL EDGE冰球和球员追踪数据,我们能够审视如此多的因素。这是其全面性的体现,”Li说。“其严谨性则体现在我们作为数据科学家,与NHL的技术、冰球专家以及数据工程师合作,审查数据的准确性,并生成在比赛情境下有意义的特征。”
“机会分析”是NHL持续努力开发独特数据源和分析技术以解析这项运动复杂性的最新成果。过去15年间,NHL已将冰球信息与追踪系统(HITS)作为官方计分和事件数据平台,并最近推出了NHL EDGE冰球和球员追踪技术。该系统安装在所有32个NHL场馆,包括红外发射器和摄像头,用于追踪嵌入冰球和每位球员球衣中的传感器。
2021年,NHL与某中心开始合作,以充分利用这些数据源。2022年,“争球胜率”——首个由AI/ML驱动的NHL分析指标——在NHL EDGE IQ平台内推出,帮助基于多个历史和赛中数据点判断谁最有可能赢得特定争球。这建立在“射门分析”和“扑救分析”的基础上,这两个高级统计数据分别深入展示了球队或球员的得分表现以及守门员的扑救表现。
对于Berglund来说,“机会分析”关联的数据层对球迷、解说员和联盟而言都是一个宝库。这一创新指标不仅揭示了特定射门的难度水平,还提供了诸如冰球飞行速度、守门员身高、射门者角度变化等洞察。“通过这个产品,我们能够在非常接近实时的情况下,输出每次射门前的大量比赛数据,”Berglund说。“这在许多方面甚至比评级本身更有价值——我们实际上将输出那么多数据,我们才华横溢的解说员能在比赛中随时引用,球迷也能通过这些渠道获取。”
“机会分析”试图用数据驱动的方法回答常见的感叹——“那个得分机会有多好?!”从历史角度看,产生这次射门的具体情况到底有多困难?究竟是什么让这次射门近乎不可能、十拿九稳,或是介于两者之间?NHL和某中心训练了一个机器学习模型,用于评估围绕一次射门的特定环境组合导致进球的概率。
“我们希望保持开放心态,保留数据可能挑战关于得分机会的传统逻辑的可能性,”Berglund说。“有时确实如此,有时则不然。”例如,“机会分析”验证了直觉:平均而言,距离球网更近的射门比远距离射门有更好的进球机会。但其他因素则更为微妙。虽然现在说原因或影响程度还为时过早,但数据显示,得分率/预期进球率与射门前冰球越过蓝线的位置之间存在关联。
“这个项目的妙处在于,它迫使所有利益相关者用数据以不同方式思考比赛,”Berglund说。“并且希望消费者也能如此。”
某中心的数据处理能力和云基础设施使NHL团队能够以以前无法的方式处理其数据。某中心SageMaker的安全性和可扩展性“使NHL能够信任某中心处理非常宝贵、全面的数据,并允许我们快速迭代和开发模型,”Li解释道。某中心Kinesis使得捕捉和处理实时比赛动作成为可能,包括围绕特定射门发生的时间快照。Kinesis将信息发送到SageMaker中的模型,然后模型返回高、中或低的评级,以及可以路由给分析师以便整合到转播分析中的主要贡献因素。
“那个实时方面对我们来说非常重要,”Li说。“可扩展性也是如此,因为NHL每秒产生数千条记录,并且多场比赛可能同时进行。”
Berglund预计,随着NHL进一步深入研究射门成功可能性的关键因素,其他能够阐明这项运动的特征将会出现。毕竟,除了比赛本身,还有如此多的参与方式,包括第二屏体验,现在没有人是随意的球迷了。更多的访问和功能将意味着球迷——以及所有参与这项运动的人——有更多方式来解读比赛,并形成关于什么造就成功球员或球队的自己的理论。