基于边缘计算的云游戏场景实践

209 阅读13分钟

云游戏并不是一个新兴事物,相关的构想早在本世纪初就已经提出。近年来,随着云计算的不断演进,光纤入户的普及和5G网络的铺开,云游戏逐渐从技术成熟阶段走向了商业可行和商业腾飞阶段[1]。根据相关咨询公司的预测[2],全球的云游戏市场将保持每年接近50%的增长率,在2027年达到70亿美金的规模。 

随着用户与市场规模的不断扩大,如何保障用户在试听、交互等方面的良好体验?本文针对云游戏当前面临的时延、成本和运维等方面的挑战,分享边缘计算如何助力云游戏业务解决成本与体验难题。

01 云游戏简介

什么是云游戏

云游戏是以云计算为基础的游戏方式,本质上为交互性的在线视频流,在云游戏的运行模式下,游戏在云端服务器上运行,并将渲染完毕后的游戏画面或指令压缩后通过网络传送给用户[1]。

对于开发者而言,无需适配不同的软硬件平台,即可将游戏部署到服务端提供云游戏服务;而玩家无需下载、安装、升级游戏,可以在任何终端(Web、Android、iOS、PC、TV、VR)上即点即用运行在云端的游戏。

云游戏基础架构

云游戏的架构主要分为用户本地端侧、网络传输、云侧三部分。

  • 用户本地端侧: 用户接入云游戏平台的入口,主要接收来自云游戏平台的视频流和音频流,并进行显示呈现;同时将操作设备的输入指令上传到云平台。用户本地端侧包括显示设备和操作设备:

    • 显示设备主要包含手机、PC、PAD、大屏等;
    • 操作设备包括键盘、鼠标、游戏手柄等。
  • 网络传输: 主要涉及骨干网、城域网、接入网和家庭网络、5G 网络等,网络传输负责连接云平台和终端,将云端的实时音视频, 实时地、稳定地传输到用户的终端。

  • 云游戏平台侧: 云游戏平台侧接收来自用户端侧的指令,实现逻辑计算、实时渲染、编码、视频推流、音频推流等。

云游戏操作流程

云游戏操作流程主要包括如下9个环节:

  • 指令采集: 用户本地终端侧处理模块采集鼠标、键盘等设备的操作指令;
  • 指令上传: 部署在终端的云游戏 SDK 将采集的指令通过网络上传至云端云游戏实例;
  • 指令解析: 云端云游戏实例接收并解析指令;
  • 游戏逻辑计算: 云游戏实例上部署的游戏 APP 根据指令进行游戏逻辑计算;
  • 画面渲染: 云游戏实例根据游戏逻辑计算结果进行画面的实时渲染;
  • 抓频/编码: 云游戏实例对渲染后的游戏画面进行音频与视频的抓取,然后对抓取的画面进行编码压缩;
  • 音视频流传输: 云端将编码压缩后的音视频流通过网络传输至用户本地端侧;
  • 本地解码: 云游戏 SDK 根据端侧的配置与要求,借助本地终端的解码能力对音视频流进行解码;
  • 显示: 本地端侧设备显示模块如 PC、大屏等对解码后的音视频进行显示。

02 云游戏业务当前面临的主要挑战

当前云游戏主要面临多端支持、时延体验、成本和运维等挑战。

多端支持

首先,多端支持,云游戏玩家无需下载、安装、升级游戏,即可在任何终端(Web、Android、iOS、PC、TV、VR)上玩云端运行的游戏。因此,对云游戏服务商而言,需要:

  • 提供跨平台、多终端的客户端 SDK 以支持云游戏玩家不同终端的接入
  • 支持跨端操控适配,保证键鼠、手机、手柄的操控一致性
  • 支持多类型游戏算力要求
  • 支持游戏自动热更处理,游戏存档自动同步

时延

其次,时延。云游戏体验要素与本地游戏总体一致,不同的是云游戏引入编解码、网络传输等环节,其业务体验受到了云、网络、端更多因素的影响,其中网络的优劣及编解码器能力会影响到云游戏的视听体验和交互体验。而时延是影响云游戏体验质量和成功与否的关键因素。

著名 GUI 设计先驱 Jeff Johnson 在《认知与设计理解 UI 设计准则(第 2 版)》中指出,软件对用户的动作显示反馈时间底线是 100ms,例如屏幕上的按钮在被点击后需要在 100ms 内显示,否则用户就会觉得自己没点到而再点一次。在游戏行业中, 这一数据被公认为玩家操作与画面的响应时间需要小于 100ms。当前业界云游戏的时延可以平均做到约 50ms。

成本

第三,成本。当前云游戏的主要成本包括研发、硬件、带宽等,其中网络带宽的成本占比将近三分之一。目前,云游戏产业链的上下游分别由游戏开发商、云计算服务商、软硬件厂商、云游戏平台以及终端设备商构成。换言之,谁拥有成本更低、效率更高的解决方案,谁就有可能在未来的竞争中胜出。

运维

最后,运维。云游戏运维主要包含:边缘节点管理、游戏管理、游戏自动更新、账户管理、游戏安全管理等。由于需要维护大量的边缘计算节点以及种类繁多的游戏,而且游戏一般都比较大且更新频繁,需要及时处理游戏自动更新分发同步等问题,因此在运维方面也面临挑战。

03 边缘计算在云游戏场景中的应用实践

传统意义上的云计算(中心云模式)面临带宽、时延、连接质量、资源分配、安全等多方面的挑战。为了处理和应对传统云基础架构可能满足不了的应用和场景所带来的困境,在端侧更加有效率、针对性地采集、传输和处理数据,边缘计算概念应运而生。边缘计算是将云计算的一部分能力,由“集中”的机房迁移到网络接入的边缘。从而创造出一个具备高性能、低延迟与高带宽的服务环境,加速网络中各项内容、服务及应用的反应速度,让消费者享有不间断的高质量网络体验。

上文说到云游戏面临的最大挑战就是实时性(时延),与游戏的体验息息相关。云游戏的实时性要达到一个可令玩家接受的程度(50ms左右),不仅要依靠硬件和网络本身的性能,同时还需要足够的带宽才能做到。因此,边缘计算与云游戏的结合顺理成章。

基于边缘计算的云游戏业务架构

一般云游戏业务架构主要由本地客户端、云游戏公共服务、云游戏后端服务、云游戏边缘节点等几部分组成:

  • 客户端: 用户需要在本地的设备如手机、PC 上安装集成云游戏相关解码、用户管理、操作控制等能力的客户端。

    • 实现用户的注册、登录鉴权等,向云游戏业务平台请求获得对应的云游戏服务。
    • 发送本地控制设备如键盘、鼠标指令到云游戏实例。
    • 接收来自云游戏平台的视频、音频流,并实现解码与展示。
  • 云游戏公共服务: 游戏接入服务、运营管理、智能调度等,主要部署在中心云。

    • 用户账号开通和管理、服务订购和结算等。
    • 业务场景、游戏应用、实例容量管理等的运营。
    • 根据用户地域、网络、游戏算力等从云游戏实例资源池为用户分配合适的云游戏实例。
  • 游戏后台服务: 负责接收云游戏边缘节点上云游戏服务器的输入进行逻辑计算,并将结果返回给云游戏服务器。游戏后台服务可以游戏业务对时延的要求,可统一部署在中心云、也可以每个边缘及诶单部署一套。

  • 云游戏边缘节点: 主要以多地域的边缘计算节点实例作为资源池,为云游戏提供运行的环境。

    • 云游戏业务平台按照地域、网络、游戏算力等信息,为用户智能调度就近的云游戏实例。
    • 提供如 X86+GPU、ARM 等类型实例等,为不同云游戏提供多种实例规格。
    • 游戏应用运行在该实例上,在对用户本地端侧指令解析后,进行逻辑运算、渲染、抓屏、编码,然后通过音视频传输如 RTC 等推流到用户本地客户端。

边缘计算在云游戏场景中的价值

在整个环节中,边缘计算作为对算力资源的补充,能够有效解决云游戏面临的时延、带宽、成本等问题。

  • 首先,边缘部署 云游戏 实例,大幅降低云游戏时延

在全国乃至全球广泛分布的边缘节点部署云游戏实例,通过智能调度技术,根据用户地域、网络、游戏算力要求等,为用户分配就近的云游戏实例,实现就近接入、就近渲染,减少传输链路大幅降低全局云游戏玩家的平均时延。

  • 其次,高性价比的边缘带宽,助力 云游戏 流量成本优化

云游戏画质是云游戏体验中的另一关键要素。画质要求越高,对分辨率、帧率、码率等要求越大,网络通量要求也会越高即网络带宽要求越大;如果带宽不足、则出现丢包,从而可能引起画面卡顿和花屏。网络带宽≥ 1.6× 平均码率时,云游戏体验才可得到基本保障。以 PC 显示器上运行 1080P@144fps 的《英雄联盟》为例,在平均 30Mbps 推流码率下,48Mbps 以上带宽可以有比较稳定良好的画面体验[3]。

带宽成本支出是云游戏服务商的主要支出之一。从当前带宽市场来看,广泛分布在二、三、四线城市的边缘节点带宽成本是中心云(一线城市)带宽成本的1/6~1/10。因此,通过边缘计算部署云游戏实例并使用边缘带宽,大幅降低了对中心云带宽的需求,从而有效降低了云游戏带宽成本。

  • 第三, 边缘计算 分布式部署,提升整体并发能力

云游戏和传统游戏类似,都会经历上线期,成长期,黄金期与衰退期,因此也需要弹性、按需的资源满足不同阶段的业务需求;同时在大促等突发场景下,也要求算力资源与带宽资源快速、按需扩容。当前各云服务厂商的边缘计算服务,除了支持资源的按日、按月计费外,还支持更细粒度的计费方式,助力云游戏服务厂商在资源层面的精细化按需运营。

  • 第四, 边缘计算 丰富的云服务助力 云游戏 高效运维

云游戏需要维护大量的边缘计算节点,不同版本与种类的游戏,而且游戏一般都比较大且更新频繁,需要及时处理游戏自动更新分发同步等问题。边缘计算丰富的云服务可助力云游戏高效运维的达成。如通过边缘负载均衡可准确控制云游戏的灰度切量发布;借助边缘自定义镜像、镜像预热功能可在指定多个边缘节点,实现资源的快速扩容等;借助边缘云存储服务、边缘内网互通等功能,快速实现云游戏的更新与分发。  

04 总结

过去2-3年,虽然云游戏产业得到了快速发展,在用户规模、市场规模方面都有大幅增长,但是仍然面临着用户体验需进一步提升、运营成本需进一步降低等挑战。边缘计算通过广泛分布的节点、高性能多类型算力、高性价比大带宽、灵活按需、丰富云服务等优势,让云游戏场景在体验(低时延、高画质)、成本、运维等大幅优化,助力云游戏的商业可行与商业腾飞。

火山引擎边缘计算节点致力于为用户提供稳定、高性能、功能丰富的新一代边缘计算云平台服务,通过覆盖全国各省市和运营商的边缘节点,助力云游戏业务快速部署到用户与云中心之间的每个边缘层。主要优势包括:

  • 全域覆盖: 一站式边缘计算平台,覆盖全国各省市和运营商的边缘节点,提供更低时延、更高性能、稳定可靠的计算资源,可帮助云游戏业务实现更靠近用户的部署和服务;
  • 弹性灵活: 边缘计算节点可按需创建、弹性扩展,具备充足的库存水位,支持多种 CPU、GPU 等实例规格,可满足手游、端游等不同场景需求;
  • 安全可靠: 多租户实例和网络安全隔离,先进的自动化运维能力,完善的监控和服务体系,此外边缘计算具备的负载均衡、自定义镜像、镜像预热等丰富功能助力云游戏高效运维;
  • 优质服务: 经过春晚抖音红包、818 新潮好物节等大规模、海量业务的流量考验,可为云游戏业务提供稳定、可靠的综合服务保障。

参考文献

[1] 来源《全球云游戏产业深度观察及趋势研判研究报告(2022年)》中国信息通信研究院和IDC咨询(北京)有限公司 [2] Grand View Research. "Cloud Gaming Market Size, Share & Trends Analysis Report By Type (File Streaming, Video Streaming), By Device, By Gamer Type, By Region, And Segment Forecasts, 2021 - 2027", [3] 来源《云游戏产业发展白皮书(2019年)——5G助力云游戏产业快速发展》中国信息通信研究院