阅读 327

阿里云边缘云原生应用实践

近日,MEC全球应用开发者大会隆重召开!大会致力于推动MEC从试验走向应用落地,推动不同MEC平台“云-网-边-端-业”能力全面开放,加速边缘应用创新的步伐。在大会的“MEC开放论坛”上,阿里云高级技术专家周哲进行了《阿里边缘云原生应用实践》主题分享,站在技术视角对边缘云原生的技术概念、应用场景、阿里云边缘云原生实践案例等多方面进行解读。

为什么需要边缘云原生?

什么是边缘云原生?周哲认为:边缘云原生就是边缘云和云原生的结合。在当下的5G时代,80%的数据和计算将发生在边缘,那么市场需求为什么一定要边缘化?

在场景层面,未来5G的接入和各种应用都会雨后春笋般地出现。而5G的特点就是大流量、低延迟、大连接,这些特征传统的数据中心是不能满足的。例如4K/8K、VR、云游戏等应用上要依靠较大的流量进行支撑的,如果所有的流量都传输到数据中心,带宽压力是无法承受的;其次,因为物理距离的限制,低延时需求也较难实现;最后在大连接层上,随着IoT智能设备的普及,未来终端的规模量级暴增,需要分而治之,借助更多的边缘节点提供大连接的解决方案。在中心云和设备端之间打造边缘云的平台,能够起到承上启下的作用,实现上下传输和能力互通。

屏幕快照 2021-04-01 上午11.39.06.png

关于云原生的理解,每个人都不同。对于云原生的理解,阿里云阿里巴巴合伙人、阿里云高级研究员蒋江伟认为:因云而生的软件、硬件、架构,就是真正的云原生。周哲现场介绍到:其中包含三个维度,在硬件或者基础设施层,具备按需分配、弹性伸缩的能力,这个是云计算的基础能力。覆盖公共云的基础设施、专有云的基础设施,边缘计算的基础设施,整体上构建云原生基础实施。在架构层面,具备松耦合、可弹性扩展、高容错性等特点。在云原生应用管理层面,基于自动化、可观测、可管理的软件交付流程,加速创新效率的同时保障系统稳定性。云原生应用具备这三个维度特性。这样的应用易维护、弹性伸缩、稳定性、迭代效率高。

“云原生的典型技术代表:容器、服务网格、微服务、不可变技术设施和声明式API。这些技术是属于云原生技术,现在很多云原生技术是基于容器、服务网格、微服务等构建出来的,但云原生技术不仅仅包含这些,除了这些技术外,也可以构建出云原生应用和技术,只要符合上面三个特性,是不是容器都没有关系。如果不是具备上面三个特性的应用,不是标准的云原生应用。比如:使用容器技术,自己搭建容器服务,虽然也是使用云原生技术,但这个应用不表示是云原生应用。”周哲认为。

边缘云原生就是既满足边缘云、也满足云原生特性。

边缘云原生的技术优势

云原生技术能够解决应用的开发运维效率、稳定性、成本问题。那么边缘云原生应用和中心云原生应用的差异是什么?

周哲从四个方面做了对比:

一、在基础设施方面:边缘的特点是分布式、机房小,每个机房10-50台机器,计算和存储能力受限。单机房可靠性差,每个机房的SLA相对中心的保障是差的。单机房弹性能力受限的,跨机房的弹性能力强。中心云的特点是集中式、每个机房都很大,计算和存储规模大,机房可靠性高,单机房弹性伸缩好,多机房一般做容灾考虑。

二、在系统架构方面:边缘特点是全球分布式接入,靠近客户边缘测。需要跨公网的集群间应用通信能力。也就是我们所说的边缘通信和边缘协同能力。每个集群和中心的网络链路不是非常可靠,一旦边缘和中心失去连接,需要做好边缘自治能力。中心的特点是一般单机房接入,机房内核机房间专线互联。不需要边缘自治。

三、资源调度方面:边缘侧由于机房小,单机房的弹性能力受限,边缘的弹性需要跨节点间来做。同时边缘的机房分散,需要根据全局负载,需要选择是到哪个边缘节点,在做边缘节点内的调度。需要全局请求调度和资源的算力调度结合。中心侧用户主要关注容器的算力调度,一般不关注请求调度。

四、应用编排管理方面:在边缘侧应用需要部署到几百上千个集群,并且需要考虑应用跨集群容灾,怎么保证几个集群的应用状态一致,成为难点。在中心侧通常是集群的管理统一,较少做多集群管理,一般应用跨集群容灾做冷备,保证集群内应用状态一致性。

边缘云原生可以提供的关键能力

屏幕快照 2021-04-01 上午11.39.16.png

第一:异构融合广覆盖

在边缘端需要广覆盖,有更多资源覆盖在延时方面会更有优势,怎么做到资源多?其中一种方式是自建,自建能力是有限的,另外会考虑租用各个云厂商的边缘资源,这样针对不同厂商资源做好异构融合能力。

第二:云边体验一致性

很多应用既需要在云端部署,也需要在边缘部署,如果云边的体验不一致,就会增加更多的开发成本。应用开发需要做好云边体验一致性,这样对应用开发者非常友好,不用边缘一套应用、中心一套应用。

第三:标准云原生兼容

云原生有一个主要出发点就是跨平台兼容。让应用开发者在自己的搭建的平台能够运行应用,在不同的场景也能够运行应用,这样对开发者就非常友好。

第四:算力全域流动性

在边缘特性里,最关键一点是分布式,对全局的流量调度+算力结合有很强的需求。能够做到用户在哪里,应用自动部署到用户就近的边缘。按需在边缘做到算力和流量的流动。

那么哪些应用场景适合边缘云原生?

周哲表示:有几个场景适合边缘云原生,第一个场景是云端算力下沉,例如视频转码等,原来视频转码都是在中心转码,在边缘做分发,这是一个典型的云端算力下沉的应用场景。其次是终端的算力上移场景;周哲解释道,例如现在比较火爆的:云应用、云游戏、云桌面等都属于终端的算力上移场景,通过边缘计算可以解决很多应用不稳定等问题。第三个场景是原本就在边缘上的应用和数据,典型的是CDN的应用和数据,每秒钟全网有几百Tbps的数据在流动和传输。

阿里云边缘云原生产品与实践

阿里云边缘云原生体系,如下图所示,从下至上。首先是边缘云,包含边缘基础设施能力,边缘融合计算,在边缘云中有很多边缘节点,可以跑容器、微服务架构应用等。基于边缘网络和中间件做分发和管控。再上层是容器平台,包含容器相关的管控服务、集群管理能力。在容器平台之上是云原生能力,包含应用管理、servicemesh、可观测性等。通过整体云原生技术栈能够使边缘应用开发更简单。

屏幕快照 2021-04-01 上午11.39.42.png

接下来周哲也针对上述介绍展示了一些阿里云边缘云原生实践的案例。 第一个案例:CDN ON ENS 这个目标是全网CDN使用云原生技术上边缘计算,它的价值可以达到降本提效,在保证稳定性的情况下提升CDN业务创新效率。“实际上我们也会在CDN业务上遇到问题。”周哲说:在CDN业务上会遇到不同资源争抢问题、业务复杂、系统组件多、全网发布周期长、异构资源部署能力弱、资源复用率底等主要问题。例如双11电商的图片压力较大,在跨年看春晚时直播的负载较大,怎么解决这种CDN应用的问题? “我们就通过一些云升级的技术方案来解决。”周哲提出了云原生技术方案: 通过容器化做业务拆分隔离,解决资源争抢的问题。 通过微服务化架构改造解决系统组件多,问题排查难的问题。 通过全流程应用管理系统结合业务拆分隔离,在保证稳定性的基础上,提高发布效率。 具备异构资源管理的能力,解决各种异构资源的使用问题。 基于资源的实时弹性调度,解决不同业务场景错峰复用问题。

第二个场景案例:视频转码下沉到边缘

如下图所示,左侧是原来的方案:主播推流到CDN边缘节点,CDN边缘节点在把直播流推到中心,在中心做转码。另外一端是播放端,播放端在边缘节点拉流,边缘节点再从中心拉流。新的方案是:主播端直接推流到ENS边缘节点,直接在边缘节点部署转码应用程序,直接在边缘节点做转码,播放端可以直接从边缘节点拉取转码后的直播流。这样能够降低边缘到中心的成本、并提高用户体验。

屏幕快照 2021-04-01 上午11.40.11.png

第三个场景案例:终端上云(云游戏/云应用场景) 你会不会遇到一种情况:平时和朋友一起聚餐时想玩个游戏,手机没有安装,下载游戏安装包有比较大;下载耗费流量高时间又长,怎么办? 如果有云游戏就比较好了。云游戏的场景的使用边缘计算方案,如下图所示:左下角是用户终端,左上角是游戏厂商的业务系统,右上角是边缘计算的管控中心服务,右下角是边缘计算节点。 整个交互的流程是:当用户终端先访问业务系统,云游戏的业务系统和边缘计算管控发起云游戏应用的创建请求,边缘计算管控中心下发指令给边缘节点,边缘节点把云游戏的应用启动起来,启动起来后边缘计算管控中心返回云游戏的虚拟设备,业务系统把虚拟设备反馈手机终端用户,手机终端和边缘节点虚拟终端就可以建联,手机终端就可以通过操作指令和边缘节点虚拟终端做游戏交互,虚拟终端会屏幕画面视频流,返回给手机终端,最终手机终端就能够正常显示了。

屏幕快照 2021-04-01 上午11.40.19.png

总结一下,阿里云边缘计算产品主要分几个层面,第一个层面是底层的服务器、交换机能够形成统一的池化资源,属于ENS基础设施。第二个层面,就基于这些统一池化的硬件抽象出来的计算、存储、网络的资源形态。第三个层面,是把这些基础设施技术通过平台服务的方式进行包装,形成存储平台、计算平台、容器平台、试图计算平台和应用管理平台。第四层是saas场景交给客户进行封装实现,完成垂直化业务和创新场景的落地。

屏幕快照 2021-04-01 上午11.40.28.png

同时,阿里边缘计算产品也具有五大能力:

支持三种计算形态:虚机,容器及安全容器、终端数字孪生计算。

支持多种存储服务:高可用块设备、文件存储、对象存储、CDN KV缓存。

支持多种网络服务:实现了节点内的多种网络形态,跨节点的网络加速和交换能力,以及边缘的负载均衡产品。

安全节点信安:提供了四层、七层的防攻击能力,针对内容和主机的安全等场景,具有600G的抗DDoS攻击能力。

高效自动的云化纳管:支持容器虚机的高效生产,和镜像发布的管控,远程无接触3小时全自动化管理。

后续阿里云边缘计算会在“阿里云Edge Plus”公众号中分享更多最新的产品能力、解决方案和技术实践,欢迎大家一起探讨。本文福利:关注“阿里云Edge Plus”公众号,回复周哲,获得演讲PPT。

文章分类
后端