华为超大云数据中心落地贵州,这些硬核技术有利支撑“东数西算”

357 阅读7分钟

摘要:在贵州建设的数据中心又该如何最大化利用算力资源,从而有效提高资源分配率,降低云资源的使用成本。

本文分享自华为云社区《华为全球最大数据中心落地贵州,这些硬核技术有利支撑“东数西算”》,作者:技术火炬手。

贵州,位于我国西南地区,黄果树瀑布可能是大多数人对它最初的印象。不过,如今的贵州已然成为"中国数谷"“数据新贵”。在数据为王的互联网和云时代,贵州凭借着得天独厚的自然资源优势,成为数据中心建设的咽喉要地,支撑起全国的数字经济发展。

就在最近,华为云贵安园区正式开园。这个历时5年建设,未来将拥有100万台服务器规模的超大云数据中心正式投入商用。

华为云贵安园区

华为云贵安园区

正是得益于贵州良好的资源、气候优势,在这里运行的服务器可以处在最佳的温度状态,让数据中心的能效比达到全球领先水平,有效承载业务的同时,推动实现碳达峰、碳中和的目标。

从碳达峰、碳中和到东数西算

数据中心的建立,是整个互联网社会发展的必然结果。尤其是这两年新冠疫情的影响下,全国范围内的数字经济正在蓬勃发展,相应的底层基础设施建设也愈加重要,而数据中心就是“底座”之一。

在数据中心,数十万台、上百万台的服务器可以高效运作。借助这些服务器提供的计算、存储资源,以云服务的形式将诸如AI、大数据、数据库的能力提供给各个企业,乃至千家万户。以国庆期间热映的电影《长津湖》为例,通过云数据中心提供的算力,可以把后期几个月的渲染时间缩短为两周,极大提高制作周期。

中国信息通信研究院发布的《数据中心产业发展指数》显示,我国数据中心产业规模已接近2000亿元,北上广深等热点地区及周边数据中心规模指数较高。但一个不容忽视的现状是,我国数据中心存在一定程度的供需失衡、失序发展等问题。

今年,我国发改委、网信办、工信部、国家能源局四部门联合印发《全国一体化大数据中心协同创新体系算力枢纽实施方案》,提出在京津冀、长三角、粤港澳大湾区、成渝以及贵州、内蒙古、甘肃、宁夏建设全国算力网络国家枢纽节点,启动实施“东数西算”工程,构建国家算力网络体系。

东数西算工程的实施,确定了东西部地区的差异化发展目标。现在一些东部地区应用需求大,但能耗指标紧张、电力成本高,大规模发展数据中心难度和局限性大。西部地区可再生能源丰富,气候适宜,但存在网络带宽小、跨省数据传输费用高等瓶颈,无法有效承接东部需求。

如何解决这些棘手的问题?在贵州建设的数据中心又该如何最大化利用算力资源,从而有效提高资源分配率,降低云资源的使用成本?

Regionless实现西部数据中心算力资源利用最大化

针对上述提到的问题,对于云厂商来说,可以从整体云架构层面探索如何打破Region级服务的约束,引入云资源及租户应用负载的全域调度能力,使得企业上云应用的部署时无需指定具体的Region物理位置。

通过这种方式解决东西地区的平滑引流, 使得用户在几乎无感知的情况下,将业务负载从东部城市平滑地迁移到西部,比如华为云的乌兰察布数据中心、贵安数据中心。

这其中涉及到地区层面的架构分层以及全域调度,乃至东部和西部资源的定价差别等等。

华为云首席架构师顾炯炯举例,通常情况下,用户购买资源前都是先选Region(地区),而他们对云服务的全球部署、网络拓扑的连接并没有整体概念,所以云厂商需要为用户揭开迷雾,将资源的分布、价格、使用现状一一呈现出来。

在架构设计上打破Region级服务的约束,引入全域调度能力,基于对算力成本最优化、特定云服务及业务负载接入时延,以及应用/应用群之间的通信耦合关系,为用户提供最佳选择。至于具体云服务的资源实例发放到哪一个地理区域,完全由云的智能调度系统动态确定。

这个过程就是Regionless化,由华为云来完成调度策略,屏蔽底层资源调度的复杂性。用户无需自己选择地理Region,就能享受全局服务的全球部署能力。

ADN,让跨区域调度部署成为可能,支撑东数西算

这其中,有个关键能力是ADN(应用传送网络Application Delivery Network)。ADN 网络是一张叠加在Internet互联网,以及华为云遍及全球的云端及分布式边缘基础设施和专线网络之上的overlay网络。面向互联网应用、媒体内容体验,ADN有提升保障全路径网络加速的能力;面向云租户,它可提供极致敏捷可靠的云接入、云互联服务。

ADN服务支撑企业租户以最优的性价比及敏捷可靠性,从本地IDC数据中心或办公地点接入最近的云数据中心Region或边缘站点,以及解决不同云服务区域之间,云服务区域与边缘站点之间,不同终端用户/边缘站点之间的互联网加速能力问题。

基于ADN网络的测试统计结果,对于大于1000公里的长距离连接,ADN网络相比原生Internet物理网络的平均优化幅度达到20%到40%以上。 通过ADN内部的多路径实时冗余能力、网络与华为云自建的物理HBN(华为骨干网络)之间多平面实时冗余的能力,以及ADN故障后切换到Internet的韧性保护的能力,更是进一步将华为云的广域连接可靠性、鲁棒性提升了1个数量级。

通过将面向云服务、云主机、云容器的弹性IP从中心Region下沉到边缘节点,AND使得云租户可从各运营商的城域网经由静态BGP就近接入到分布式边缘站点,再通过分布式边缘站点经由物理专线连接到主Region服务区的云服务、云主机、云容器实例。由于动态BGP与静态BGP在国内定价差价达近10倍,加之ADN接入节点与CDN共享上下行带宽,使得CDN非忙时阶段的闲置带宽资源得以更为充分的利用,从而进一步大幅降低了租户的总体弹性IP接入成本,使得公有云的网络接入总成本降低达40%以上。

另外在网络弹性与敏捷能力方面,ADN通过云原生技术突破了传统广域网在物理设备及地理区域方面制约,使得网络拓扑变化及路由收敛从天级缩短到分钟级。

随着ADN网络建设的日益完备,及其在云网协同方面的运营与运维数据的极大丰富与积累,必将推动其成长为华为分布式云原生架构的“大动脉”与“高速公路”,使得跨越不同Region云服务区,跨越云边端、跨越遍布全球的华为云、伙伴云及HCS的统一资源调度与统一应用编排部署成为可能,从而有力地支撑 “东数西算”国家新基建布局。

点击关注,第一时间了解华为云新鲜技术~