当“超节点”成为算力新秩序,openEuler重构数智基础设施

0 阅读8分钟

当千行万业全面迈向智能化,AI从试点一步步扩展到生产系统,出现了一个无法回避的现实挑战:

大模型的参数量从千亿级跃升至万亿级,推理时延却要从50ms压缩到15ms。在“越大越快”的悖论下,传统服务器集群的堆卡模式,已无法满足算力的线性增长,对算力、通信和存储的协同提出了前所未有的挑战。

相对应的是“超节点”概念的走红,华为、百度、中科曙光等先后发布了“超节点服务器”:在超大带宽、超低时延、内存统一编址等技术的赋能下,打破了算力协同瓶颈,让计算集群像一台计算机一样高效工作。

物理上的“硬件孤岛”被打破后,还需要一个匹配的“神经中枢”。对下承接硬件、对上承载应用的操作系统,被推向舞台中央。

比如在11月14号的操作系统大会2025上,openEuler协同数十家产业伙伴向外界释放了一个积极信号:共筑面向智能时代的超节点操作系统,让AI能力深度融入系统底层,加速AI的创新落地。

01 面向超节点的操作系统,需要有哪些能力?

在算力基础设施的拼图里,操作系统历来是承上启下的“中枢层”,扮演了底层硬件和上层应用沟通的桥梁。

正如中国工程院院士倪光南在操作系统大会2025的主题演讲中所提到的:“超节点已成为算力基础设施建设和部署的主流形态。智能时代的操作系统将衔接智能时代的硬件和应用,成为释放算力潜能的核心基石。”

由此产生的一个问题是:当超节点成为下一代算力基础设施的主流形态,操作系统需要具备哪些能力?

华为公司董事、ICT BG CEO杨超斌在致辞中列出了来自产业端的“需求清单”:操作系统需要使能超节点硬件,向上层应用提供大带宽、低时延、内存统一编址和池化等核心能力,例如在大模型训练和推理、搜推广等场景中,让计算不再等待通信,从而释放超节点集群的算力潜能。

我们来翻译下这段“行话”。

大模型训练、实时推理、搜推广等极度依赖时延的场景下,通信延迟可能占到任务耗时的60%以上,计算单元已经处理完了“手头的活”,发现下一批数据“还堵在路上”,或者在遥远的另一块内存里。

通过内存统一编址、超大带宽、超低时延等能力,超节点将过去分散在不同物理节点上的资源,“整合”到了一台计算机里。但硬件协同只是“半程”,另一半的落在了操作系统:通信调度要“像内存访问一样快”,资源视图要足够统一,内存池化要做到可控、可见、可信……同样是决定算力是否可用的“枢纽”。

产业端的需求已经明确,操作系统该怎么进化?

开放原子开源欧拉委员会主席熊伟提出了“供给侧”的解题思路,认为面向超节点的操作系统,应该具备三个关键特征:

第一,全局资源抽象、内存统一编址、设备池化管理。 不再像管家一样只管自己的“一亩三分地”(单台服务器),而是作为“集群总司令”把所有算力、内存、设备等看作一个统一的资源池。

第二,异构资源融合、大带宽低时延通信,实现平等互联。 操作系统需要将GPU、CPU、NPU等不同算力“融合”起来,利用大带宽、低时延的通信能力,将不同计算单元“平等互联”、协同作战。

第三,全局资源视图,以及兼容性接口、原生接口等。 对上层的AI框架和大模型开发者来说,操作系统提供的是一个清爽的“全局资源视图”,包括兼容性接口和原生接口,进一步降低适配门槛。

不应该忽略的,还有一个确切的时间表:全球首个面向超节点的操作系统openEuler 24.03 LTS SP3,将于2025年12月30日在社区上线。也就是说,2026年将是“超节点”操作系统的商业化元年。

02 “超节点+大模型”时代,国产操作系统越级

不管是“超节点”架构的出现,还是面向超节点的操作系统创新,都是产业需求驱动的“果”。

就在操作系统大会2025现场,开放原子开源基金会、华为与中国电信天翼云公布了联合发展倡议,将联手促进技术共建、生态共筑和业务共赢,共同构建操作系统在AI和超节点等前沿技术领域的竞争力,推进天翼云和开源欧拉生态繁荣发展。

在openEuler社区,像中国电信这样的产业参与者还有很多,某种程度上已成为一股股产业级力量的汇聚点。

可以佐证的一组数据是:目前openEuler社区已吸引2100多家头部企业、研究机构和高校加入,拥有超过2.3万名开源贡献者,全球下载量突破550万,在全球部署42个镜像节点,为178个国家和地区提供服务。到2025年底,openEuler系操作系统的累计装机量预计将超过1600万套。

嗅觉敏锐的产业参与者,用行动揭示了——“超节点”改变的不单单是计算架构,潜移默化地重构了算力新秩序。

一是企业获取智能算力的方式。

很长一段时间里,企业要想训练大模型,面临的是一种“手工作坊式”的困境——需要花费数月的时间去调试,试图让一堆昂贵的硬件协同工作。而通信墙、内存墙、复杂度墙等像一道道闸门,截断了数据的流动。

两个月前的HC 2025上,华为宣布将开放灵衢2.0技术规范、开放超节点参考架构、开放超节点基础硬件、开源操作系统灵衢组件等等,允许产业界基于技术规范自研相关产品或部件,自主设计基于灵衢的各种产品。

面向超节点的操作系统openEuler 24.03 LTS SP3,则在操作系统层面实现了内存统一编址、资源池化、异构协同等能力,原本只有顶级科技公司才能掌握的复杂系统调优能力,变成了一种“普惠技术”。

企业不需要关心底层插的是A厂的卡还是B厂的卡,不需要担心跨节点的通信延迟,操作系统自动完成了资源的全局抽象和调度。大模型训练与推理的效率提升,智能化的普及周期将被大幅缩短。

二是“国产操作系统”的越级式崛起。

提到国产操作系统,不少人脑海里冒出来的可能是安全、“备胎”等词汇,为了自主可控,往往需要牺牲一部分性能或易用性。

但在操作系统大会2025上, Intel、Arm、 AMD三大芯片企业均成为openEuler社区的捐赠人,数十家操作系统厂商成为开源欧拉社区的首批全球化先锋伙伴,openEuler的全球化进程如火如荼。

原因并不难解释:超节点架构天然需要CPU/GPU/NPU的多架构协同,全球芯片企业和产业客户在openEuler上找到了统一的接口层。背后折射出了一个关键的产业信号,即以openEuler为代表的国产操作系统生态,已经走过追求“替代”的阶段,进入“基础设施创新”的新周期。

在超节点、大模型等前沿领域,openEuler和伙伴们正在无人区探索,去解决产业需要的难题,不仅仅是为了“安全兜底”,正在对高性能计算、资源管理方式、数智底座等进行系统性重构。

就像我们所看到的:在数千家企业、数万开发者的共同推动下,openEuler已经成为“算力新范式的制定者”。

03 写在最后

把视角拉得更长远一些,openEuler完成了一次又一次身份跃迁。

2019年末刚开源时,在外界眼中还是CentOS的一个替代选项;

四年前演进到社区自治,openEuler跻身中国操作系统市场的主流玩家;

到了2024年底,在中国新增服务器操作系统领域,openEuler的市场份额已达50%。

现在,openEuler正向全世界示范——在物理边界被打破、智能无处不在的新世界里,操作系统应该长什么样。甚至可以笃定:未来五年,面向超节点的操作系统将成为智能算力竞争的分水岭。