智能体基础设施:AI企业新范式

0 阅读3分钟

企业计算堆栈正在经历数十年来最具变革性的转型,智能体基础设施正从实验性工作负载转变为每一个新应用的组织逻辑。

这一转型迫使人们从根本上重新思考基础设施实际需要做什么——不仅是托管工作负载,还要编排智能体、管理数据管道以及优化大规模推理的经济性。根据某机构总裁兼首席执行官Rajiv Ramaswami的说法,每个平台公司面临的问题是其架构是为这一时刻设计的,还是仅仅为适应它而改造的。如今,答案决定了该公司所有建设方向。

“我们真正想成为所有应用运行的平台,”Ramaswami表示。“当今的应用,未来的应用,在这个新的人工智能世界里。我们想成为全球客户的首选平台。”

Ramaswami在某活动期间与采访团队进行了交流,讨论了该公司从超融合基础设施提供商向完整智能体基础设施平台的演进,包括其不断扩展的生态系统、主权云机遇以及对未来五年的愿景。

智能体基础设施要求GPU效率与平台治理

该平台的演进承载着明确的技术任务:让GPU资源更高效地工作。随着该平台扩展并发布新的智能体基础设施能力,底层的工程工作聚焦于消除闲置计算——这种闲置会推高每token成本。Ramaswami解释说,十年前应用于CPU虚拟化的相同优化逻辑,现在直接应用于GPU工作负载。

“你要最大化利用所购买的GPU,”他说。“GPU闲置是不好的,因为想想看——一方面你花费越来越多的token,另一方面如果需要购买越来越多的GPU去使用,这是低效的。就像在虚拟化出现之前,以计算为中心的工作负载利用率非常低。通过虚拟化,利用率变得高得多。现在GPU领域也正在发生同样的事情。”

活动上的生态故事同样至关重要。超过100家合作伙伴赞助了该活动——覆盖主要云、服务器、存储和芯片供应商——根据Ramaswami的说法,这反映了真正平台而非单一产品线所带来的网络效应。最近与某芯片机构达成的战略合作伙伴关系进一步加强了这一点——该机构承诺投入高达2.5亿美元的投资和联合工程开发,以共同构建一个开放的智能体AI平台。他补充说,每token成本已成为所有客户对话中决定性的经济单位。

“平台的价值与其周围的生态系统直接相关。所有这些合作伙伴都看到了我们推向市场的平台的价值,并认识到与我们整合在一起的价值,”Ramaswami说。“现在我们正在围绕AI构建一个全新的生态系统。”

主权正在成为第二个主要增长方向。全球各国政府正在构建主权AI云,以将数据和经济价值保留在国界之内,该平台正将自己定位为这些部署的首选平台。Ramaswami指出,政府为资助和填充这些建设而发起的计划,正在为该平台的混合架构创造一条直接的锚定客户管道。

“向主权迈进这一趋势将持续存在,”他说。“你希望拥有自己的基础设施。你想自己掌控它。你希望由本国公民运营和管理,而不依赖外部方。这对某机构来说代表着巨大的机会,因为它使满足这些需求的主权云能够被构建起来。”FINISHED