API:AI智能体真正自主的缺失一环

16 阅读7分钟

人工智能代理需安全通信。现有协议复杂,像Web 2.0早期。API将简化通信,提供安全、可控、可治理的连接,推动AI代理普及。

译自:Why APIs Are the Missing Link for Truly Autonomous AI Agents

作者:Arash Nourian

人工智能的最新突破吸引了高管们的目光,他们渴望通过自动化实现新的效率。尽管人工智能的潜在收益将以万亿美元计,但首先必须克服重大障碍。

虽然聊天机器人和智能助手有潜力帮助客户服务和软件工程师,但推理模型使我们有可能拥有能够处理各种任务的 AI 智能体,甚至可能实现完全自主。

尽管这项技术无疑前景光明,但我们仍然缺少智能体化人工智能拼图中的重要部分——即,一种安全可靠的智能体通信方式。

历史的相似之处:Web 2.0 中 API 的崛起

随着开发者在 2000 年代中后期采用 Web 2.0 和移动技术,API 应运而生。第一代语言和协议,如笨重的 XML 和复杂的简单对象访问协议 (SOAP),逐渐让位于更好、更易用的工具,如 JavaScript 对象表示法 (JSON) 和表征状态传输 (REST)。

到 2010 年左右,JSON 和 REST 被确立为应用程序集成的新标准。它们也改变了开发者构建应用程序的方式。REST 和 JSON 使他们能够将业务应用程序作为微服务向外部世界公开,而不是开发具有紧密封装业务逻辑并通过专有 API 暴露的大型单体应用程序。

这开启了云原生计算的新时代。在 2010 年代初期,云原生计算鼓励将应用程序开发为一组松耦合的微服务,这些微服务运行在由 Kubernetes 管理的容器中,并全部使用新的 DevOps 技术和方法(如 git、Jenkins 和 CI/CD)创建,而不是使用瀑布式开发方法构建运行在僵化虚拟机 (VM) 中的紧耦合应用程序。

智能体化人工智能世界需要类似于 REST 和 JSON 的东西。我们还没有达到,但已经很接近了。

MCP、A2A 和 ACP——天哪!

如果智能体化人工智能世界要实现早期倡导者所承诺的 50% 效率提升,我们将需要更好的技术粘合剂将其整合在一起。我们仍处于智能体化人工智能世界的早期阶段,目前有几种提议的标准。

Anthropic 在 2024 年 11 月率先发布了 模型上下文协议 (MCP),他们将其比作 AI 的 USB 3.0 端口。Google 紧随其后,于 2025 年初推出了 智能体间协议 (A2A),这是一种旨在构建在 MCP 之上并提供智能体或智能体组之间高级协调的新协议。IBM 提出了第三个协议,称为 智能体通信协议 (ACP),旨在作为一种通用协议,使多个 AI 智能体能够协同工作。

开发智能体化人工智能协议的早期工作很有前景。但就像 XML 和 SOAP 的早期一样,其复杂程度仍然过高,难以广泛采用。

开发智能体化人工智能协议的早期工作很有前景。但就像 XML 和 SOAP 的早期一样,其复杂程度仍然过高,难以广泛采用。我们必须朝着智能体化人工智能的 JSON 和 REST 等效物迈进,才能实现智能体化人工智能所承诺的全部好处。

那么,它会是什么样子?它看起来就像经典的 API。

API:智能体企业真正的连接层

API 已经是全球软件连接的数据骨干。没有它们,AI、现代应用程序和云平台背后的系统既无法通信也无法扩展。实际上,API 已经悄然成为驱动当今 AI 模型的基础设施——随着自主智能体成为主流,它们将变得更加关键。

API 远不止是端点或集成工具;它们是数据传输和智能体系统交互的无形高速公路。为智能体时代做准备意味着将 API 推向前沿,并使其安全、可发现、可治理,并为多智能体协作而设计。

下一代 AI 协议是什么样子

关于 MCP 的早期工作很有前景,许多 AI 工具提供商和数据库开发者已将 MCP 客户端和 MCP 服务器集成到其产品中。然而,距离实现智能体自动化全部潜力还有很长的路要走。

协议本身存在一些问题。例如,MCP 截至目前是不安全的。这并非 Anthropic 开发者的错;这仅仅反映了它还处于非常年轻的阶段。实现正确的功能固然重要,但要让自主智能体化 AI 普及,事务必须是安全的。这是不可协商的。

治理是另一个关注领域。生成式人工智能 (GenAI) 有捏造事实的倾向,这已是众所周知。幻觉在一定程度上是不可避免的。它们是像 GenAI 这样的概率系统的工作方式特点——而不是错误。然而,企业不能也不应该部署容易说出仇恨言论或做出危险行为的自主智能体。这意味着要直接将防护措施内置到协议和我们用来控制它们的系统中。

API 将掩盖调用各种协议所涉及的底层复杂性,使开发者能够以安全、受控和管理良好的方式更轻松地使用 AI 智能体。

还有其他必须解决的技术挑战,例如令牌和会话管理、测试和调试,以及 监控和可观测性。在许多这些领域,开发者将能够将现有软件工程技术和方法扩展到人工智能世界。

API 也将扩展以支持新的智能体世界。事实上,API 将形成 AI 智能体与现有数据和应用程序之间的关键链接。正如 API 构成连接组织,允许现代互联网中数据和应用程序被调用和使用一样,API 也将依赖于协调代表我们执行任务的智能体组。

正如企业使用 API 向其客户和合作伙伴公开有限的数据或应用程序功能一样,企业也将使用 API 向外部世界公开 AI 和智能体功能。这些 API 将掩盖调用各种协议(MCP、A2A、ACP)所涉及的底层复杂性,使开发者能够以安全、受控和管理良好的方式更轻松地使用 AI 智能体。

API 2.0:智能体编程接口的出现

有充分迹象表明,我们正处于从单任务 AI 助手向真正自主的、能够进行复杂和全公司协作的多智能体系统转变的重大转折点。

聊天机器人和智能助手已经承担了以前由人类完成的工作,这种自动化水平将继续下去。但一场更大的革命正在进行中,它将导致软件开发和使用方式的转型。在 Web 2.0 时代技术中,对实现互联网潜力至关重要的普通 API,将在这场 AI 智能体革命中扮演主角。

然而,构建使这一切发生的底层通信机制仍有大量工作要做。虽然底层协议正在开发中,但公司将需要开发新的 API,使其能够通过这些协议公开现有功能。他们还需要新的软件堆栈,以实现这些 AI API 的高效管理和治理。

智能体人工智能的承诺是巨大的。然而,如果我们要用智能体人工智能复制 Web 2.0 革命,我们就需要更好的 API。