Twilio A2H:AI代理与人类沟通新协议

5 阅读4分钟

Twilio 发布 A2H 开源协议,旨在解决 AI 代理与人类沟通的痛点。该协议帮助代理管理任务切换,让人类介入决策,并确保通过正确渠道进行。A2H 提供通知、收集、授权、升级和结果等核心意图,并强调安全性,以融入人类判断和信任,消除开发者负担。

译自:Twilio's A2H is a new protocol that helps agents talk to humans

作者:Frederic Lardinois

在过去一年左右的时间里,我们看到了代理式AI工具的框架和协议大量涌现。

现有用于代理之间相互通信的代理到代理(A2A)协议,用于代理与商务系统通信的代理商务协议(ACP)和代理支付协议(AP2),当然,还有用于代理与工具通信并获取上下文的模型上下文协议(MCP)。这些缩略语层出不穷。

然而,所有这些中缺少一个帮助代理与人类沟通的框架——至少云通信公司Twilio是这样认为的。

该公司周四发布了开源的代理到人类(A2H)协议,旨在帮助代理管理从自主执行任务到让人类介入的切换过程——并且通过正确的渠道进行。

“代理关注的是它需要从人类那里得到什么,而不是如何联系他们……在此过程中,系统还会跟踪所有这些交互并创建审计跟踪。”

“代理关注的是它需要从人类那里得到什么,而不是如何联系他们,”正如Twilio新兴技术产品与工程副总裁 Rikki Singh 在声明中简洁地指出。在此过程中,系统还会跟踪所有这些交互并创建审计跟踪。

让人类参与其中

在与 The New Stack 的独家采访中,Singh 表示,虽然代理正变得越来越自主,但人类始终需要参与其中。

“不是因为AI效率低下,而是因为人类判断是许多决策的基础,并且人类判断带来信任感,”她说。

那么问题就变成了这种升级路径是怎样的。Twilio 长期以来一直管理着企业如何与消费者互动,无论是通过短信、消息应用程序还是语音通话,Rikki 认为这使公司处于解决这个问题的独特位置。

“我认为我们想要解决的是消除责任——那种关于‘嘿,我应该考虑到升级路径,我应该考虑到这一点’的责任。它不应该落在开发者或消费者身上,对吗?它应该落在工具上。它应该落在技术上,”她说。

“不是因为AI效率低下,而是因为人类判断是许多决策的基础,并且人类判断带来信任感。”

开发者不应该去想代理如何联系人类,以及如何维护短信、WhatsApp、推送通知或语音等渠道的所有必要集成。

A2H 理想情况下将所有这些抽象化,代理只需将其消息发送到 A2H 网关,然后由网关处理升级的消息传递部分。

意图

基于该公司在连接企业和消费者方面的经验,A2H 实现了五个核心意图(当然它是可扩展的):通知(用于单向通知)、收集(用于收集结构化信息,如送货地址)、授权(通过身份验证批准交易)、升级(移交给人类)和结果(报告任务完成)。

考虑到用例,即使是这个首个 A2H 案例也关注安全性。通过网关的每次交互都会产生一个签名工件。这意味着,例如,当人类批准交易时,这是代理请求并获得同意的明确证据。正如 Singh 指出,这也是为什么网关至关重要,因为必须有一套可执行的规则来确保代理请求批准某些交易(例如),并且有这些交易的记录。

“我们采取的视角是,每当代理试图与人类沟通时,现实是存在一个隐式意图,”Singh 说。“我们意识到这是帮助开发者以及最终可能运行自己的半自主代理的消费者理解如何构建这些对话的最佳方式。所以这就是我们采取意图方法的原因。”

然而,默认意图只是一个基线。整个框架是可扩展的。

对于使用 MCP 的代理,A2H 只是变成了另一个工具,它们可以使用相同的工具调用模式(例如 humans_inform())。

接下来是什么?

随着周四的发布,Twilio 正在开源 A2H 规范的第一个版本,该版本侧重于意图,包括身份验证支持和交付渠道抽象。即将推出的是与 LangGraph 和 CrewAI 等更多代理框架的集成,以及用于创建永久批准(和取消它们)的额外原语。