\n\nAnthropic 为托管智能体平台引入了“做梦”、成果导向和多智能体编排功能。其中“做梦”功能允许 AI 回顾任务并自我进化,有效提升了处理复杂任务的能力和成功率。
译自:Anthropic will let its managed agents dream
作者:Frederic Lardinois
4 月,Anthropic 推出了 托管智能体(Managed Agents)的公开测试版,这是其在自家基础设施上运行 AI 智能体的平台。
周三,该公司宣布正在 扩展托管智能体 的功能,新增了“做梦”(dreaming)、关注成果以及编排多个智能体的能力。该公司表示,这些新功能将“使智能体在只需最少引导的情况下,更擅长处理复杂任务”。
AI 智能体会梦见什么?
这里最引人注目的功能是“做梦”,目前处于研究预览阶段。虽然你可能不认为睡觉是一种能让智能体变得更强大的功能,但这里的核心理念是:就像人类大脑在睡眠时会更新记忆网络一样,托管智能体中的 Claude 现在将运行一个计划程序,允许它处理和审查最近完成的工作。它将审查最近的会话,寻找模式,然后将这些更新后的观察结果存储在记忆中。
该功能提供了一系列控制选项,既可以作为完全自动化的过程运行,也可以让用户在 Claude 将更改写入记忆之前进行审核。

图片来源:Anthropic
这里的实际优势在于,通过更全面地查看最近的所有工作流——以及智能体可能犯下的错误——我们可以发现单个智能体不太可能察觉的模式。
“记忆与做梦共同为自我进化的智能体构建了一个强大的记忆系统。”
——Anthropic
Anthropic 写道:“记忆与做梦共同为自我进化的智能体构建了一个强大的记忆系统。记忆让每个智能体在工作时能够捕捉到所学到的内容。”
成果
另一个主要的新功能是 成果(outcomes)。其核心理念是专注于智能体的实际意图。
Anthropic 在公告中表示:“当智能体知道‘好’的标准是什么时,它们的工作表现最为出色。”
为此,它们需要了解特定任务中“好”的标准,因此用户可以为智能体创建这些标准。随后,一个独立的评分智能体会根据这些标准评估输出结果(该评分智能体拥有独立的上下文窗口,因此不存在作弊行为)。
“当智能体知道‘好’的标准是什么时,它们的工作表现最为出色。”
——Anthropic
Anthropic 指出,这对于让智能体处理“需要注重细节和全面覆盖”的任务特别有用,同时也适用于结果具有主观质量的任务(例如在营销文案中遵循品牌的语气)。
在公司自身的测试中,与标准提示词循环相比,使用“成果”功能将任务成功率提升了多达 10 个百分点。

图片来源:The New Stack
多智能体编排
许多 AI 实验室目前正在研究的一个领域是编排多个智能体并行工作。毫不意外,Anthropic 也将这一功能引入了其托管智能体平台。托管智能体现在可以分解任务,并由一个主导智能体将其分配给子智能体。
这是 Claude Code 和 Cowork 通常默认执行的操作,但它们并没有太多的实际管理手段。在托管智能体中,用户现在可以访问 Claude 控制台中的一个区域,在那里可以逐步查看每个智能体的具体操作。
可用性
“成果”和“多智能体编排”目前都已成为托管智能体公开测试版的一部分。想要获取“做梦”功能访问权限的用户可以在此处提出申请。工智能