Anthropic 将让其托管智能体学会“做梦”\n\nAnthropic 为托管智能体平台引入了“做梦”、成果导向和多

\n\nAnthropic 为托管智能体平台引入了“做梦”、成果导向和多智能体编排功能。其中“做梦”功能允许 AI 回顾任务并自我进化，有效提升了处理复杂任务的能力和成功率。

译自：Anthropic will let its managed agents dream

作者：Frederic Lardinois

4 月，Anthropic 推出了托管智能体（Managed Agents）的公开测试版，这是其在自家基础设施上运行 AI 智能体的平台。

周三，该公司宣布正在扩展托管智能体的功能，新增了“做梦”（dreaming）、关注成果以及编排多个智能体的能力。该公司表示，这些新功能将“使智能体在只需最少引导的情况下，更擅长处理复杂任务”。

AI 智能体会梦见什么？

这里最引人注目的功能是“做梦”，目前处于研究预览阶段。虽然你可能不认为睡觉是一种能让智能体变得更强大的功能，但这里的核心理念是：就像人类大脑在睡眠时会更新记忆网络一样，托管智能体中的 Claude 现在将运行一个计划程序，允许它处理和审查最近完成的工作。它将审查最近的会话，寻找模式，然后将这些更新后的观察结果存储在记忆中。

该功能提供了一系列控制选项，既可以作为完全自动化的过程运行，也可以让用户在 Claude 将更改写入记忆之前进行审核。

图片来源：Anthropic

这里的实际优势在于，通过更全面地查看最近的所有工作流——以及智能体可能犯下的错误——我们可以发现单个智能体不太可能察觉的模式。

“记忆与做梦共同为自我进化的智能体构建了一个强大的记忆系统。”
——Anthropic

Anthropic 写道：“记忆与做梦共同为自我进化的智能体构建了一个强大的记忆系统。记忆让每个智能体在工作时能够捕捉到所学到的内容。”

成果

另一个主要的新功能是成果（outcomes）。其核心理念是专注于智能体的实际意图。

Anthropic 在公告中表示：“当智能体知道‘好’的标准是什么时，它们的工作表现最为出色。”

为此，它们需要了解特定任务中“好”的标准，因此用户可以为智能体创建这些标准。随后，一个独立的评分智能体会根据这些标准评估输出结果（该评分智能体拥有独立的上下文窗口，因此不存在作弊行为）。

“当智能体知道‘好’的标准是什么时，它们的工作表现最为出色。”
——Anthropic

Anthropic 指出，这对于让智能体处理“需要注重细节和全面覆盖”的任务特别有用，同时也适用于结果具有主观质量的任务（例如在营销文案中遵循品牌的语气）。

在公司自身的测试中，与标准提示词循环相比，使用“成果”功能将任务成功率提升了多达 10 个百分点。

图片来源：The New Stack

多智能体编排

许多 AI 实验室目前正在研究的一个领域是编排多个智能体并行工作。毫不意外，Anthropic 也将这一功能引入了其托管智能体平台。托管智能体现在可以分解任务，并由一个主导智能体将其分配给子智能体。

这是 Claude Code 和 Cowork 通常默认执行的操作，但它们并没有太多的实际管理手段。在托管智能体中，用户现在可以访问 Claude 控制台中的一个区域，在那里可以逐步查看每个智能体的具体操作。

可用性

“成果”和“多智能体编排”目前都已成为托管智能体公开测试版的一部分。想要获取“做梦”功能访问权限的用户可以在此处提出申请。工智能