前言
今天看到了 Anthropic 研究员团队关于构建AI智能体的讨论内容,感觉很有感触,分享给大家。
Anthropic 是我前面一直推荐使用的大模型 Claude 的研发公司,是一群来自 OpenAI 的接触研究人员创立的。
本文主要针对目前的 AI 代理进行了讨论,可以帮助大家更好地理解相关的概念和理论。
博客原文、译文和讨论记录我放到文章末尾了,感兴趣的可以仔细阅读下。
内容大纲
这次讨论的各部分主题放到下面了,大家可以根据兴趣进行了解。
-
区分AI代理和工作流
-
代码提示的剖析
-
幕后故事
-
为什么现在写关于代理的文章
-
智能体的过度炒作和未被充分重视的方面
-
识别智能体的有用应用
-
编码智能体:潜力与挑战
-
2025年智能体的未来
-
给探索Agent的开发者的建议
个人感受
其中有几个观点深有感触,与大家分享一下。
AI代理和工作流
现在太多接入一点AI能力的应用都把自己叫做 Agent(代理),但其实远远达不到代理的程度。
- AI 代理:由 AI 自主确定思路,持续尝试直到确定方案。
- 工作流:预先指定的逻辑序列,可能部分节点有 AI 助力。
前几天的 Manus 的思路确实是 AI 代理,但实际效果,目前还无法确认。
AI协同的使用范围
“我认为存在一个使用智能体的最佳交集,这是一组有价值且复杂的任务,而且可能错误的代价或监控错误的代价相对较低。除非我们真正研究现有的流程,否则这组任务并不是非常清晰和明显的。”
AI 不是银弹,所以,不要期望 AI 解决所有问题。
AI 协同工作很重要的一部分,其实是确定 AI 的能力范围、边界,只有清晰地了解“伙伴”的能力,才能更好地合作嘛!
这个在与人合作的时候应该很常识了吧~
智能体的必要性
此处,我依旧使用了“智能体(包括工作流方式)”,毕竟现阶段,我们离 AI 代理还有点距离。
“我认为对于很多消费者任务来说,充分明确你的偏好和任务要求几乎和自己动手做一样费劲。”
对于非技术人员来说,学会如何写“提示词”,举例与AI协同还有很远。
如何针对当前场景调试具体可用的提示词,如何集成各类工具,如何设置上下文范围,如何在多个步骤之间传递信息,这一系列的问题都会让 AI 返回的结果不怎么优秀,也就是大家经常碰到的“AI我试了,不怎么好用”出现的原因。
就好像 AI 消费者和 AI 之间有一条鸿沟一样。
而智能体的开发者,正是为这座鸿沟架桥的人员。
总结
好了,今天内容有点零碎,希望对大家有一些启发。