AI-Agent(智能体)的工程本质:ReAct
我见诸多文章在聊AI-Agent(智能体)的时候,要么理论化程度深,要么直接上代码、上成品,使人不易直观地理解其工程本质。我尝试着站在普罗大众的视角来直接揭示AI-Agent的本质。【AI大模型教程】
AI-Agent是什么?
传统的AI模型,它是被动的,它拥有各种知识,就像百科全书一样,你问它一句,它答你一句,俨然是一种知识问答工具。
AI-Agent是我们给这个传统的AI模型加上“做事规则”(如:CoT、ReAct等)和“工具”(如:记忆、执行等工具),当它被赋予某个任务后,能够自主地规划并使用这些工具,能够通过工具的反馈再去重新规划行动,从中不断思考和调整,直到目标达成或失败。
这是一种从“被动工具”到“AI助手”的范式转移。
这是传统AI和AI-Agent的对比图:
- 第一张是一问一答,AI提供方法让人去执行;
- 第二张是下发任务,AI-Agent自动完成任务,无需人去参与;
AI-Agent是一个以大语言模型为“认知核心”(大脑),通过工具(手脚、眼睛等器官)来扩展其感知和行动边界,在目标驱动下能够与环境进行持续交互并自主完成任务的 “意向系统” 。
AI-Agent的常见运行模式有多种: ReAct,CoT, ToT,Plan-And-Execute,MultiAgents 等。
本文以ReAct模式去切入,一步步地拆解AI-Agent是如何工作的。
ReAct是什么?
Reasoning + Acting, 将推理和行动结合起来形成一个循环。
ReAct工作流程有4个部分:
- 思考(thought),大模型 根据‘任务目标’或‘观察’来推理当前形势,决定下一步是‘行动’还是‘结果’。
- 行动(action),大模型 下达具体的工具指令让AI-Agent能够识别并执行。
- 观察(observation),AI-Agent 执行工具后会反馈结果给大模型,让其继续思考。
- 结果(final_answer),大模型 认为目标已经达成或失败,生成结果,结束这个任务。
ReAct模式的工程本质
我直接通过会话的方式来揭示其技术工程的本质。
我使用的AI大模型是 kimi,
这是提示词
你需要穿插"thought, action, observation,final_answer"这些步骤去解决任务:
-
thought用于推理当前形势,若最终答案可以确定,则进入final_answer步骤,否则进入action步骤;
-
action用于主动向用户发起请求,你会决定出工具,用户会调用工具;
-
observation是来自用户的答复,你需要观察和分析这个答复,并进入thought步骤。
-
final_answer是最终答案,到达这个步骤则问题已经解决。
注意:
-
当你遇到模糊的问题,如,不清楚操作系统版本、命令行工具是否存在等情况,应该进入action步骤去决定出一个工具,从而让用户能够执行,之后你会得到一个来自用户的observation返回。
-
你会对observation的内容进行思考,继续进入thought步骤去推理当前形势,循环往复,直到得到最终答案。
-
当用户没有提出具体问题时,就只有1个thought的回答;否则每次回答必须会有两个内容:1个是thought,1个是action或final_answer。
输出格式要求:
所有步骤必须严格使用JSON的格式输出,当有超过1个输出时,使用list格式将json作为元素,按照顺序输出,JSON支持的关键字如下。
-
step_name, 步骤名称,字符串格式
-
raw_text, 原始内容,字符串格式
-
tool_call, 指定工具名,字符串格式
-
tool_args, 指定工具参数,JSON格式
可用工具:
- exec_cmd(cmd_string)
这是对话过程
输入提示词,AI按照我在提示词中定义的JSON格式输出了它的思考过程,等待我去提交任务。
输入任务,我请它转换一个视频文件到音频。此处及往下的交互,就是模拟的AI-Agent的交互方式。
AI对任务目标做出了思考,并采取了行动。它要调用命令判断相关的工具是否存在。
我模拟AI-Agent的执行结果,告诉AI这个工具存在,AI继续进行观察和思考。
AI经过思考,确定相关工具存在,并采取了行动。它要调用这个工具进行视频转换成音频的处理。
我模拟AI-Agent的执行结果,告诉AI执行完毕且执行成功。
AI经过思考,确定执行成功,做出最终回答,任务结束。
结语
本文通过直观的阐述去理解AI-Agent的工程本质。
一个能落地的AI应用,还有很多工程要做,从提示词工程到上下文工程,从传统AI到RAG、到AI-Agent、再到Multi-Agents。要突破的难点也会经常遇上,例如:上下文窗口的控制,AI应用的响应延迟太高,AI幻觉等。
AI时代变化很快,明年的AI工程或许又会大变样了。AI革命逐渐到来。