大模型 Agent 是不是就是各种 Prompt 的堆叠?—— 剥开"套壳叙事"看内核

4 阅读5分钟

大模型 Agent 是不是就是各种 Prompt 的堆叠?

这个问题在 2025–2026 年的 AI 社区里吵过好几轮。一派很直白:"LLM 的 input 就是 prompt,不管什么工具或模型,都只是在优化 prompt。把'优化 prompt'包一层就叫 Agent,跟把金属拼起来叫火箭没区别。" 另一派不买账:"生产级 Agent 显然不止 Prompt 这么简单,OpenHands 对接 LLM 只是其中一个模块,真正驱动它的是事件流、状态机、沙箱那一套。"

两边都没全错,但也都没说透。结论是:Prompt 是 Agent 的必要条件,但不是充分条件。


为什么会有"Agent = Prompt 堆叠"的错觉

三个原因:

  1. LLM 的接口只有文本。不管你背后干了什么,最终喂给模型的一定是一段 prompt。所以从"可见层面"看,确实像在拼提示词。
  2. 早期 demo 太有误导性。CoT、ReAct 把推理分步写进 prompt,看起来"多段拼接"就能跑起来,给人一种"我也能堆"的错觉。
  3. 框架把调度藏起来了。LangGraph / AutoGen / CrewAI 把编排逻辑封在 SDK 里,用户只看到几百行 system prompt,就以为那就是全部。

但问题来了——这些纯 prompt 拼出来的东西,只能在单次请求里维持短暂记忆,没法持久化、不能并行、也调不了真实的文件系统或浏览器。一旦任务拉长到 10 步以上、需要跨会话记住用户偏好、需要出错后重试,纯堆叠立刻崩。


一个能打的 Agent,至少四层

业内现在比较共识的拆法是 LLM + Planning + Memory + Tools,有的还会把 Orchestrator 单列一层。把每层对应到"Prompt 能管多少",就很清楚了:

层级干什么Prompt 能不能包办
Prompt 层把任务翻成模型能懂的话,给工具调用塞约束✅ 能
编排层(Orchestrator)任务拆解、循环/分支、错误捕获、子 Agent 协作❌ 程序控制流,得靠代码
记忆层跨会话持久化、向量检索、写前写后一致性❌ 得靠向量 DB + 检索逻辑
工具/动作层浏览器、文件 IO、API 调用、代码执行❌ 得靠沙箱 + 权限管理

💡 一个常被引用的说法是:Prompt 只是表层的 25%,剩下 75% 必须靠代码、数据和外部环境撑。这数不一定精确,但量级感是对的。

吴恩达在《Agentic AI》课里给的对照更直接:传统 AI 是你写一个 prompt,模型吐结果;Agentic AI 是你给一个任务,模型自己拆解、调工具、反思、迭代,直到出结果。前者是"说清楚",后者是"自己想清楚再动起来"


真正拉开差距的那几刀

光列组件有点干,看几个纯 Prompt 堆叠搞不定的场景:

  • 状态持久化:模型记不住上一步调了哪个 API、返回了什么。纯 prompt 方案聊两轮就丢设定,Agent 靠 Memory Manager 把关键信息写回向量库或 KV。
  • 错误恢复:工具调用失败,纯 prompt 的模型倾向于胡编参数接着走;Agent 有 Orchestrator 捕获异常,决定重试 / 换工具 / 回滚。
  • 动态规划:Prompt 堆叠是线性流水线(指令1→输出1→指令2→…),用户中途改需求就得重跑;Agent 是 感知→规划→执行→观察→反思循环,能中途重规划。
  • 并行化:Agent 能把互不依赖的子任务并发丢出去,纯 prompt 是串行的。

举个具体例子:让 AI 帮你写周报。Prompt 只负责"告诉模型要做什么" ;但"去 JIRA 拉这周 ticket → 去日历拉会议记录 → 调模板渲染 → 格式不对重试 → 存回文档"这套调度,全是框架在干活,不是 prompt 在干活。


那 Prompt 工程是不是被淘汰了?

不是,是被"下沉"了。

有篇文章说得好:提示工程是智能体工程的基础,不是被替代关系。Agent 的每个模块(规划、反思、工具调用)内部仍然要靠高质量的 prompt 去引导模型输出——只不过这些 prompt 不再是你手写一段丢进去,而是由编排层在运行时动态组装的:最近对话、检索到的文档、工具 schema、错误历史,全被拼成"这一轮该给模型看的 context"。

换句话说:

  • Prompt 工程优化的是"单步调用 LLM 的质量"(指令级抽象)
  • Agent 工程优化的是"多步闭环的整体完成率"(决策流级抽象)

简单任务(润色、补全、单轮问答)用纯 Prompt 成本低、见效快,根本不需要上 Agent;复杂长周期任务(跨系统、多工具、要记忆)才值得堆那 75% 的架构。


回到原问题

大模型 Agent 是不是就是各种 Prompt 的堆叠?

答:像说"火箭就是金属堆叠"一样——对,但不全对。 ​ Prompt 是 Agent 的嘴(甚至可能连嘴都算不上,只是喂给大脑的句子),但 Agent 真正的重量在后面那套感知-决策-执行-反思的闭环:规划器拆任务、记忆系统扛状态、工具箱碰外部世界、编排层管流转。这些都不是堆 prompt 能堆出来的。

下次再有人跟你讲"Agent 就是文字艺术",可以回他一句:文字是触发剂,不是发动机。