AI 工程的三次范式跃迁
AI 工程在过去三年,悄悄经历了一场无声的革命。
这背后,有两条平行演进的曲线。
第一条曲线:工程范式的演进
Prompt Engineering → Context Engineering → Harness Engineering
第二条曲线:系统形态的演进
Single Agent → Multi Agent → Agent Skills → Agent Teams
两条曲线是同步的。每一次工程范式的跃迁,都对应着系统形态的一次升级;每一次系统复杂度的提升,都倒逼工程师发展出新的能力维度。
第一纪:Prompt Engineering × Single Agent
时代:2022—2023 年
LLM 能力刚刚爆发,工程界面临的核心问题只有一个:如何让模型按我想要的方式输出?
这个阶段的系统形态极为简单——Single Agent,一问一答。整个技术栈:OpenAI API + 一些字符串拼接。
这个命题催生了大量工程技巧:
结构化指令
发现模型对格式非常敏感。"列出三点"比"告诉我一些"效果好得多。角色扮演可以显著改变输出风格。
Few-shot 示例
在 Prompt 中附上几个期望的输入-输出对,模型会从中归纳模式。这本质上是在推理时进行"即时微调"。
Chain-of-Thought(CoT)
要求模型"一步一步思考",能显著提升推理任务的准确率。这揭示了一个重要规律:中间步骤的质量决定最终答案的质量。
输出格式控制
要求模型输出 JSON、Markdown 或特定结构,使下游处理成为可能。
能力天花板
- 上下文窗口只有 4K token,无法处理长文档或大型代码库
- 每次对话全新开始,无状态
- 模型只能"说",不能"做"
- 能力上限即模型上限,工程师无法突破
第一纪留下的遗产
Prompt Engineering 时代证明了一件事:输入的结构化程度对输出质量有决定性影响。
这个洞察在后续所有工程范式中都得到了继承——只是"输入"的含义越来越宽泛,从一段文字扩展到了整个运行时环境。
第二纪:Context Engineering × Multi Agent
时代:2023 年中—2024 年
几件事同时发生:函数调用能力成熟、RAG 技术普及、上下文窗口扩展到 128K、AutoGPT 和 LangChain 爆红。
工程师们开始意识到:他们真正在做的事情,是管理模型在每个时刻能看到什么信息。
这就是 Context Engineering 范式的诞生。
Context Engineering 的本质
核心命题:如何通过精心设计和动态管理上下文,让模型在正确的时机获得正确的信息?
与 Prompt Engineering 的本质区别:前者是静态的,Context Engineering 是动态的。
记忆系统
- 短期记忆:当前对话历史的管理与压缩
- 长期记忆:跨会话的用户偏好持久化
- 语义记忆:基于向量数据库的相似度检索
- 过程记忆:Agent 执行任务时积累的中间状态
检索增强(RAG)
从外部知识库实时检索相关文档,注入上下文。核心挑战不是检索本身,而是相关性判断——有限窗口内,什么值得放进来?
工具定义
模型可以查询数据库、调用 API、执行代码、操作文件系统。工程师的任务是设计清晰的工具接口。
上下文压缩
即使窗口扩展到 128K,长上下文中的关键信息会被"注意力稀释",工程师需要主动压缩历史、裁剪无关内容。
Multi Agent 架构的崛起
Context Engineering 的复杂度最终超出了单个 Agent 的管理能力,催生了 Multi Agent 系统。
核心思想是分工。典型模式:
流水线模式:Planner → Executor → Reviewer,顺序传递
监督者模式:一个主控 Agent 负责调度,多个专门化 Worker 负责执行
对等协作模式:多个 Agent 互相审查、辩论、达成共识
Multi Agent 的工程挑战
状态同步、错误传播、调试困难……其中最致命的是技能碎片化:
这个矛盾,正是推动范式进入第三纪的核心张力。
第二纪留下的遗产
模型的能力边界不是固定的,它取决于你为它构建的信息环境。
工程师的价值不再是"操控模型",而是"为模型创造最优化的运行环境"。
第三纪:Harness Engineering × Agent Skills + Agent Teams
这个阶段的工程师发现,他们真正在做的事情是:构建让 Agent 能够自主运作、自我改进、横向扩展的基础设施。
这就是 Harness Engineering。
"Harness"是什么意思?
Harness 来自马具——把马的力量引导和约束成可用牵引力的装置。
Harness Engineering 的核心命题:如何构建一套基础设施,使 Agent 的能力可以被系统性地定义、扩展、复用和进化?
技能系统(Skill System)
这是第三纪最核心的工程创新。
关键特性:
- 按需加载:Agent 根据任务类型动态决定加载哪些 Skill,而非一次性注入所有规则
- 自动生成:Agent 完成复杂任务后,可以自动将成功的决策路径提炼为新的 Skill
- 版本演进:Skill 可以被改进、打分、淘汰,形成进化压力
在 Claude Code 中,Skill 系统通过 superpowers 插件实现,每个 Skill 定义了特定工程场景的最佳实践。
工具注册与发现
Agent Teams:能力的组织化
Agent Teams 是 Multi Agent 的进化版本,核心区别在于制度设计而非技术实现。
Multi Agent 解决的是"多个 Agent 如何协作完成一个任务";Agent Teams 解决的是"如何建立一套可持续运转的 Agent 组织"。
具体体现:
- 角色规范化:Team Lead、Researcher、Implementer、Reviewer 等角色有标准化的职责边界
- 任务管理系统:Task 有明确的状态机,支持依赖关系、阻塞检测
- 异步通信:Agent 之间通过消息传递而非直接调用,解耦执行时序
- 工作树隔离:每个 Agent 在独立的工作空间中执行,避免状态冲突
一个典型工作流:
用户请求 → Team Lead 分解任务 → 并行分配给 Explore / Plan / Implement Agent → 同步点检查 → Review Agent 审查 → 整合输出
记忆与学习循环
第三纪的记忆系统不再只是"存储信息",而是知识的自动提炼和主动强化:
对话结束时,系统主动评估本次交互中有哪些新的洞察值得持久化;周期性整合记忆库,消除冗余;Agent 可以搜索自己过去的对话记录,跨会话调用历史经验。
Harness Engineering 的工程师画像
不再需要:记忆大量 Prompt 技巧、手工调整模型参数、为每个场景写定制化模板。
开始需要:
- 系统设计能力:设计 Agent 的执行模型、工具边界、状态机
- 协议设计能力:定义 Agent 之间的通信协议、Skill 的接口规范
- 基础设施意识:理解 Agent 系统的可靠性、可观测性、扩展性需求
- Skill 工程能力:从经验中提炼可复用的能力单元,维护其生命周期
- 组织设计能力:为 Agent Teams 设计合理的角色分工和协作流程
三纪全景对照
| 维度 | 第一纪 | 第二纪 | 第三纪 |
|---|---|---|---|
| 工程范式 | Prompt Engineering | Context Engineering | Harness Engineering |
| 系统形态 | Single Agent | Multi Agent | Skills + Teams |
| 核心问题 | 让模型听话 | 让模型理解全局 | 让 Agent 自主进化 |
| 核心技能 | 写好指令 | 管理信息流 | 设计 Agent 基础设施 |
| 能力上限 | 模型上限 | 上下文质量 | Harness 设计质量 |
| 状态 | 无状态 | 会话状态 | 持久化 + 跨 Agent |
| 学习能力 | 无 | 有限 | 持续进化 |
| 典型工具 | ChatGPT | LangChain | Claude Code / Hermes |
结语:工程的终点是什么?
回顾三次范式跃迁,有一个清晰的主线:工程师与模型之间的"距离"在不断拉大。
第一纪,工程师直接和模型说话,一问一答。
第二纪,工程师设计信息管道,让模型在正确的信息环境中工作。
第三纪,工程师构建运行基础设施,让 Agent 在其中自主决策、自我改进。
这个趋势还会继续。下一步,工程师不再直接编写 Skill,而是定义"Skill 应该满足什么标准",让系统自动生成、测试和选择最优 Skill;不再手动配置 Agent Teams,而是描述"需要完成什么类型的工作",让系统动态组建最合适的团队。
这听起来像是工程师在"失去控制",但实际上恰恰相反——工程师的控制层级在提升。从操控单个模型的输出,到设计让无数 Agent 正确运作的制度和基础设施 ,工程师的杠杆率在成倍放大。
有一个值得思考的类比:操作系统工程师不运行用户程序,但他们决定了用户程序能做什么、怎么做、在什么约束下做。Harness Engineer 与 Agent 的关系,越> 来越接近于这种关系。
工程师从指令的撰写者,进化为系统的设计者。
而能够设计出让 AI 自主运作、持续进化、可靠扩展的系统,将成为这个时代最核心的工程能力。
参考:Hermes Agent(Nous Research)、Claude Code(Anthropic)等开源项目设计理念,以及 Context Engineering、Agent Harness 等社区概念。 ~