从 Prompt Engineering 到 Harness Engineering:AI 工程的三次范式跃迁

4 阅读8分钟

AI 工程的三次范式跃迁


AI 工程在过去三年,悄悄经历了一场无声的革命。

这背后,有两条平行演进的曲线。

第一条曲线:工程范式的演进

Prompt Engineering → Context Engineering → Harness Engineering

第二条曲线:系统形态的演进

Single Agent → Multi Agent → Agent Skills → Agent Teams

两条曲线是同步的。每一次工程范式的跃迁,都对应着系统形态的一次升级;每一次系统复杂度的提升,都倒逼工程师发展出新的能力维度。


第一纪:Prompt Engineering × Single Agent

时代:2022—2023 年

LLM 能力刚刚爆发,工程界面临的核心问题只有一个:如何让模型按我想要的方式输出?

这个阶段的系统形态极为简单——Single Agent,一问一答。整个技术栈:OpenAI API + 一些字符串拼接。

这个命题催生了大量工程技巧:

结构化指令

发现模型对格式非常敏感。"列出三点"比"告诉我一些"效果好得多。角色扮演可以显著改变输出风格。

Few-shot 示例

在 Prompt 中附上几个期望的输入-输出对,模型会从中归纳模式。这本质上是在推理时进行"即时微调"。

Chain-of-Thought(CoT)

要求模型"一步一步思考",能显著提升推理任务的准确率。这揭示了一个重要规律:中间步骤的质量决定最终答案的质量

输出格式控制

要求模型输出 JSON、Markdown 或特定结构,使下游处理成为可能。

能力天花板

  • 上下文窗口只有 4K token,无法处理长文档或大型代码库
  • 每次对话全新开始,无状态
  • 模型只能"说",不能"做"
  • 能力上限即模型上限,工程师无法突破

第一纪留下的遗产

Prompt Engineering 时代证明了一件事:输入的结构化程度对输出质量有决定性影响

这个洞察在后续所有工程范式中都得到了继承——只是"输入"的含义越来越宽泛,从一段文字扩展到了整个运行时环境。


第二纪:Context Engineering × Multi Agent

时代:2023 年中—2024 年

几件事同时发生:函数调用能力成熟、RAG 技术普及、上下文窗口扩展到 128K、AutoGPT 和 LangChain 爆红。

工程师们开始意识到:他们真正在做的事情,是管理模型在每个时刻能看到什么信息

这就是 Context Engineering 范式的诞生。

Context Engineering 的本质

核心命题:如何通过精心设计和动态管理上下文,让模型在正确的时机获得正确的信息?

与 Prompt Engineering 的本质区别:前者是静态的,Context Engineering 是动态的

记忆系统

  • 短期记忆:当前对话历史的管理与压缩
  • 长期记忆:跨会话的用户偏好持久化
  • 语义记忆:基于向量数据库的相似度检索
  • 过程记忆:Agent 执行任务时积累的中间状态

检索增强(RAG)

从外部知识库实时检索相关文档,注入上下文。核心挑战不是检索本身,而是相关性判断——有限窗口内,什么值得放进来?

工具定义

模型可以查询数据库、调用 API、执行代码、操作文件系统。工程师的任务是设计清晰的工具接口。

上下文压缩

即使窗口扩展到 128K,长上下文中的关键信息会被"注意力稀释",工程师需要主动压缩历史、裁剪无关内容。

Multi Agent 架构的崛起

Context Engineering 的复杂度最终超出了单个 Agent 的管理能力,催生了 Multi Agent 系统。

核心思想是分工。典型模式:

流水线模式:Planner → Executor → Reviewer,顺序传递

监督者模式:一个主控 Agent 负责调度,多个专门化 Worker 负责执行

对等协作模式:多个 Agent 互相审查、辩论、达成共识

Multi Agent 的工程挑战

状态同步、错误传播、调试困难……其中最致命的是技能碎片化

这个矛盾,正是推动范式进入第三纪的核心张力。

第二纪留下的遗产

模型的能力边界不是固定的,它取决于你为它构建的信息环境。

工程师的价值不再是"操控模型",而是"为模型创造最优化的运行环境"。


第三纪:Harness Engineering × Agent Skills + Agent Teams

这个阶段的工程师发现,他们真正在做的事情是:构建让 Agent 能够自主运作、自我改进、横向扩展的基础设施。

这就是 Harness Engineering。

"Harness"是什么意思?

Harness 来自马具——把马的力量引导和约束成可用牵引力的装置。

Harness Engineering 的核心命题:如何构建一套基础设施,使 Agent 的能力可以被系统性地定义、扩展、复用和进化?

技能系统(Skill System)

这是第三纪最核心的工程创新。

关键特性:

  • 按需加载:Agent 根据任务类型动态决定加载哪些 Skill,而非一次性注入所有规则
  • 自动生成:Agent 完成复杂任务后,可以自动将成功的决策路径提炼为新的 Skill
  • 版本演进:Skill 可以被改进、打分、淘汰,形成进化压力

在 Claude Code 中,Skill 系统通过 superpowers 插件实现,每个 Skill 定义了特定工程场景的最佳实践。

工具注册与发现

Agent Teams:能力的组织化

Agent Teams 是 Multi Agent 的进化版本,核心区别在于制度设计而非技术实现。

Multi Agent 解决的是"多个 Agent 如何协作完成一个任务";Agent Teams 解决的是"如何建立一套可持续运转的 Agent 组织"。

具体体现:

  • 角色规范化:Team Lead、Researcher、Implementer、Reviewer 等角色有标准化的职责边界
  • 任务管理系统:Task 有明确的状态机,支持依赖关系、阻塞检测
  • 异步通信:Agent 之间通过消息传递而非直接调用,解耦执行时序
  • 工作树隔离:每个 Agent 在独立的工作空间中执行,避免状态冲突

一个典型工作流:

用户请求 → Team Lead 分解任务 → 并行分配给 Explore / Plan / Implement Agent → 同步点检查 → Review Agent 审查 → 整合输出

记忆与学习循环

第三纪的记忆系统不再只是"存储信息",而是知识的自动提炼和主动强化

对话结束时,系统主动评估本次交互中有哪些新的洞察值得持久化;周期性整合记忆库,消除冗余;Agent 可以搜索自己过去的对话记录,跨会话调用历史经验。

Harness Engineering 的工程师画像

不再需要:记忆大量 Prompt 技巧、手工调整模型参数、为每个场景写定制化模板。

开始需要

  • 系统设计能力:设计 Agent 的执行模型、工具边界、状态机
  • 协议设计能力:定义 Agent 之间的通信协议、Skill 的接口规范
  • 基础设施意识:理解 Agent 系统的可靠性、可观测性、扩展性需求
  • Skill 工程能力:从经验中提炼可复用的能力单元,维护其生命周期
  • 组织设计能力:为 Agent Teams 设计合理的角色分工和协作流程

三纪全景对照

维度第一纪第二纪第三纪
工程范式Prompt EngineeringContext EngineeringHarness Engineering
系统形态Single AgentMulti AgentSkills + Teams
核心问题让模型听话让模型理解全局让 Agent 自主进化
核心技能写好指令管理信息流设计 Agent 基础设施
能力上限模型上限上下文质量Harness 设计质量
状态无状态会话状态持久化 + 跨 Agent
学习能力有限持续进化
典型工具ChatGPTLangChainClaude Code / Hermes

结语:工程的终点是什么?

回顾三次范式跃迁,有一个清晰的主线:工程师与模型之间的"距离"在不断拉大。

第一纪,工程师直接和模型说话,一问一答。

第二纪,工程师设计信息管道,让模型在正确的信息环境中工作。

第三纪,工程师构建运行基础设施,让 Agent 在其中自主决策、自我改进。

这个趋势还会继续。下一步,工程师不再直接编写 Skill,而是定义"Skill 应该满足什么标准",让系统自动生成、测试和选择最优 Skill;不再手动配置 Agent Teams,而是描述"需要完成什么类型的工作",让系统动态组建最合适的团队。

这听起来像是工程师在"失去控制",但实际上恰恰相反——工程师的控制层级在提升。从操控单个模型的输出,到设计让无数 Agent 正确运作的制度和基础设施 ,工程师的杠杆率在成倍放大。

有一个值得思考的类比:操作系统工程师不运行用户程序,但他们决定了用户程序能做什么、怎么做、在什么约束下做。Harness Engineer 与 Agent 的关系,越> 来越接近于这种关系。

工程师从指令的撰写者,进化为系统的设计者。

而能够设计出让 AI 自主运作、持续进化、可靠扩展的系统,将成为这个时代最核心的工程能力。


参考:Hermes Agent(Nous Research)、Claude Code(Anthropic)等开源项目设计理念,以及 Context Engineering、Agent Harness 等社区概念。 ~