从 Prompt Engineering 到 Harness Engineering：AI 工程的三次范式跃迁

AI 工程的三次范式跃迁

AI 工程在过去三年，悄悄经历了一场无声的革命。

这背后，有两条平行演进的曲线。

第一条曲线：工程范式的演进

Prompt Engineering → Context Engineering → Harness Engineering

第二条曲线：系统形态的演进

Single Agent → Multi Agent → Agent Skills → Agent Teams

两条曲线是同步的。每一次工程范式的跃迁，都对应着系统形态的一次升级；每一次系统复杂度的提升，都倒逼工程师发展出新的能力维度。

第一纪：Prompt Engineering × Single Agent

时代：2022—2023 年

LLM 能力刚刚爆发，工程界面临的核心问题只有一个：如何让模型按我想要的方式输出？

这个阶段的系统形态极为简单——Single Agent，一问一答。整个技术栈：OpenAI API + 一些字符串拼接。

这个命题催生了大量工程技巧：

结构化指令

发现模型对格式非常敏感。"列出三点"比"告诉我一些"效果好得多。角色扮演可以显著改变输出风格。

Few-shot 示例

在 Prompt 中附上几个期望的输入-输出对，模型会从中归纳模式。这本质上是在推理时进行"即时微调"。

Chain-of-Thought（CoT）

要求模型"一步一步思考"，能显著提升推理任务的准确率。这揭示了一个重要规律：中间步骤的质量决定最终答案的质量。

输出格式控制

要求模型输出 JSON、Markdown 或特定结构，使下游处理成为可能。

能力天花板

上下文窗口只有 4K token，无法处理长文档或大型代码库
每次对话全新开始，无状态
模型只能"说"，不能"做"
能力上限即模型上限，工程师无法突破

第一纪留下的遗产

Prompt Engineering 时代证明了一件事：输入的结构化程度对输出质量有决定性影响。

这个洞察在后续所有工程范式中都得到了继承——只是"输入"的含义越来越宽泛，从一段文字扩展到了整个运行时环境。

第二纪：Context Engineering × Multi Agent

时代：2023 年中—2024 年

几件事同时发生：函数调用能力成熟、RAG 技术普及、上下文窗口扩展到 128K、AutoGPT 和 LangChain 爆红。

工程师们开始意识到：他们真正在做的事情，是管理模型在每个时刻能看到什么信息。

这就是 Context Engineering 范式的诞生。

Context Engineering 的本质

核心命题：如何通过精心设计和动态管理上下文，让模型在正确的时机获得正确的信息？

与 Prompt Engineering 的本质区别：前者是静态的，Context Engineering 是动态的。

记忆系统

短期记忆：当前对话历史的管理与压缩
长期记忆：跨会话的用户偏好持久化
语义记忆：基于向量数据库的相似度检索
过程记忆：Agent 执行任务时积累的中间状态

检索增强（RAG）

从外部知识库实时检索相关文档，注入上下文。核心挑战不是检索本身，而是相关性判断——有限窗口内，什么值得放进来？

工具定义

模型可以查询数据库、调用 API、执行代码、操作文件系统。工程师的任务是设计清晰的工具接口。

上下文压缩

即使窗口扩展到 128K，长上下文中的关键信息会被"注意力稀释"，工程师需要主动压缩历史、裁剪无关内容。

Multi Agent 架构的崛起

Context Engineering 的复杂度最终超出了单个 Agent 的管理能力，催生了 Multi Agent 系统。

核心思想是分工。典型模式：

流水线模式：Planner → Executor → Reviewer，顺序传递

监督者模式：一个主控 Agent 负责调度，多个专门化 Worker 负责执行

对等协作模式：多个 Agent 互相审查、辩论、达成共识

Multi Agent 的工程挑战

状态同步、错误传播、调试困难……其中最致命的是技能碎片化：

这个矛盾，正是推动范式进入第三纪的核心张力。

第二纪留下的遗产

模型的能力边界不是固定的，它取决于你为它构建的信息环境。

工程师的价值不再是"操控模型"，而是"为模型创造最优化的运行环境"。

第三纪：Harness Engineering × Agent Skills + Agent Teams

这个阶段的工程师发现，他们真正在做的事情是：构建让 Agent 能够自主运作、自我改进、横向扩展的基础设施。

这就是 Harness Engineering。

"Harness"是什么意思？

Harness 来自马具——把马的力量引导和约束成可用牵引力的装置。

Harness Engineering 的核心命题：如何构建一套基础设施，使 Agent 的能力可以被系统性地定义、扩展、复用和进化？

技能系统（Skill System）

这是第三纪最核心的工程创新。

关键特性：

按需加载：Agent 根据任务类型动态决定加载哪些 Skill，而非一次性注入所有规则
自动生成：Agent 完成复杂任务后，可以自动将成功的决策路径提炼为新的 Skill
版本演进：Skill 可以被改进、打分、淘汰，形成进化压力

在 Claude Code 中，Skill 系统通过 superpowers 插件实现，每个 Skill 定义了特定工程场景的最佳实践。

工具注册与发现

Agent Teams：能力的组织化

Agent Teams 是 Multi Agent 的进化版本，核心区别在于制度设计而非技术实现。

Multi Agent 解决的是"多个 Agent 如何协作完成一个任务"；Agent Teams 解决的是"如何建立一套可持续运转的 Agent 组织"。

具体体现：

角色规范化：Team Lead、Researcher、Implementer、Reviewer 等角色有标准化的职责边界
任务管理系统：Task 有明确的状态机，支持依赖关系、阻塞检测
异步通信：Agent 之间通过消息传递而非直接调用，解耦执行时序
工作树隔离：每个 Agent 在独立的工作空间中执行，避免状态冲突

一个典型工作流：

用户请求 → Team Lead 分解任务 → 并行分配给 Explore / Plan / Implement Agent → 同步点检查 → Review Agent 审查 → 整合输出

记忆与学习循环

第三纪的记忆系统不再只是"存储信息"，而是知识的自动提炼和主动强化：

对话结束时，系统主动评估本次交互中有哪些新的洞察值得持久化；周期性整合记忆库，消除冗余；Agent 可以搜索自己过去的对话记录，跨会话调用历史经验。

Harness Engineering 的工程师画像

不再需要：记忆大量 Prompt 技巧、手工调整模型参数、为每个场景写定制化模板。

开始需要：

系统设计能力：设计 Agent 的执行模型、工具边界、状态机
协议设计能力：定义 Agent 之间的通信协议、Skill 的接口规范
基础设施意识：理解 Agent 系统的可靠性、可观测性、扩展性需求
Skill 工程能力：从经验中提炼可复用的能力单元，维护其生命周期
组织设计能力：为 Agent Teams 设计合理的角色分工和协作流程

三纪全景对照

维度	第一纪	第二纪	第三纪
工程范式	Prompt Engineering	Context Engineering	Harness Engineering
系统形态	Single Agent	Multi Agent	Skills + Teams
核心问题	让模型听话	让模型理解全局	让 Agent 自主进化
核心技能	写好指令	管理信息流	设计 Agent 基础设施
能力上限	模型上限	上下文质量	Harness 设计质量
状态	无状态	会话状态	持久化 + 跨 Agent
学习能力	无	有限	持续进化
典型工具	ChatGPT	LangChain	Claude Code / Hermes

结语：工程的终点是什么？

回顾三次范式跃迁，有一个清晰的主线：工程师与模型之间的"距离"在不断拉大。

第一纪，工程师直接和模型说话，一问一答。

第二纪，工程师设计信息管道，让模型在正确的信息环境中工作。

第三纪，工程师构建运行基础设施，让 Agent 在其中自主决策、自我改进。

这个趋势还会继续。下一步，工程师不再直接编写 Skill，而是定义"Skill 应该满足什么标准"，让系统自动生成、测试和选择最优 Skill；不再手动配置 Agent Teams，而是描述"需要完成什么类型的工作"，让系统动态组建最合适的团队。

这听起来像是工程师在"失去控制"，但实际上恰恰相反——工程师的控制层级在提升。从操控单个模型的输出，到设计让无数 Agent 正确运作的制度和基础设施，工程师的杠杆率在成倍放大。

有一个值得思考的类比：操作系统工程师不运行用户程序，但他们决定了用户程序能做什么、怎么做、在什么约束下做。Harness Engineer 与 Agent 的关系，越> 来越接近于这种关系。

工程师从指令的撰写者，进化为系统的设计者。

而能够设计出让 AI 自主运作、持续进化、可靠扩展的系统，将成为这个时代最核心的工程能力。

参考：Hermes Agent（Nous Research）、Claude Code（Anthropic）等开源项目设计理念，以及 Context Engineering、Agent Harness 等社区概念。 ~