一、引言:AI 工程方法的演进之路
2022年底,ChatGPT 的发布让全世界第一次见识到了大语言模型的威力。人们发现,只要输入一段文字,AI 就能生成令人惊叹的内容。
但很快,一个关键问题浮现出来:如何让 AI 持续、稳定、可控地输出高质量结果?
过去三年,AI 工程领域经历了三次重要的范式跃迁:
┌─────────────────────────────────────────────────────────────────┐
│ AI 工程的三次范式跃迁 │
├─────────────────────────────────────────────────────────────────┤
│ │
│ 2023 2024 2025-2026 │
│ │ │ │ │
│ ▼ ▼ ▼ │
│ ┌────────┐ ┌────────┐ ┌────────────┐ │
│ │ Prompt │ → │ Context│ → │ Harness │ │
│ │Engineer│ │Engineer│ │Engineering │ │
│ │ ing │ │ ing │ │ │ │
│ └────────┘ └────────┘ └────────────┘ │
│ │
│ 单次交互 上下文管理 系统设计 │
│ 优化提示 增强理解 构建环境 │
│ │
└─────────────────────────────────────────────────────────────────┘
每一次跃迁,都代表着人类与 AI 协作方式的深化,也预示着工程师角色的根本性转变。
二、第一次跃迁:Prompt Engineering(2023年)
2.1 背景:发现"提示"的力量
ChatGPT 发布后,人们很快意识到:同样的模型,不同的输入,输出质量天差地别。
一段精心设计的提示词,可以让 GPT-3.5 达到 GPT-4 的效果;而糟糕的提示词,会让 GPT-4 表现得像智障。
Prompt Engineering 应运而生。
2.2 核心思想
通过优化输入提示(Prompt),引导 AI 产生更好的输出。
2.3 关键技术
技术
说明
示例
Zero-shot
直接提问,不给示例
"翻译这段文字为英文"
Few-shot
提供几个示例
"参考以下例子,翻译这段文字"
Chain-of-Thought
引导 AI 逐步思考
"让我们一步一步思考..."
Role Prompting
赋予 AI 特定角色
"你是一位资深程序员..."
Structured Output
要求特定格式输出
"用 JSON 格式返回结果"
2.4 局限性
Prompt Engineering 解决的是单次交互的问题,但当场景变得复杂时,它的局限开始显现:
-
上下文长度限制:无法处理长文档或长对话
-
状态无法保持:每次对话都是独立的
-
缺乏系统性:难以构建复杂的应用流程
-
可维护性差:提示词散落在各处,难以管理
┌─────────────────────────────────────────┐ │ Prompt Engineering 的局限 │ ├─────────────────────────────────────────┤ │ │ │ 用户 ──→ [Prompt] ──→ AI ──→ 输出 │ │ ↑ │ │ └──── 每次重新输入,无记忆 │ │ │ │ 问题: │ │ ❌ 上下文长度有限 │ │ ❌ 无法保持长期状态 │ │ ❌ 难以构建复杂流程 │ │ ❌ 提示词管理困难 │ │ │ └─────────────────────────────────────────┘
三、第二次跃迁:Context Engineering(2024年)
3.1 背景:突破上下文的瓶颈
随着应用场景的深入,人们发现:AI 的能力不仅取决于提示词,更取决于它能"看到"多少相关信息。
RAG(Retrieval-Augmented Generation,检索增强生成)的兴起,标志着 AI 工程进入了 Context Engineering 时代。
3.2 核心思想
通过优化 AI 能够访问的上下文(Context),提升其理解和生成能力。
3.3 关键技术
┌─────────────────────────────────────────────────────────┐
│ Context Engineering 架构 │
├─────────────────────────────────────────────────────────┤
│ │
│ ┌─────────────┐ ┌─────────────┐ │
│ │ 外部数据源 │ │ 用户查询 │ │
│ │ - 文档 │ │ │ │
│ │ - 数据库 │ │ │ │
│ │ - API │ │ │ │
│ └──────┬──────┘ └──────┬──────┘ │
│ │ │ │
│ ▼ ▼ │
│ ┌─────────────────────────────────────┐ │
│ │ 检索系统 (Retrieval) │ │
│ │ - 向量数据库 (Vector DB) │ │
│ │ - 嵌入模型 (Embedding) │ │
│ │ - 相似度搜索 (Similarity Search) │ │
│ └──────────────────┬──────────────────┘ │
│ │ │
│ ▼ │
│ ┌─────────────────────────────────────┐ │
│ │ 上下文组装 (Context Builder) │ │
│ │ - 相关性排序 │ │
│ │ - 上下文截断 │ │
│ │ - 多源融合 │ │
│ └──────────────────┬──────────────────┘ │
│ │ │
│ ▼ │
│ ┌─────────────────────────────────────┐ │
│ │ 增强提示 = 系统提示 + 上下文 + 用户问题 │ │
│ └──────────────────┬──────────────────┘ │
│ │ │
│ ▼ │
│ ┌─────────┐ │
│ │ LLM │ │
│ └────┬────┘ │
│ │ │
│ ▼ │
│ [输出] │
│ │
└─────────────────────────────────────────────────────────┘
3.4 关键组件
组件
功能
代表技术
向量数据库
存储和检索语义向量
Pinecone, Weaviate, Milvus
嵌入模型
将文本转换为向量
OpenAI Ada, BGE, M3E
RAG 框架
整合检索和生成
LangChain, LlamaIndex
重排序模型
优化检索结果排序
Cohere Rerank, BGE Reranker
3.5 进步与局限
进步:
- ✅ 突破了上下文长度限制
- ✅ 可以访问外部知识
- ✅ 输出更加准确和可控
- ✅ 支持复杂的企业应用场景
局限:
-
❌ 仍然以单次交互为主
-
❌ 缺乏长期记忆和状态管理
-
❌ 难以处理多步骤复杂任务
-
❌ 无法自主规划和执行
┌─────────────────────────────────────────┐ │ Context Engineering 的局限 │ ├─────────────────────────────────────────┤ │ │ │ 用户 ──→ [查询] ──→ 检索系统 ──→ 上下文 │ │ │ │ │ ▼ │ │ [LLM] ──→ 输出 │ │ │ │ 问题: │ │ ❌ 仍然是单次请求-响应模式 │ │ ❌ 无状态,每次重新检索 │ │ ❌ 无法自主执行多步骤任务 │ │ ❌ 缺乏规划和决策能力 │ │ │ └─────────────────────────────────────────┘
四、第三次跃迁:Harness Engineering(2025-2026年)
4.1 背景:Agent 时代的到来
2024-2025年,AI Agent 技术突飞猛进:
- OpenAI Codex:能够独立完成编程任务
- Claude Computer Use:可以操作计算机执行复杂任务
- AutoGPT、BabyAGI:尝试自主规划和执行
- Devin:号称"第一个 AI 软件工程师"
但人们很快发现:让 AI 自主行动是一回事,让它可靠、可控、高效地工作完全是另一回事。
Harness Engineering 应运而生。
4.2 核心思想
通过设计和构建 AI Agent 的工作环境(Harness),包括约束机制、反馈回路和控制系统,让 AI 能够自主、可靠、可持续地完成任务。
4.3 与前两次范式的本质区别
维度
Prompt Engineering
Context Engineering
Harness Engineering
核心对象
提示词
上下文
Agent 环境
关注焦点
单次交互
信息检索
系统设计
时间维度
瞬时
单次会话
长期运行
主动性
被动响应
被动响应
主动执行
状态管理
无
有限
完整持久化
反馈机制
无
无
闭环反馈
人类角色
操作者
信息提供者
环境设计师
4.4 Harness Engineering 的核心架构
┌─────────────────────────────────────────────────────────────────┐
│ Harness Engineering 系统架构 │
├─────────────────────────────────────────────────────────────────┤
│ │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ 控制平面 (Control Plane) │ │
│ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ │
│ │ │任务调度 │ │状态管理 │ │监控告警 │ │人机接口 │ │ │
│ │ └────┬────┘ └────┬────┘ └────┬────┘ └────┬────┘ │ │
│ │ └─────────────┴─────────────┴─────────────┘ │ │
│ └──────────────────────────┬───────────────────────────────┘ │
│ │ │
│ ▼ │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ AI Agent (执行者) │ │
│ │ ┌─────────────────────┐ │ │
│ │ │ 规划 (Planning) │ │ │
│ │ │ 执行 (Execution) │ │ │
│ │ │ 反思 (Reflection) │ │ │
│ │ └─────────────────────┘ │ │
│ └──────────────────────────┬───────────────────────────────┘ │
│ │ │
│ ▼ │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ 约束机制 (Constraints) │ │
│ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ │
│ │ │架构约束 │ │代码规范 │ │安全规则 │ │资源限制 │ │ │
│ │ └─────────┘ └─────────┘ └─────────┘ └─────────┘ │ │
│ └─────────────────────────────────────────────────────────┘ │
│ │ │
│ ▼ │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ 反馈回路 (Feedback Loops) │ │
│ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ │
│ │ │自动测试 │ │代码审查 │ │性能监控 │ │质量评估 │ │ │
│ │ └────┬────┘ └────┬────┘ └────┬────┘ └────┬────┘ │ │
│ │ └─────────────┴─────────────┴─────────────┘ │ │
│ │ ↓ 失败时循环 │ │
│ │ └────────────────→ Agent 重新执行 │ │
│ └─────────────────────────────────────────────────────────┘ │
│ │
└─────────────────────────────────────────────────────────────────┘
五、三次范式的演进逻辑
5.1 演进的核心驱动力
┌─────────────────────────────────────────────────────────┐
│ 演进的核心驱动力 │
├─────────────────────────────────────────────────────────┤
│ │
│ 需求升级 │
│ │ │
│ ▼ │
│ ┌─────────────────────────────────────────────────┐ │
│ │ 从"能用" → "好用" → "可靠" → "自主" │ │
│ │ │ │
│ │ • 生成一段文字 (Prompt Engineering) │ │
│ │ • 基于知识回答 (Context Engineering) │ │
│ │ • 独立完成项目 (Harness Engineering) │ │
│ └─────────────────────────────────────────────────┘ │
│ │ │
│ ▼ │
│ 技术成熟度 │
│ │ │
│ ▼ │
│ ┌─────────────────────────────────────────────────┐ │
│ │ LLM 能力 → RAG 技术 → Agent 框架 → 系统工程 │ │
│ └─────────────────────────────────────────────────┘ │
│ │
└─────────────────────────────────────────────────────────┘
5.2 人类角色的转变
范式
人类角色
核心能力
Prompt Engineering
提问者
表达清晰、理解 AI 特性
Context Engineering
信息架构师
知识管理、检索优化
Harness Engineering
系统设计师
架构设计、约束设计、流程编排
5.3 技术栈的演进
Prompt Engineering 时代:
├── 提示词模板
├── 提示词库管理
└── A/B 测试工具
Context Engineering 时代:
├── 向量数据库 (Pinecone, Milvus)
├── 嵌入模型 (OpenAI, BGE)
├── RAG 框架 (LangChain, LlamaIndex)
└── 文档处理管道
Harness Engineering 时代:
├── Agent 框架 (AutoGPT, LangGraph)
├── 工作流引擎
├── 可观测性平台
├── 自动化测试系统
├── 约束规则引擎
└── 人机协作界面
六、为什么 Harness Engineering 是必然趋势?
6.1 需求侧:应用场景的深化
- 从对话到执行:用户需要 AI 不只是"说说而已",而是真正"做事"
- 从辅助到自主:企业需要 AI 能够独立完成复杂任务
- 从实验到生产:AI 系统需要满足可靠性、可维护性、可扩展性要求
6.2 供给侧:技术的成熟
- LLM 能力跃升:推理能力、代码能力、规划能力大幅提升
- 工具生态完善:从模型到框架到平台的完整链条
- 工程经验积累:从失败中学习,形成最佳实践
6.3 行业信号
公司/组织
动作
意义
OpenAI
发布 Harness Engineering 方法论
官方认可新范式
Anthropic
提出 AI-Native Software Engineering
行业共识形成
LangChain
从第 30 跃升至第 5
实践验证有效
Cursor
Self-Driving Codebases
产品化落地
七、对工程师的启示:如何拥抱新范式?
7.1 技能升级路径
┌─────────────────────────────────────────────────────────┐
│ 技能升级路径 │
├─────────────────────────────────────────────────────────┤
│ │
│ 阶段 1:掌握 Prompt Engineering │
│ ├── 学习提示词设计原则 │
│ ├── 掌握 Few-shot、CoT 等技术 │
│ └── 建立提示词工程思维 │
│ │
│ 阶段 2:掌握 Context Engineering │
│ ├── 理解嵌入和向量检索 │
│ ├── 掌握 RAG 架构设计 │
│ └── 学习知识库构建 │
│ │
│ 阶段 3:掌握 Harness Engineering │
│ ├── 理解 Agent 架构和规划 │
│ ├── 学习约束设计和反馈系统 │
│ ├── 掌握可观测性和可靠性工程 │
│ └── 培养系统架构思维 │
│ │
└─────────────────────────────────────────────────────────┘
7.2 思维转变
从"我来做"到"我设计让 AI 做":
- 不再是"我写代码",而是"我设计编码环境"
- 不再是"我解决问题",而是"我设计问题解决系统"
- 不再是"我管理项目",而是"我编排 AI 团队"
7.3 实践建议
- 从小处开始:先在一个小项目中应用 Harness 理念
- 关注可观测性:建立完善的监控和日志系统
- 设计约束优先:在让 AI 自由发挥之前,先设定好边界
- 持续迭代:Harness 本身也需要不断演进
八、未来展望:第四次跃迁会是什么?
虽然 Harness Engineering 刚刚兴起,但我们已经可以窥见未来的可能性:
8.1 可能的演进方向
方向
描述
关键技术
Meta-Harness
AI 设计 Harness 的 AI
元学习、自动机器学习
多 Agent 协作
多个 Agent 组成的团队
多智能体系统、组织理论
自适应 Harness
根据任务自动调整 Harness
强化学习、神经架构搜索
人机融合 Harness
人类和 AI 无缝协作
人机交互、协同智能
8.2 终极愿景
软件工程的未来:人类定义目标和约束,AI 负责实现和优化,Harness 是连接两者的桥梁。
九、结语:范式跃迁中的机遇
从 Prompt Engineering 到 Context Engineering,再到 Harness Engineering,每一次跃迁都带来了新的机遇和挑战。
对于技术人来说,最重要的是保持学习和适应的能力:
- 不要固守旧技能:编码能力仍然重要,但不再是唯一
- 拥抱系统设计思维:从局部优化转向全局架构
- 关注人机协作:理解 AI 的能力和边界,设计最佳协作模式
Harness Engineering 不是终点,而是新的起点。
在这个 Agent 时代,最大的机会属于那些能够设计让 AI 高效工作的人类工程师。