你还在调 Prompt?别人已经在给 LLM 套"缰绳"了
Prompt Engineering 只是起点,Harness Engineering 才是真正的战场。
AI 应用的三个时代
如果回头看 AI 应用的演进,大概分三个阶段:
Prompt Engineering(提示词工程) 核心就一件事:写好 prompt,让模型输出更精准。但你很快会发现,这是在"抽卡"。prompt 质量只能提高抽到 SSR 的概率,永远不是 100%。
Context Engineering(上下文工程) prompt 不够,就喂更多上下文。RAG(检索增强生成)是这个阶段的代表作——先从知识库里搜相关内容,再拼到 prompt 里,让模型基于真实资料回答。MCP、Skill 都属于这个范畴。
Harness Engineering(驾驭工程) 现在到了第三阶段。不再是"写好 prompt",而是在模型外面套一套完整的工程体系,让 LLM 稳定、可控、可重复地干活。
为什么需要 Harness?给马套上缰绳
有个很形象的比喻:
想象你有一匹马,那马很有力量。但真让它干活,光有力量不够——你需要给它套上挽具、缰绳、马鞍,这些统称为 Harness。
模型是引擎,Harness 就是装着 V8 引擎的车。引擎再牛,没有变速箱、没有刹车、没有仪表盘,这车没法上路。
当下的 LLM 很智能,但智能不等于能稳定输出好结果。因为 LLM 天生有 4 个结构性缺陷:
- 无状态——对话结束就失忆
- 无法操作外部世界——只能输出文字,不能查数据库、不能发请求
- 概率输出——同样的输入可能得到不同结果
- 上下文有限——100 万 Token 也有满的时候
Harness 要做的,就是在这 4 个限制之上造一套系统,让模型完成原本做不到的事。
2025 年的 AI Coding 格局
笔记里提到一个趋势:
25 年下半年 Claude Code 接棒 Cursor 在 AI Coding 领域
这很有意思。Coding 是"武无第二"的赛道——代码能跑就是能跑,不能跑就是不能跑,没有"差不多"。所以谁能稳定产出高质量代码,谁就赢。
几个值得关注的方向:
| 产品 | 赛道 | 定位 |
|---|---|---|
| Claude Code | AI Coding | 终端级 Agent,直接操作文件系统 |
| Cursor / Trae | AI Coding | IDE 插件,辅助编程 |
| CodeBuddy(腾讯) | AI Coding | 企业级代码助手 |
| WorkBuddy(腾讯) | 办公自动化 | 微信 + AI 办公 |
| OpenClaw | 办公赛道 | 小龙虾团队出品 |
Claude Code 的崛起不是因为 prompt 写得多好,而是它的 Harness 做得更完整——记忆层、工具层、编排层都搭起来了。
记忆层:Harness 的第一步
笔记里重点讲了记忆层,这也是最先要掌握的。
问题
LLM 无状态,它不记得上一次对话说了什么,也不知道你的项目有什么规范。每次提问都是一张白纸。
方案:文件系统记忆
核心做法就两个文件:
claude.md / agent.md
这两个文件就是 AI 的"导航地图"。把项目的核心约束、技术栈、开发规范写进去,每次对话都自动带上。
实战:/init 初始化
不要急于生成代码。先 /init 初始化项目的记忆。
/init 做的事情是生成项目记忆文件,包含:
- 项目功能和目标
- 技术栈和框架
- 开发规范和约定
- 文件和目录结构
每次 prompt 都会带上这个文件,解决无状态问题。
如果项目中途改了规范——更新 claude.md,再执行一次 /init 就行。
这个模式的本质是:不要指望模型自己记住,用文件帮它记。
Vibe Coding 的误区
笔记里提到了一个词:Vibe Coding(氛围编程)——不断用自然语言去写代码,想到哪写到哪。
这种风格的问题是:没有结构、没有约束、没有记忆。你今天让 AI 写了一个模块,明天不记得昨天怎么写的,又生成另一套风格。
Harness 的第一课就是:用文件系统建立记忆,给 AI 一个稳定的上下文。
总结
| 阶段 | 核心思想 | 你的代码 / 实操 |
|---|---|---|
| Prompt Engineering | 写好提示词 | 设计高质量 prompt |
| Context Engineering | 喂更多上下文 | RAG、MCP、Skill |
| Harness Engineering | 套上工程体系 | claude.md + /init 初始化 |
不要急着写代码,先给 AI 套上缰绳。