引言
“让机器的力量被精确引导,而不是失控乱跑。”
这是“一天一个开源项目”系列的第82篇文章。今天带你了解的项目是 Harness Engineering(harness-engineering)。
在 AI 编程工具(如 Claude Code, GitHub Copilot, Gemini)飞速发展的今天,我们正面临一个从“人坐在 IDE 前敲代码”到“Agent 自主执行任务”的拐点。然而,通用的 AI 助手在复杂生产环境中往往表现不稳定。Harness Engineering(中文译为:驭缰工程)应运而生,它不是一门关于“如何写 Prompt”的学问,而是一门关于“如何为 AI Agent 构建安全、高效、可验证的运行环境”的工程学科。
你将学到什么
- 核心范式:从 Prompt Engineering 到 Harness Engineering 的本质区别。
- 驭缰六柱:约束(Constraints)、工具(Tools)、反馈(Feedback)等核心要素。
- 机械执行(Mechanical Enforcement):如何用 Linter 和测试代替口头叮嘱。
- Agent 可读性:如何重构你的代码库,让 AI 更好地理解和操作。
- 实战参考:通过 11 篇深度翻译与原创分析,建立完整的 AI 原生工程思维。
前置知识
- 了解 AI Agent 或 LLM 编程助手的基本使用。
- 具备基础的软件工程概念(CI/CD、代码审查、单元测试)。
- 对“为什么 AI 有时会胡说八道”有基本的认知。
项目背景
项目简介
Harness Engineering 是一个由开发者 deusyu 发起并深度维护的内容库。它系统性地归纳了 AI Agent 时代工程师的角色转变:从“Coding for Machines”(为人机交互写代码)转向“Designing Scaffolding for Agents”(为 Agent 设计脚手架)。
该项目记录了一个完整的学习与实践旅程:从最初的理论翻译,到构建名为 Ralph 的自主循环(Fail-Refine Loop),再到在大规模代码库中实现“7 人管理 1500 个 PR”的真实案例。
作者/团队介绍
- 作者:deusyu
- 核心动机:解决 AI Agent 在生产环境中的可靠性问题,推动软件工程进入“自动驾驶”时代。
- 创建时间:2026-03
项目数据
- ⭐ GitHub Stars: [由于是深度内容库,处于早期增长阶段]
- 🍴 Forks: [早期阶段]
- 📦 核心内容:5 大阶段(概念、思考、实践、反馈、作品)
- 📄 License: MIT
- 🌐 仓库地址: github.com/deusu/harne…
主要功能
核心作用
Harness Engineering 的核心作用是将 AI 编程从“对话模式”提升为“工业生产模式”。通过在代码库中预设“缰绳”(Harness),让 AI Agent 像在轨道上运行的列车,不仅跑得快,而且不脱轨。
使用场景
- Agent 自动重构项目:
- 当你需要对数千行代码进行架构迁移时,通过 Harness 提供明确的规范文档(如
AGENTS.md)和强制的 CI 检查,确保 Agent 不会破坏业务逻辑。
- 当你需要对数千行代码进行架构迁移时,通过 Harness 提供明确的规范文档(如
- 构建“自愈型”流水线:
- 建立 Ralph 循环,让 Agent 在遇到测试失败时能根据报错信息自动修复代码并重新运行,直到通过。
- 管理大规模 AI 贡献者:
- 在一个大型 Team 中,通过“机械执行”而非“文档说明”来约束 AI 的行为,降低沟通熵。
快速开始
这个项目不是一个可以直接运行的 npm 包,而是一套工程方法论的实验室。你可以通过以下步骤将其应用到你的项目中:
- 克隆项目并学习
works/目录下的核心概念。 - 在你的代码库根目录创建一个
AGENTS.md:- 明确定义项目背景、技术栈、核心约束和禁止行为。
- 引入“机械执法”:
- 编写一段 Bash 脚本,强制在 Agent 提交代码前运行
linter或特定的验证逻辑。
- 编写一段 Bash 脚本,强制在 Agent 提交代码前运行
- 参考实验案例:
- 学习
practice/目录下的 Ralph 演示,了解如何构建“提议-审查-确认”的闭环。
- 学习
核心特性
- 范式转变:强调“Repo 是唯一的真相”。AI 看不到 Slack 里的讨论,所有设计意图必须作为代码资产存在。
- 逐步披露 (Progressive Disclosure):通过
AGENTS.md的层级结构引导 Agent,避免上下文窗口被无关信息塞满。 - 低熵配置:倡导使用“枯燥”且成熟的技术堆栈,因为模型对这些代码的理解力最强。
- 验证大于教导:与其告诉 AI “不要改这个变量”,不如写一个检测脚本,如果它改了就报错。
项目优势
| 对比项 | Harness Engineering | 传统的 Prompt Engineering |
|---|---|---|
| 重心 | 环境、工具、物理约束 | 措辞、角色设定、技巧 |
| 可靠性 | 极高(由 CI/CD 等机械系统保障) | 不稳定(受模型随机性影响) |
| 可扩展性 | 支持大规模、多 Agent 协作 | 仅限于单次对话或简单任务 |
| 演进方向 | 工业流水线 | 个人效率助手 |
项目详细剖析
从“说话”到“建房”的哲学
该项目最深刻的见解在于:你不能通过更好地道歉来管理一个失控的员工,你只能通过改变他的工作流程和权限。
核心模块解析
works/(5 星推荐):包含了对 OpenAI、Martin Fowler、Anthropic 等机构核心思想的专业翻译。它是目前中文互联网上关于“AI 如何改变软件工程”最深度的资料集之一。AGENTS.md规范:项目提出了一种通用的 Agent 引导规范。它像是一个“路牌系统”,告诉刚进入代码库的 AI Agent:这是哪,去哪读详细规格,哪些红线不能碰。- Ralph 循环模型:一种“失败-改进”的闭环。它模拟了工程师修复 Bug 的过程,但将其完全自动化。
项目地址与资源
官方资源
- 🌟 GitHub: github.com/deusu/harne…
- 📚 核心作品集: 见
works/目录,包含关于 Cybernetics(控制论)在软件工程中应用的探讨。
适用人群
- 资深工程师/架构师:希望构建生产级 AI Agent 工作流的专业人士。
- 技术 Leader:思考如何将 AI 融入研发生产力(Vibe Coding)的决策者。
- 开源爱好者:对下一代软件工程开发范式感兴趣的探索者。
欢迎来我的个人主页找到更多有用的知识和有趣的产品