一天一个开源项目（第82篇）：Harness Engineering —— 从“提示语工程”到“驭缰工程”的范式跃迁

引言

“让机器的力量被精确引导，而不是失控乱跑。”

这是“一天一个开源项目”系列的第82篇文章。今天带你了解的项目是 Harness Engineering（harness-engineering）。

在 AI 编程工具（如 Claude Code, GitHub Copilot, Gemini）飞速发展的今天，我们正面临一个从“人坐在 IDE 前敲代码”到“Agent 自主执行任务”的拐点。然而，通用的 AI 助手在复杂生产环境中往往表现不稳定。Harness Engineering（中文译为：驭缰工程）应运而生，它不是一门关于“如何写 Prompt”的学问，而是一门关于“如何为 AI Agent 构建安全、高效、可验证的运行环境”的工程学科。

你将学到什么

核心范式：从 Prompt Engineering 到 Harness Engineering 的本质区别。
驭缰六柱：约束（Constraints）、工具（Tools）、反馈（Feedback）等核心要素。
机械执行（Mechanical Enforcement）：如何用 Linter 和测试代替口头叮嘱。
Agent 可读性：如何重构你的代码库，让 AI 更好地理解和操作。
实战参考：通过 11 篇深度翻译与原创分析，建立完整的 AI 原生工程思维。

前置知识

了解 AI Agent 或 LLM 编程助手的基本使用。
具备基础的软件工程概念（CI/CD、代码审查、单元测试）。
对“为什么 AI 有时会胡说八道”有基本的认知。

项目背景

项目简介

Harness Engineering 是一个由开发者 deusyu 发起并深度维护的内容库。它系统性地归纳了 AI Agent 时代工程师的角色转变：从“Coding for Machines”（为人机交互写代码）转向“Designing Scaffolding for Agents”（为 Agent 设计脚手架）。

该项目记录了一个完整的学习与实践旅程：从最初的理论翻译，到构建名为 Ralph 的自主循环（Fail-Refine Loop），再到在大规模代码库中实现“7 人管理 1500 个 PR”的真实案例。

作者/团队介绍

作者：deusyu
核心动机：解决 AI Agent 在生产环境中的可靠性问题，推动软件工程进入“自动驾驶”时代。
创建时间：2026-03

项目数据

⭐ GitHub Stars: [由于是深度内容库，处于早期增长阶段]
🍴 Forks: [早期阶段]
📦 核心内容：5 大阶段（概念、思考、实践、反馈、作品）
📄 License: MIT
🌐 仓库地址: github.com/deusu/harne…

主要功能

核心作用

Harness Engineering 的核心作用是将 AI 编程从“对话模式”提升为“工业生产模式”。通过在代码库中预设“缰绳”（Harness），让 AI Agent 像在轨道上运行的列车，不仅跑得快，而且不脱轨。

使用场景

Agent 自动重构项目：
- 当你需要对数千行代码进行架构迁移时，通过 Harness 提供明确的规范文档（如 AGENTS.md）和强制的 CI 检查，确保 Agent 不会破坏业务逻辑。
构建“自愈型”流水线：
- 建立 Ralph 循环，让 Agent 在遇到测试失败时能根据报错信息自动修复代码并重新运行，直到通过。
管理大规模 AI 贡献者：
- 在一个大型 Team 中，通过“机械执行”而非“文档说明”来约束 AI 的行为，降低沟通熵。

快速开始

这个项目不是一个可以直接运行的 npm 包，而是一套工程方法论的实验室。你可以通过以下步骤将其应用到你的项目中：

克隆项目并学习 works/ 目录下的核心概念。
在你的代码库根目录创建一个 AGENTS.md：
- 明确定义项目背景、技术栈、核心约束和禁止行为。
引入“机械执法”：
- 编写一段 Bash 脚本，强制在 Agent 提交代码前运行 linter 或特定的验证逻辑。
参考实验案例：
- 学习 practice/ 目录下的 Ralph 演示，了解如何构建“提议-审查-确认”的闭环。

核心特性

范式转变：强调“Repo 是唯一的真相”。AI 看不到 Slack 里的讨论，所有设计意图必须作为代码资产存在。
逐步披露 (Progressive Disclosure)：通过 AGENTS.md 的层级结构引导 Agent，避免上下文窗口被无关信息塞满。
低熵配置：倡导使用“枯燥”且成熟的技术堆栈，因为模型对这些代码的理解力最强。
验证大于教导：与其告诉 AI “不要改这个变量”，不如写一个检测脚本，如果它改了就报错。

项目优势

对比项	Harness Engineering	传统的 Prompt Engineering
重心	环境、工具、物理约束	措辞、角色设定、技巧
可靠性	极高（由 CI/CD 等机械系统保障）	不稳定（受模型随机性影响）
可扩展性	支持大规模、多 Agent 协作	仅限于单次对话或简单任务
演进方向	工业流水线	个人效率助手

项目详细剖析

从“说话”到“建房”的哲学

该项目最深刻的见解在于：你不能通过更好地道歉来管理一个失控的员工，你只能通过改变他的工作流程和权限。

核心模块解析

works/（5 星推荐）：包含了对 OpenAI、Martin Fowler、Anthropic 等机构核心思想的专业翻译。它是目前中文互联网上关于“AI 如何改变软件工程”最深度的资料集之一。
AGENTS.md 规范：项目提出了一种通用的 Agent 引导规范。它像是一个“路牌系统”，告诉刚进入代码库的 AI Agent：这是哪，去哪读详细规格，哪些红线不能碰。
Ralph 循环模型：一种“失败-改进”的闭环。它模拟了工程师修复 Bug 的过程，但将其完全自动化。

项目地址与资源

官方资源

🌟 GitHub: github.com/deusu/harne…
📚 核心作品集: 见 works/ 目录，包含关于 Cybernetics（控制论）在软件工程中应用的探讨。

适用人群

资深工程师/架构师：希望构建生产级 AI Agent 工作流的专业人士。
技术 Leader：思考如何将 AI 融入研发生产力（Vibe Coding）的决策者。
开源爱好者：对下一代软件工程开发范式感兴趣的探索者。

欢迎来我的个人主页找到更多有用的知识和有趣的产品