Harness Engineering

Harness Engineering

Harness Engineering

Harness Engineering

等 3 人订阅共22篇文章创建于2026-04-16

Harness Engineering-前言

前言写作动机 2026 年，AI Agent 正在从技术圈的玩具变成企业的生产力工具。Claude Code、Cursor、Devin、各种 AutoGPT 变体——每周都有新的 Agent 产品发

4天前
75
1
评论

Harness Engineering-第7章工具结果处理与错误恢复

第7章工具结果处理与错误恢复 :::tip 本章要点理解工具结果从执行到反馈给模型的完整生命周期掌握结果格式化的原则：何时截断、何时摘要、何时原样返回建立错误分类体系：五类常见错误及其恢复策略

4天前
13
点赞
评论

Harness Engineering-第15章沙箱、隔离与防御性编程

第15章沙箱、隔离与防御性编程 :::tip 本章要点沙箱是权限模型的物理执行层——权限决定"允许做什么"，沙箱保证"只能做什么" OS 级沙箱（macOS Seatbelt、Linux secc

4天前
22
1
评论

Harness Engineering-第13章多轮对话与会话状态机

第13章多轮对话与会话状态机 :::tip 本章要点 Agent 交互本质上是多轮状态机：每一轮改变状态，状态决定下一步行为隐式状态（对话历史）vs 显式状态（LangGraph 的 Channe

4天前
14
1
评论

Harness Engineering-第12章长期记忆：持久化与检索

第12章长期记忆：持久化与检索 :::tip 本章要点长期记忆让 Agent 跨会话保持连续性：记住用户、项目和过去的经验记忆类型：用户画像、反馈修正、项目状态、外部引用——各有不同的写入时机和

4天前
18
点赞
评论

Harness Engineering-第9章指令优先级与冲突消解

第9章指令优先级与冲突消解 9.1 指令从哪里来一个生产级 Agent 系统在每次模型调用时，面对的不是一条指令，而是来自多个来源的指令集合。以 Claude Code 为例，当你在终端输入一句

4天前
15
点赞
评论

Harness Engineering-第1章 Agent 不等于大模型：Harness 的价值

第1章 Agent 不等于大模型：Harness 的价值 1.1 Demo 五分钟，生产五个月如果你在 2025 年参加过任何 AI Hackathon，一定见过这样的场景：一个三人小队用一个周末搭

4天前
114
2
3

Harness Engineering-第10章 Few-shot、CoT 与动态提示策略

第10章 Few-shot、CoT 与动态提示策略 :::tip 本章要点 Few-shot 在 Agent 场景中不是教模型"怎么回答问题"，而是教它"怎么使用工具" Chain-of-Though

4天前
12
点赞
评论

Harness Engineering-第17章 Human-in-the-Loop：人机协作设计

第17章 Human-in-the-Loop：人机协作设计 :::tip 本章要点人机协作是一个频谱：从全手动到全自动，Agent 应在中间找到合适的位置介入时机：高风险操作、模糊需求、主观判断、

4天前
14
点赞
评论

Harness Engineering-第18章评估与测试方法论

第18章评估与测试方法论 :::tip 本章要点 Agent 测试不同于传统软件测试——输出非确定性，需要模糊评估三层评估：单元（工具级）→ 集成（流程级）→ 端到端（任务级）评估集设计：覆盖典

4天前
15
点赞
评论

Harness Engineering-第20章成本控制与性能优化

第20章成本控制与性能优化 :::tip 本章要点 Agent 的主要成本来源：LLM API 调用（按 token 计费）成本优化三板斧：减少 token、用更便宜的模型、缓存重复请求延迟优化

4天前
18
1
评论

Harness Engineering-第6章工具编排与并发执行

第6章工具编排与并发执行上一章我们讨论了如何设计好的工具。但设计出来的工具终归要被执行。一个 Agent 在一次对话中可能调用几十甚至上百次工具，如何编排这些调用——按什么顺序、是否并发、如何处理

4天前
23
1
评论

Harness Engineering-第11章短期记忆：上下文窗口管理

第11章短期记忆：上下文窗口管理 :::tip 本章要点上下文窗口就是 Agent 的"工作记忆"——窗口外的信息对模型不存在 Token 预算是零和博弈：系统提示词、工具定义、对话历史、工具结果

4天前
28
1
评论

Harness Engineering-第3章 Agent Loop：心跳与决策循环

第3章 Agent Loop：心跳与决策循环每一个 AI Agent 的核心都是一个循环——观察、思考、行动、再观察。这个循环的工程质量，决定了 Agent 是一个惊艳的 demo 还是一个可靠的生

4天前
24
点赞
评论

Harness Engineering-第4章上下文工程：比 Prompt Engineering 更重要的事

第4章上下文工程：比 Prompt Engineering 更重要的事 4.1 一个被忽略的关键区分过去两年，"Prompt Engineering" 成了 AI 领域最热门的词汇之一。无数文章教

4天前
19
1
评论

Harness Engineering-第5章 Tool Design：给 Agent 造趁手的兵器

第5章 Tool Design：给 Agent 造趁手的兵器 5.1 Tool 的本质：让模型长出手脚大语言模型天生只有一种能力——生成文本。无论它的推理能力多强，面对"帮我创建一个文件"这种请求，

4天前
20
1
评论

Harness Engineering-第2章 Agent 架构模式全景

第2章 Agent 架构模式全景在上一章中我们讨论了为什么需要 Harness 工程——LLM 本身只是引擎，真正让它在复杂任务中跑起来的，是围绕它搭建的架构骨架。本章将系统梳理当前业界主流的六种

4天前
25
2
评论

Harness Engineering-第16章多 Agent 协调模式

第16章多 Agent 协调模式 :::tip 本章要点多 Agent 的核心价值：专业化分工 + 上下文隔离四种协调模式：Coordinator、Pipeline、Swarm、Debate 上

4天前
19
点赞
评论

Harness Engineering-第8章 System Prompt 分层设计

第8章 System Prompt 分层设计 8.1 System Prompt 不是一段字符串很多开发者第一次接触 Agent 开发时，system prompt 是这样写的：一个字符串常量，塞在

4天前
16
1
评论

Harness Engineering-第21章设计模式与架构决策

第21章设计模式与架构决策 :::tip 本章要点从全书 20 章的实践中提炼 10 个核心设计模式每个模式包括：问题场景、解决方案、真实案例、适用边界这些模式是跨框架的——无论你用什么技术栈

4天前
23
点赞
评论