首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
Harness Engineering
杨艺韬
创建于2026-04-16
订阅专栏
Harness Engineering
等 3 人订阅
共22篇文章
创建于2026-04-16
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Harness Engineering-前言
前言 写作动机 2026 年,AI Agent 正在从技术圈的玩具变成企业的生产力工具。Claude Code、Cursor、Devin、各种 AutoGPT 变体——每周都有新的 Agent 产品发
Harness Engineering-第7章 工具结果处理与错误恢复
第7章 工具结果处理与错误恢复 :::tip 本章要点 理解工具结果从执行到反馈给模型的完整生命周期 掌握结果格式化的原则:何时截断、何时摘要、何时原样返回 建立错误分类体系:五类常见错误及其恢复策略
Harness Engineering-第15章 沙箱、隔离与防御性编程
第15章 沙箱、隔离与防御性编程 :::tip 本章要点 沙箱是权限模型的物理执行层——权限决定"允许做什么",沙箱保证"只能做什么" OS 级沙箱(macOS Seatbelt、Linux secc
Harness Engineering-第13章 多轮对话与会话状态机
第13章 多轮对话与会话状态机 :::tip 本章要点 Agent 交互本质上是多轮状态机:每一轮改变状态,状态决定下一步行为 隐式状态(对话历史)vs 显式状态(LangGraph 的 Channe
Harness Engineering-第12章 长期记忆:持久化与检索
第12章 长期记忆:持久化与检索 :::tip 本章要点 长期记忆让 Agent 跨会话保持连续性:记住用户、项目和过去的经验 记忆类型:用户画像、反馈修正、项目状态、外部引用——各有不同的写入时机和
Harness Engineering-第9章 指令优先级与冲突消解
第9章 指令优先级与冲突消解 9.1 指令从哪里来 一个生产级 Agent 系统在每次模型调用时,面对的不是一条指令,而是来自多个来源的指令集合。 以 Claude Code 为例,当你在终端输入一句
Harness Engineering-第1章 Agent 不等于大模型:Harness 的价值
第1章 Agent 不等于大模型:Harness 的价值 1.1 Demo 五分钟,生产五个月 如果你在 2025 年参加过任何 AI Hackathon,一定见过这样的场景:一个三人小队用一个周末搭
Harness Engineering-第10章 Few-shot、CoT 与动态提示策略
第10章 Few-shot、CoT 与动态提示策略 :::tip 本章要点 Few-shot 在 Agent 场景中不是教模型"怎么回答问题",而是教它"怎么使用工具" Chain-of-Though
Harness Engineering-第17章 Human-in-the-Loop:人机协作设计
第17章 Human-in-the-Loop:人机协作设计 :::tip 本章要点 人机协作是一个频谱:从全手动到全自动,Agent 应在中间找到合适的位置 介入时机:高风险操作、模糊需求、主观判断、
Harness Engineering-第18章 评估与测试方法论
第18章 评估与测试方法论 :::tip 本章要点 Agent 测试不同于传统软件测试——输出非确定性,需要模糊评估 三层评估:单元(工具级)→ 集成(流程级)→ 端到端(任务级) 评估集设计:覆盖典
Harness Engineering-第20章 成本控制与性能优化
第20章 成本控制与性能优化 :::tip 本章要点 Agent 的主要成本来源:LLM API 调用(按 token 计费) 成本优化三板斧:减少 token、用更便宜的模型、缓存重复请求 延迟优化
Harness Engineering-第6章 工具编排与并发执行
第6章 工具编排与并发执行 上一章我们讨论了如何设计好的工具。但设计出来的工具终归要被执行。一个 Agent 在一次对话中可能调用几十甚至上百次工具,如何编排这些调用——按什么顺序、是否并发、如何处理
Harness Engineering-第11章 短期记忆:上下文窗口管理
第11章 短期记忆:上下文窗口管理 :::tip 本章要点 上下文窗口就是 Agent 的"工作记忆"——窗口外的信息对模型不存在 Token 预算是零和博弈:系统提示词、工具定义、对话历史、工具结果
Harness Engineering-第3章 Agent Loop:心跳与决策循环
第3章 Agent Loop:心跳与决策循环 每一个 AI Agent 的核心都是一个循环——观察、思考、行动、再观察。这个循环的工程质量,决定了 Agent 是一个惊艳的 demo 还是一个可靠的生
Harness Engineering-第4章 上下文工程:比 Prompt Engineering 更重要的事
第4章 上下文工程:比 Prompt Engineering 更重要的事 4.1 一个被忽略的关键区分 过去两年,"Prompt Engineering" 成了 AI 领域最热门的词汇之一。无数文章教
Harness Engineering-第5章 Tool Design:给 Agent 造趁手的兵器
第5章 Tool Design:给 Agent 造趁手的兵器 5.1 Tool 的本质:让模型长出手脚 大语言模型天生只有一种能力——生成文本。无论它的推理能力多强,面对"帮我创建一个文件"这种请求,
Harness Engineering-第2章 Agent 架构模式全景
第2章 Agent 架构模式全景 在上一章中我们讨论了为什么需要 Harness 工程——LLM 本身只是引擎,真正让它在复杂任务中跑起来的,是围绕它搭建的架构骨架。本章将系统梳理当前业界主流的六种
Harness Engineering-第16章 多 Agent 协调模式
第16章 多 Agent 协调模式 :::tip 本章要点 多 Agent 的核心价值:专业化分工 + 上下文隔离 四种协调模式:Coordinator、Pipeline、Swarm、Debate 上
Harness Engineering-第8章 System Prompt 分层设计
第8章 System Prompt 分层设计 8.1 System Prompt 不是一段字符串 很多开发者第一次接触 Agent 开发时,system prompt 是这样写的:一个字符串常量,塞在
Harness Engineering-第21章 设计模式与架构决策
第21章 设计模式与架构决策 :::tip 本章要点 从全书 20 章的实践中提炼 10 个核心设计模式 每个模式包括:问题场景、解决方案、真实案例、适用边界 这些模式是跨框架的——无论你用什么技术栈
下一页