别再“氛围编程”:Matt Pocock Skills 如何把 AI Agent 拉回真实工程

0 阅读5分钟

项目地址: mattpocock/skills

一句话理解

Matt Pocock 的 skills 不是一套炫技提示词,而是一组面向真实软件工程的 Agent 工作流插件。它们把资深工程师在需求澄清、领域建模、TDD、问题诊断、架构治理、任务拆分中的经验,压缩成可重复调用、可组合、可改造的技能。

仓库 README 的核心主张很直接:开发真实应用很难,AI Agent 会放大开发速度,也会放大误解、噪音、坏测试和架构熵。因此,与其把整个流程交给一个庞大框架,不如使用“小而清晰”的技能,让人类仍然掌控工程判断。

它解决的四类 Agent 失败

1. Agent 没理解你要什么

很多 AI 编程失败不是模型不会写代码,而是它在错误问题上工作。/grill-me/grill-with-docs 的思路是先进行一轮高质量追问,把目标、边界、约束、异常分支问清楚,再开始动手。

这对复杂功能尤其关键:Agent 不再急着生成实现,而是先把“你以为它懂了”的部分显性化。

2. Agent 太啰嗦,且不懂项目黑话

仓库强调 共享语言。在真实项目里,“物料化”“课程章节”“Issue tracker”“Triage role”这类词,不只是名词,而是压缩后的领域模型。

/grill-with-docs 会帮助维护 CONTEXT.md 和 ADR,让 Agent 在后续会话中用项目自己的语言思考。这减少了解释成本,也能让命名、文件组织和任务描述更一致。

在这里插入图片描述

3. 代码写出来但不可验证

仓库把反馈循环放在核心位置。/tdd 推动 red-green-refactor:先写失败测试,再写最小实现,最后重构。/diagnose 则要求复现、缩小范围、假设、插桩、修复、回归测试。

这类技能的价值不在于“让 Agent 写更多代码”,而在于让 Agent 持续撞上现实反馈。

在这里插入图片描述

4. 快速开发带来架构泥潭

AI 能更快地产生代码,也能更快地产生复杂度。/zoom-out 要求 Agent 从系统整体解释局部代码;/improve-codebase-architecture 则寻找让模块更“深”、边界更清晰、概念更稳定的机会。

这意味着 Skills 并不只关心产出速度,也关心长期可变更性。

技术结构:小技能,可组合,可迁移

仓库按用途组织技能,主要分为三类:

分类代表技能作用
Engineeringdiagnosegrill-with-docstddto-prdto-issuestriagezoom-outprototype面向代码、架构、测试、需求和任务流
Productivitygrill-mehandoffcavemanwrite-a-skill面向沟通、压缩上下文、交接和创建新技能
Miscgit-guardrails-claude-codesetup-pre-commitscaffold-exercises低频但实用的工程辅助工具

它们以 SKILL.md 为主要载体,既能被 Claude Code 等 Agent 加载,也能迁移到其它支持技能/指令体系的环境。每个技能都尽量保持单一职责,不试图接管整个开发生命周期。

在这里插入图片描述

关键技能速览

/setup-matt-pocock-skills

每个仓库运行一次,用来配置 issue tracker、triage 标签语言、文档保存位置等基础信息。它相当于“项目适配层”,让后续技能能读写同一套上下文。

/grill-with-docs

需求澄清技能的工程增强版。它不只追问,还会帮助沉淀共享语言、更新 CONTEXT.md,必要时记录 ADR。适合在开始一个重要改动前使用。

/tdd

把实现拆成小的垂直切片,并要求每一步都有失败测试、通过实现和重构。它能显著降低 Agent “看起来完成了,其实没被验证”的风险。

/diagnose

用于疑难 bug 和性能问题。它强调先复现,再最小化,再提出假设和插桩,而不是直接猜修复。这是一种把调试纪律写进 Agent 行为的方式。

/to-prd/to-issues

/to-prd 将当前讨论整理为产品需求文档并提交为 issue;/to-issues 则把计划或 PRD 切成可独立领取的垂直任务。两者适合把模糊想法变成可排期的工程工作。

/improve-codebase-architecture

用于周期性审视架构。它会结合 CONTEXT.md 和 ADR 找出模块边界、抽象深度、命名语言方面的改进机会。

与传统 Prompt 的不同

普通 Prompt 往往强调“怎么问模型”,而这个仓库强调“怎么组织工程反馈”。区别大致如下:

维度普通 PromptMatt Pocock Skills
单位一段指令一个可重复调用的工作流
重点生成质量对齐、验证、诊断、架构
上下文临时塞进对话通过 CONTEXT.md、ADR、issue tracker 持久化
失败处理重新提示复现、最小化、插桩、回归测试
人机关系模型替你做人类掌控流程,Agent 执行并反馈

推荐落地方式

  1. 先运行安装命令:
npx skills@latest add mattpocock/skills
  1. 必选 /setup-matt-pocock-skills,让项目知道 issue tracker、标签和文档位置。

  2. 每次重要改动前用 /grill-with-docs,把目标和领域语言对齐。

  3. 写代码时默认走 /tdd,遇到难 bug 切换到 /diagnose

  4. 每隔几天运行 /improve-codebase-architecture,主动还架构债。

最有价值的思想

这个仓库最值得借鉴的不是某个具体技能,而是它对 AI 编程的定位:Agent 不是魔法同事,而是需要工程约束的高吞吐执行器

好的 skills 会迫使 Agent 做三件事:

  • 在动手前对齐语言和目标;
  • 在实现中持续获得真实反馈;
  • 在完成后把知识沉淀回项目上下文。

这也是“real engineering”和“vibe coding”的分界线:前者让速度服务于系统质量,后者让速度掩盖系统风险。

结语

Matt Pocock Skills 给 AI 编程提供了一种很务实的路径:不用等待完美的自治 Agent,也不用接受失控的自动化流程。把工程经验拆成小技能,把项目知识写进文档,把反馈循环嵌入日常开发,AI 才更像可靠的工程伙伴。

如果你的团队已经在使用 Claude Code、Codex 或类似工具,这个仓库很适合作为一套“Agent 工程规范”的起点。