Anthropic 官方揭秘:Agent 和 Skills 如何配合工作?来自官方的机制拆解

119 阅读6分钟

🐒 大家好,我是阿衡,10年+游戏后端开发,现在是自由职业、独立游戏开发者。

非专业 AI 玩家,日常关注 AI 编程方向的内容。

📚 这是“Anthropic Skills 官方解读”系列的第 1 篇,共 3 篇:

  1. 本篇:机制拆解 — Agent 和 Skills 如何配合工作?
  2. 思路拆解 — 为什么不做专门化 Agent?
  3. 实战应用 — Skills 在真实场景怎么用?

🎯 这篇文章主要介绍:Anthropic 官方的 Agent + Skills 四层协同架构,以及 Skills 的渐进式加载机制。


1 月 22 日,Anthropic 在官网发了一篇博客,标题叫《Building Agents with Skills: Equipping Agents for Specialized Work》(原文链接🔗在文末)。

直译过来就是:用 Skills 构建 Agent,为 Agent 配备专业工作能力。

这篇文章挺重要的。它不是在讲 Claude 又有了什么新功能,而是在解释 Claude Code 背后的架构思考——Agent 和 Skills 到底是怎么配合工作的。

我读完之后觉得有必要拆解一下,因为这套机制其实回答了一个很核心的问题:

Agent 怎么知道该做什么?


Agent 有智能,但缺专业经验

我们先想一个场景。

你让 Claude 帮你做一份竞品分析报告。Claude 很聪明,理解能力很强,写东西也不错。但问题来了:它知道"竞品分析"该怎么做吗?

该分析哪些维度?数据从哪儿来?输出格式是什么?有没有行业惯例?

这些东西,Claude 不是不能做,而是它没有"专业经验"。

原文里有一句话说得特别好:

"A math genius with no tax experience would struggle with tax returns."

数学天才不一定会报税。智能和专业是两回事。

Claude 就像那个数学天才——有强大的推理能力,但缺乏特定领域的工作经验。

这就是 Skills 要解决的问题。Skills 本质上就是把专业知识打包,让 Agent 能"按攻略行事"。


四层架构:Agent 的工作原理

Anthropic 在文章里画了一张架构图,把 Agent 的工作机制拆成了四层。

writing-system/outputs/2026-01-25-Anthropic-Agent-Skills-机制拆解/images/img_1.png

我们一层层拆解:

第一层:Agent Loop(推理循环)

这是 Agent 的"大脑"。

它负责理解你的需求、规划下一步行动、做出决策。你可以把它想象成一个不断思考的循环:观察 → 思考 → 行动 → 观察 → 思考 → 行动……

第二层:Agent Runtime(运行时)

Agent 规划出来的行动,得有人执行。

Runtime 就是那个执行者。它可以运行代码、调用工具、读写文件。Agent 说"我要查一下这个 API",Runtime 就去查;Agent 说"我要写一段 Python 脚本",Runtime 就去执行。

第三层:MCP Servers(外部连接)

MCP 是 Model Context Protocol 的缩写,你可以理解为"Agent 连接外部世界的桥梁"。

数据库、API、文件系统、Slack、Notion……这些外部工具都可以通过 MCP 接入。Agent 不是孤立的,它需要和真实世界交互,MCP 就是那个接口。

第四层:Skills Library(技能库)

这就是今天的主角,也可以说是最近风头无两的主角。

Skills 是一组文件,里面装着某个领域的专业知识。它告诉 Agent:这个任务该怎么做、有哪些步骤、要注意什么、有什么工具可以用。

四层协同起来是这样的:

Skills 提供专业指导 → Agent Loop 根据指导做决策 → Agent Runtime 执行具体操作 → MCP 连接外部工具和数据


渐进式披露:不是一股脑全塞进去

你可能会想:既然 Skills 这么有用,那是不是把所有技能都加载进来就行了?

不行。上下文窗口是有限的。

Anthropic 的解法叫"渐进式披露"(Progressive Disclosure)。简单说就是:用多少,加载多少。

具体分三层:

第一层:Metadata(元数据)

只有 50 个 token 左右。就是技能的名字、简介、适用场景。Agent 先扫一眼这些,判断哪个技能可能有用。

第二层:SKILL.md(技能说明书)

大概 500 个 token。如果 Agent 觉得某个技能有用,就会读取这个文件,了解具体怎么做。

第三层:References(参考资料)

2000 个 token 以上。详细的文档、模板、代码示例。只有在需要深入了解时才加载。

这个机制很聪明。就像你查字典一样——先看目录,找到可能相关的词条,再翻到那一页细读。不会把整本字典从头背到尾。


Skills + MCP:攻略配工具箱

理解了四层架构,再来看 Skills 和 MCP 怎么配合。

一句话总结:Skills 是攻略,MCP 是工具箱。

还是拿竞品分析举例。

假设你有一个"竞品分析 Skill",它里面写着:

  1. 先确定分析维度(产品功能、定价、用户评价……)
  2. 从公开渠道收集数据
  3. 整理成标准格式
  4. 输出到 Notion

这是攻略。

但攻略本身不能干活。Agent 还需要工具:

  • 用 Web Search MCP 去搜公开信息
  • 用数据库 MCP 查内部数据
  • 用 Notion MCP 把结果写进文档
  • 用 Slack MCP 通知相关同事

Skills 告诉 Agent "该做什么",MCP 让 Agent "能做到"。

这两者缺一不可。光有攻略没有工具,纸上谈兵;光有工具没有攻略,无头苍蝇。


为什么这套架构重要?

Anthropic 在文章里提到,他们之前的思路是"做专门化的 Agent"——金融 Agent、医疗 Agent、法律 Agent……

后来发现这条路走不通,原因下一篇会详细聊。

这里先说结论:通用 Agent + 可插拔的 Skills,比专门化 Agent 更灵活、更可持续。

Skills 把专业知识模块化了。你不需要重新训练一个"金融版 Claude",只需要给 Claude 装上金融 Skills。

这个思路的影响其实挺深远的。它意味着:

  • 专业知识可以独立迭代,不用等模型升级
  • 不同团队可以各自维护自己的 Skills
  • Skills 可以共享、复用,甚至形成市场

💬 你平时是怎么给 AI Agent 配置专业能力的?欢迎在评论区分享你的方法!

👍 觉得有用的话,记得点赞收藏,让更多人看到这篇文章!

下一篇我们再聊聊:为什么 Anthropic 不做专门化 Agent?Skills 这套思路背后的设计哲学是什么?


本文基于 Anthropic 官方博客《Building Agents with Skills: Equipping Agents for Specialized Work》(2026-01-22)解读。

原文链接: claude.com/blog/buildi…


  • #公众号:阿衡的AI日常
  • #小红书:阿衡的AI日常
  • #CSDN:DebugEve
  • #掘金:阿衡Eve