2026年5月21日,星期四
导语
今天,我们见证了 Google I/O 2026 上 Antigravity 2.0 的发布,也回顾了 Claude Code 源码泄漏后的架构揭秘。这两个看似独立的事件,实际上指向了同一个趋势:AI Agent 正在从"工具"进化为"平台"。
本文将结合 Claude Code 的 51.2 万行源码分析和 Antigravity 2.0 的产品设计,深入探讨 AI Agent 架构设计的核心模式和最佳实践。
一、1.6% vs 98.4%:Agent 架构的真相
Claude Code 源码泄漏事件给我们最大的启示是什么?
51.2 万行代码中,只有 1.6% 是真正的 AI 决策逻辑,其余 98.4% 都是确定性基础设施。
这个数字彻底颠覆了很多人对 AI Agent 的想象。大多数人以为 Agent 的核心是某种精妙的 AI 推理机制,但实际上,真正调用模型的代码只是整个系统里薄薄的一层。
工程启示
构建一个可靠的 AI Agent,难点不在于调用模型,而在于如何管理模型周围的一切:
- 上下文管理(Context Management)
- 工具路由(Tool Routing)
- 权限控制(Permission Control)
- 错误恢复(Error Recovery)
- 状态持久化(State Persistence)
这些"脚手架"代码,才是支撑起整个产品的真正核心。
二、Agent 主循环:七阶段架构模式
Claude Code 的 Agent 主循环采用经典的 while(true) 七阶段架构,这是目前业界最成熟的 Agent 设计模式:
① 上下文加载 → ② 工具路由 → ③ 权限检查 →
④ 模型调用 → ⑤ 响应解析 → ⑥ 工具执行 → ⑦ 状态更新
阶段详解
① 上下文加载
- 构建本轮发送给模型的完整上下文
- 读取 Memory 指针索引(体积小,始终驻留)
- 按需拉取被指针引用的主题文件
- 计算当前剩余的 token 预算
② 工具路由 & 延迟加载
- 决定本轮 API 调用中注入哪些工具的 schema
- defer_loading 机制确保只有"本轮可能用到的"工具才会被注入
- 实践中,每轮调用只注入 8-12 个工具,节省约 96% 的 token 消耗
③ 权限检查(预检)
- 粗粒度的权限过滤
- 查询拒绝记录(DenialLog),避免重复打扰用户
④ 模型调用
- 整个循环中唯一真正调用 AI 的步骤
- 通过 QueryEngine 封装所有网络细节:流式输出、错误重试、token 计费
⑤ 响应解析 + stop_reason 路由
- 识别 stop_reason 并决定下一步走向
- 三种状态:end_turn / tool_use / max_tokens
⑥ 工具执行
- 精细的权限检查(可能弹出用户确认)
- 调用对应工具的 execute() 函数
- 将 tool_result 追加到 messages[]
⑦ 状态更新 & 压缩检查
- 更新 token 计数
- 持久化 session(支持 --resume 恢复)
- 检查是否需要触发上下文压缩策略
三、Antigravity 2.0 的进化:从 IDE 到 Agent 平台
如果说 Claude Code 代表了"单 Agent 架构"的巅峰,那么 Antigravity 2.0 则展示了"多 Agent 协作"的未来。
核心转变
| 维度 | Antigravity 1.0 | Antigravity 2.0 |
|---|---|---|
| 定位 | 带 Agent Manager 的 IDE | Agent 工作台 + CLI + SDK + 云端托管 |
| 核心能力 | 代码补全、智能提示 | 任务编排、Agent 管理 |
| 架构模式 | 单 Agent | 多 Agent 并行协作 |
| 运行方式 | 交互式 | 交互式 + 后台 Scheduled Tasks |
Dynamic Subagents:并行化的威力
Antigravity 2.0 最引人注目的特性是 Dynamic Subagents for Parallelized Workflows:
当你发出一个复杂任务后,主 Agent 会自动拆分出多个子 Agent 并行处理不同部分:
用户任务:"重构这个微服务项目的用户认证模块"
主 Agent 分析后拆分:
├── 子 Agent A:重构后端 API(Node.js)
├── 子 Agent B:更新前端调用(React)
├── 子 Agent C:编写单元测试
├── 子 Agent D:跑浏览器验证
└── Sentinel Agent:监控进度,自我修复
这种架构的优势显而易见:
- 效率提升:原本串行的任务现在并行执行
- 错误隔离:单个子 Agent 失败不影响整体
- 自我修复:Sentinel 监控并自动重启卡住的 Agent
Scheduled Tasks:24/7 运行的 Agent
Antigravity 2.0 另一个重要特性是 Scheduled Tasks:
/schedule "每周一早上9点检查所有项目的依赖更新"
/schedule "每天凌晨2点跑全量测试并生成报告"
/schedule "每小时检查一次代码覆盖率"
这标志着 Agent 从"被动响应"进化为"主动执行",从"交互式工具"进化为"自动化平台"。
四、核心设计模式总结
综合 Claude Code 和 Antigravity 2.0 的设计,我们可以提炼出 AI Agent 架构的六大核心模式:
1. 延迟加载模式(Defer Loading)
问题:几十个工具的 schema 会耗尽 token 预算 方案:只加载本轮可能用到的工具 效果:节省 96% 的工具 schema token 消耗
2. 指针索引模式(Pointer Index)
问题:长期上下文会撑满上下文窗口 方案:用"指针索引"代替"全量注入" 效果:Memory 系统可以管理无限量的长期知识
3. 状态机路由模式(State Machine Routing)
问题:模型响应有多种可能,需要统一处理 方案:stop_reason 状态机(end_turn / tool_use / max_tokens) 效果:清晰的控制流,易于扩展和维护
4. 权限矩阵模式(Permission Matrix)
问题:不同操作需要不同级别的授权 方案:3 种全局模式 × 4 种工具权限等级 效果:灵活且安全的权限管控
5. 子 Agent 模式(Subagent Pattern)
问题:复杂任务需要分工协作 方案:主 Agent 拆分任务,子 Agent 并行执行 效果:效率提升,错误隔离,可扩展
6. 后台任务模式(Background Task)
问题:Agent 不应该只在用户交互时才工作 方案:Scheduled Tasks,支持 cron 表达式 效果:7×24 小时自动化运行
五、给开发者的实践建议
基于以上分析,给想要构建 AI Agent 的开发者以下建议:
1. 架构设计优先
不要一开始就纠结于 prompt 工程。先设计好:
- 主循环的结构
- 上下文管理策略
- 工具路由机制
- 权限控制矩阵
2. 重视"脚手架"代码
98.4% 的基础设施代码不是负担,而是护城河。投入时间构建:
- 完善的错误处理
- 健壮的权限系统
- 高效的上下文压缩
- 可靠的持久化机制
3. 从单 Agent 到多 Agent
初期可以先实现单 Agent 架构(参考 Claude Code),成熟后再演进:
- 引入 AgentTool 支持子 Agent
- 实现任务自动拆分
- 添加并行执行能力
4. 考虑后台运行
不要局限于交互式场景。思考:
- 哪些任务可以后台自动执行?
- 如何设计 Scheduled Tasks?
- 如何实现自我修复机制?
结语
从 Claude Code 的 51.2 万行源码到 Antigravity 2.0 的多 Agent 架构,我们看到 AI Agent 正在快速成熟。
未来的竞争不再是"谁的模型更强",而是"谁的 Agent 架构更完善"。
模型只是大脑,而 Agent 架构才是让整个身体运转起来的神经系统。希望本文的分析能帮助你构建出更强大、更可靠的 AI Agent。
参考来源:
- Claude Code 源码分析(2026年3月泄漏事件)
- Google I/O 2026 Antigravity 2.0 官方发布
- 稀土掘金技术社区讨论
本文首发于稀土掘金,转载请注明出处。