引子:当 GitHub Trending 被 Agent 占领
打开这周的 GitHub Trending,你会发现一个有趣的现象:排行榜上几乎一半的项目都和 AI Agent 有关。
Shannon —— 一个全自动的 AI 黑客,在 XBOW 基准测试上跑出了 96.15% 的漏洞发现成功率。GitHub 官方的 gh-aw(Agentic Workflows)悄然上线。字节跳动的 UI-TARS 把多模态 Agent 搬上了桌面。微软的 RD-Agent 要让 AI 驱动研发全流程。还有一堆围绕 Claude Code 生态的项目 —— claude-mem、claude-code-hooks-mastery、claude-skills —— 正在把 Coding Agent 从“能用”推向“好用”。
这不是偶然。2025 年大家忙着验证 Agent 到底能不能用,2026 年一开年,焦点已经转到基础设施建设上了。
这篇文章梳理一下当前 Agent 开发者工具的全貌,帮你理清这个变化很快的生态。
一、Agent 框架:从百花齐放到各据山头
LangChain / LangGraph
LangChain 仍然是生态最完整的框架。但真正值得关注的是 LangGraph —— 它用图(Graph)结构来编排 Agent 的执行流程,比起早期 LangChain 的链式调用,表达能力强了几个数量级。适合需要精细控制 Agent 执行流程的复杂应用。
CrewAI
如果 LangGraph 是“编程式”的 Agent 编排,CrewAI 就是“声明式”的。你定义角色(Agent)、任务(Task)和流程(Process),框架帮你处理协作细节。2026 年初 CrewAI 已经发展到 v1.x 稳定版,加入了内存管理和工具复用机制。适合多 Agent 角色扮演协作。
AutoGen / Dify / Coze
微软的 AutoGen 走对话驱动的多 Agent 协作。Dify 和 Coze(字节跳动)走低代码/无代码路线。Dify 开源,Coze 商业化,2026 年两者都加了 MCP 协议支持。
二、Coding Agent:开发者的第二大脑
Claude Code
Anthropic 的 Claude Code 是目前终端 Coding Agent 里最好用的。它直接跑在终端里,理解整个代码库,能执行命令、操作 Git、重构代码。
本周 Trending 上有三个相关项目:
- claude-mem:自动记录 Claude Code 的每次会话,用 AI 压缩后在未来会话中注入相关上下文。解决了 Agent “金鱼记忆”的问题。
- claude-code-hooks-mastery:系统教你掌握 Claude Code 的 Hooks 机制。Hooks 让你能在 Claude Code 的执行流程中插入自定义逻辑。
- claude-skills:66 个专业技能包,把 Claude Code 变成全栈开发的专家搭档。
这些社区项目集中冒出来,说明 Claude Code 正在从工具变成平台。
Cursor / Windsurf
Cursor 和 Windsurf 走的是 IDE 路线。Cursor 基于 VS Code,把 AI 深度集成进编辑体验。Windsurf(Codeium 出品)则强调“Flow”模式 —— AI 和你交替编辑,像双人编程一样流畅。
GitHub Copilot Agent
GitHub Copilot 在往 Agent 方向进化。github/gh-aw(Agentic Workflows)的出现意味着 Copilot 不再只是自动补全,而是能执行跨文件、跨仓库的复杂工作流。
三、垂直领域 Agent:术业有专攻
Shannon —— AI 安全渗透测试
全自动的 Web 应用安全测试 Agent。96.15% 的漏洞发现率不是靠暴力扫描,而是靠 Agent 像人类黑客一样理解应用逻辑、构造攻击路径。
UI-TARS —— 多模态桌面 Agent
字节跳动的 UI-TARS 做的是“看屏幕操作电脑”。Agent 能看懂 GUI 并操作的话,理论上任何软件都能变成 Agent 的工具。
RD-Agent / 金融 Agent
微软的 RD-Agent 做研发流程自动化,用 AI 驱动数据和模型的迭代。金融领域的 Dexter 和 TradingAgents-CN 也在快速发展。
四、Agent 基础设施:真正的战场
MCP(Model Context Protocol)
Anthropic 主导的 MCP 协议,我认为是 2025-2026 年 Agent 领域最重要的基础设施。MCP 要解决的问题很直接:LLM 应用怎么标准化地连接外部数据源和工具?
到 2026 年 2 月,MCP 已经有了 10 种语言的 SDK(TypeScript、Python、Java、Kotlin、C#、Go、PHP、Ruby、Rust、Swift),几乎覆盖了所有主流开发语言。
MCP 的价值很朴素:以前每个 Agent 框架都自己搞一套工具调用机制,现在有统一标准了。像 HTTP 之于 Web,不性感,但没它不行。
A2A(Agent2Agent Protocol)
如果 MCP 解决的是“Agent 如何使用工具”,那 Google 主导的 A2A 协议解决的是“Agent 如何和 Agent 对话”。
A2A 让不同框架、不同公司的 Agent 能发现彼此的能力,协商交互方式,在长期任务上安全协作,而且不暴露内部状态、记忆或工具。
MCP + A2A 构成了 Agent 基础设施的两根柱子:一个管 Agent 怎么用工具,一个管 Agent 之间怎么对话。
五、趋势判断:Agent 开发正在走向哪里
综合上面这些,Agent 开发生态正在发生几个明显的转变:
1. 从“框架竞争”到“协议竞争”
2024-2025 年,大家比的是谁的 Agent 框架更好用。2026 年,竞争焦点转向了基础设施协议。MCP 和 A2A 的出现意味着 Agent 生态开始有了“公共基础设施”。
2. 从“通用 Agent”到“专业 Agent + 协作”
早期大家都想做一个“什么都能干”的通用 Agent。现在的趋势是:做一个领域里最专业的 Agent,然后通过 A2A 协议让它们协作。
3. 从“产品”到“平台”
Claude Code、Codex 都在从产品变成平台。插件系统、Hooks 机制、技能包,这些都是平台化的信号。
结语:我的预测
站在 2026 年 2 月,说几个我的判断:
-
MCP 会成为事实标准。10 种语言 SDK 已经形成飞轮效应,后来者很难再搞替代协议了。
-
Coding Agent 年底会成为多数开发者的日常工具。不一定是 Claude Code 或 Cursor,但某种形式的 Coding Agent 会跟 Git 一样普遍。
-
垂直领域 Agent 是下一波创业机会。框架和基础设施成熟之后,商业价值在垂直应用里。
-
Agent 可观测性会成为新课题。Agent 自主跑复杂任务时,你得能监控、审计、回放它的行为。
Agent 生态今年会快速发展,不是因为某个模型突然变强了,而是围绕 Agent 的基础设施终于在成型。管道铺好了,水自然就流了。