AI Agent 已经卷到 77 个了,但真正能用的其实就这四类
最近整理 AI 热榜的 Agent 数据,发现一个让我自己都有点意外的数字:目前收录的 Agent 项目已经达到 77 个,分布在 12 个不同类别里。
这个数字说明两件事:第一,Agent 赛道确实火了,各种方向都在冒头;第二,对开发者来说,选择成本反而变高了——光编程 Agent 就有 21 个,浏览器 Agent 7 个,研究 Agent 9 个,你真的有时间一个一个试吗?
今天想从 AI 热榜整理的数据出发,聊聊 Agent 的分类逻辑,以及怎么快速找到适合自己场景的那一类。
编程 Agent:21 个里,真正值得看的不超过 5 个
编程 Agent 是目前数量最多、也最成熟的一个类目。从 Claude Code、Cursor Agent、Codex 到 Aider、OpenCode、Goose、Gemini CLI,主流选手基本都到齐了。
但数量多不代表都值得花时间。区分它们的关键维度其实就三个:在哪里运行(终端 vs IDE vs 浏览器)、用哪个模型(固定 vs 可选)、开源还是闭源。
比如 Claude Code 和 Cursor Agent 都是 trending 项目,但定位完全不同:一个是终端里的全自主编程 Agent,靠 API 按量计费;一个是 IDE 内置的 Agent 模式,Pro 版 $20/月。Aider 和 OpenCode 则是开源终端方案,支持多模型切换,适合想自己控制成本的开发者。
Devin 的定价是 $500/月,定位是"全球首个 AI 软件工程师",面向的是想把整个开发任务外包给 Agent 的团队。而 Tabby 走的是自托管路线,数据不出服务器,适合对隐私敏感的企业环境。
所以编程 Agent 这个赛道,表面上看是 21 选 1,实际上按使用场景一分,你大概只需要在 3-4 个之间做选择。
浏览器 Agent:这个方向正在快速成熟
浏览器 Agent 是最近涨得比较快的一个类目。核心需求很直接:让 AI 能像人一样操作浏览器——点击、填表、滚动、截图、处理弹窗。
目前收录了 7 个,其中 Browser Use 星标最高(89K+),也是 trending 项目。它的思路是用 Python 控制浏览器,让 LLM 能直接操作网页完成任务。Browser Harness 是同一个团队出的进阶版,增加了自愈能力——当浏览器执行出错时,LLM 能自动修复。
这个类目的价值在于,很多现实世界的任务没法用 API 解决:有些网站没有 API,有些操作需要登录态,有些流程涉及多个页面的交互。浏览器 Agent 恰好补了这个缺口。
研究 Agent:自动调研正在变成标配
研究 Agent 目前有 9 个,核心能力是自动搜索、分析、汇总、生成报告。
GPT Researcher 是这个方向的代表,26K+ 星标,trending 状态。它的流程是:收到研究问题 → 自动拆解子问题 → 并行搜索多个来源 → 交叉验证 → 生成结构化报告。SmolAgents 是 HuggingFace 出的轻量方案,代码优先,适合想在自己流程里嵌入研究能力的开发者。
Karpathy 做的 Autoresearch 则更硬核,面向的是 AI 实验自动化——在单 GPU 上自动跑 nanochat 训练研究。这个方向虽然小众,但对做模型研究的团队来说价值很大。
平台 Agent:零代码构建自己的 Agent
如果你不想写代码,但想搭一个自己的 Agent 工作流,平台类 Agent 是最直接的选择。
Dify 星标 138K+,是开源 LLM 应用开发平台里的头部,可视化拖拽构建 Agent。Coze 是字节跳动的方案,无代码创建 Bot。n8n 做的是工作流自动化,把 AI Agent 能力集成到已有的自动化流程里。Flowise 是拖拽式方案,52K 星标。
这类工具的共同特点是上手门槛低,适合产品经理、运营、或者不想深入技术细节的团队快速验证 Agent 场景。
一些有意思的非主流方向
除了上面四大类,还有几个小众但值得关注的方向:
创作 Agent——Inkos 做的是多 Agent 协作写长篇小说,OpenMontage 是开源视频制作系统,12 条流水线 52 个工具。这说明 Agent 的能力边界已经从"帮你写代码"扩展到了"帮你做内容"。
安全 Agent——OneCLI 是开源凭证保险库,解决的是 Agent 访问各类服务时的密钥安全问题。这个问题现在很多人还没重视,但随着 Agent 越来越多地接入外部服务,迟早会成为刚需。
企业协作 Agent——WeCom CLI 让 AI Agent 能在终端里操作企业微信。这类把 Agent 接入企业 IM 工具的方向,国内需求其实很大。
怎么快速找到适合你的 Agent
AI 热榜给每个 Agent 标了三个维度:类型、定价模式、上手难度。这个设计的意图就是帮你快速筛选。
比如你的需求是"终端里写代码,开源,中等难度",那筛出来就是 Claude Code、Aider、OpenCode 这几个。如果你的需求是"不想写代码,免费,想搭个工作流",那就是 Dify、Coze、Flowise。
77 个 Agent 看着多,但只要先确定自己的场景和约束条件,三步就能收敛到 3-5 个候选。
AI 热榜的 Agent 数据每 6 小时自动更新一次,新增的项目、星标变化、分类调整都会同步。如果你正在选型,可以先去翻一翻,比自己一个个去 GitHub 搜效率高不少。
GitHub:github.com/laolaoshire…