Hermes Agent 是由 Nous Research 开发的开源自我进化型 AI 智能体框架,它在用户交互中自主学习、创建技能、积累记忆,像一个真正「会长大」的 AI 助手,而不只是一个等待指令的工具。
一、一个安静的开源项目,吵醒了整个 AI 圈
2026 年 2 月 25 日,一个叫 Jeffrey Quesnelle 的人在社交媒体上发了一条很短的消息,宣布一个叫 Hermes Agent 的东西正式开源了。
没有发布会,没有预热海报,没有 KOL 矩阵联动推广。就一条消息,一个 GitHub 链接。
50 天后,这个项目的 Star 数逼近 9 万。4 月 11 日那天,单日新增 7,671 颗星——这个数字放在 GitHub 的历史上都极其罕见,大多数现象级开源项目的巅峰日增长也就两三千。它登上了 GitHub Trending 全球第一,版本号从 v0.1.0 一路冲到 v0.9.0,平均每 5 到 10 天发一个大版本。腾讯云在它发布不到两个月的时候就上线了一键部署模板。知乎、掘金、CSDN 上的讨论帖多到刷不完。有人说它是 2026 年最值得关注的 AI 开源项目,有人说它是 OpenClaw 之后第二个真正改变游戏规则的东西。
但要搞清楚 Hermes Agent 到底为什么火成这样,你不能只看这 50 天。你得往前看三年。
三年前,Nous Research 还只是 Discord 里一群不安分的 AI 爱好者。他们没有大厂的背书,没有充裕的资金,只有一个执念——要做出不输大公司的开源 AI 模型。从 Hermes 1 到 Hermes 4,十几个版本的迭代,覆盖 7B 到 405B 参数,他们用行动在开源社区积累了一种极其稀缺的东西:信任。2025 年 4 月,Paradigm 领投了 5000 万美元的 A 轮,估值 10 亿。然后整个下半年,这家公司几乎消失在公众视野里。
没人知道他们在憋什么大招。直到 2026 年 2 月 25 日,答案揭晓——他们不再只做模型了,他们做了一个会自己「长大」的 AI。
Hermes Agent 的 README 里写着一句话:Hermes Agent is a self-improving AI agent。自我改进的 AI 智能体。这话说起来轻飘飘的,但当你看到它能在使用过程中自主创建技能、在跨会话中保持记忆、为每一个用户建立认知模型、甚至独立写出了一部 79,000 字的完整长篇小说——你就知道,这不是又一个包装精美的 demo。
这是一个真的在学习的东西。
二、纵向分析:从诞生到当下
1. 一群不安分的人,在 Discord 里点了一把火
故事要从 2022 年底讲起。
那年年末,ChatGPT 横空出世,整个科技界像被扔进了一锅沸腾的油——所有人都在兴奋,所有人都在焦虑。大公司忙着调兵遣将,小团队忙着找方向。但在这股浪潮中,有一群人的反应很特别:他们不想等大公司施舍 API,他们想自己做模型。
这群人聚集在一个 Discord 服务器里。
Jeffrey Quesnelle,密歇根大学计算机科学的学术背景,研究兴趣横跨机器学习和自然语言处理。他不是那种在大厂里按部就班升 P8 的工程师,而是一个对「开放」有执念的人。在 AI 的世界里,「开放」意味着模型权重公开、训练方法透明、任何人都能在此基础上构建自己想要的东西。
Ryan,在社区里更为人知的 ID 是 Teknium。他的 GitHub 签名写着「开源 AI 先锋」。在 Hermes 之前,他已经因为一系列高质量的开源微调模型在社区里积累了声望。他的技术直觉极好——总能在 Meta、Mistral 等公司放出基座模型后的第一时间,找到最佳的微调策略,做出超越预期的版本。
Karan Malhotra,背景更学术一些。他在斯坦福的脑刺激实验室做过研究,研究方向涉及人类认知和行为。这个背景后来被证明极其重要——Hermes Agent 那套「理解用户、构建用户模型」的设计哲学,跟 Karan 对人类认知的理解密不可分。
还有 Shivani Mitra,在这个几乎全是技术宅的圈子里,她负责把技术落地成产品。
2023 年初,这几个人从 Discord 的业余讨论组变成了一家正式注册的公司,总部设在纽约。名字起得很直接:Nous Research,法语里 "nous" 是「我们」的意思。他们给自己定了一句 slogan:「Artificial Intelligence Made Human」。
这句话看起来像是一句普通的品牌口号,但如果你跟踪 Nous Research 后来三年的轨迹,会发现他们每一个关键决策——从模型微调到 Agent 架构设计——都在执行这句话。它不是 slogan,是路线图。
2. Hermes 系列模型:在开源世界证明自己
Nous Research 做的第一件事,是微调大语言模型。
2023 年 7 月,他们发布了 Hermes 1,基于 Meta 刚放出来的 Llama 2 13B 微调而成。在当时的开源 LLM 排行榜上,这个模型的表现让人吃了一惊——它在多项基准测试中跑出了远超同级别模型的分数。一个只有几个人的小团队,用社区贡献的数据集,做出了跟大公司产品掰手腕的东西。
开源社区的注意力一旦被吸引过来,雪球就开始滚了。
2024 年 1 月,Hermes 2 登场,这次他们切到了 Mistral 的 7B 架构上。随后几个月里,Hermes 2 像连珠炮一样迭代:Hermes 2 Pro(基于 Mistral 7B 和 Llama 3 8B 的双版本)、Hermes 2 Theta(Llama 3 8B)。每一次迭代都踩在上游基座模型放出新版本的时间点上,节奏极快。
到 2024 年 6 月,Hermes 2.5 发布,这回用上了 Mixtral 8x22B 的大杀器。8 个专家的混合架构,总参数量 1410 亿,但推理时只激活其中一部分。性能又上了一个台阶。
但真正让 Nous Research 在行业里站稳脚跟的,是 2024 年 8 月发布的 Hermes 3。
这是一个基于 Llama 3.1 405B 的巨型模型。405B——四千零五十亿参数。在开源世界里,这个量级的模型屈指可数。Hermes 3 的发布本身就是一个信号:Nous Research 不再只是一个做小模型微调的精品工坊,它有能力驾驭最顶级的基座模型。
Hermes 3 还有一个特别的地方:它引入了更丰富的系统提示词支持和角色扮演能力。用户可以通过精心设计的系统提示词,让 Hermes 3 表现出截然不同的「人格」。这不是一个纯粹的工程功能——它背后是 Karan Malhotra 那套关于「AI 行为可塑性」的理论在落地。
2024 年到 2025 年间,Hermes 系列继续推进。2025 年 2 月的 DeepHermes-3 把 DeepSeek 的推理增强技术整合进来;2025 年 8 月的 Hermes 4 实现了「混合推理」,模型可以在不同任务上自动切换推理深度;到 2025 年 12 月,Hermes-4.3-Seed 发布,这是一个 36B 参数的模型,但它的训练方式非常特别——使用了 Nous 自己的 Psyche 分布式训练网络,由全球社区成员贡献算力共同训练完成。
到这个时间点,Nous Research 已经发布了十几个版本的 Hermes 模型,覆盖了从 7B 到 405B 的各种尺寸,横跨 Llama、Mistral、Mixtral 等多个基座架构。他们证明了一件事:一个小团队,靠开源社区的力量,可以持续产出最前沿的 AI 模型。
但模型只是手段,不是目的。
3. 从模型到 Agent:一次关键的战略转向
如果你只看 Hermes 模型系列的迭代速度,你会觉得 Nous Research 就是一个「模型微调工厂」。但实际上,从 2024 年下半年开始,团队内部的重心已经在悄悄转移。
方向很明确:Agent。
这个转向有外部原因,也有内部逻辑。
外部原因很直接——纯模型的竞争太卷了。2024 年到 2025 年,开源 LLM 领域像是一场军备竞赛。Meta 隔几个月放一次 Llama 新版本,Mistral 在法国烧钱做模型,DeepSeek 从中国杀出来搅局,Qwen 在阿里的支持下快速迭代。每次有人放出新的基座模型,一周之内就会有十几个微调版本涌出来。模型微调本身的门槛在快速降低,差异化越来越难做。
内部逻辑则来自 Nous Research 的基因。回到他们的 slogan——「Artificial Intelligence Made Human」。一个模型再聪明,它也只是一个被动响应的文本生成器。它不会主动学习,不会记住你是谁,不会在失败后改进自己的方法。它不「human」。
要让 AI 真正 "Made Human",需要的不是更大的模型,而是一套能让 AI 像人一样成长的系统。
这就是 Agent 的意义——不再是一个模型,而是一个系统。模型只是大脑,Agent 是整个身体加上后天的学习能力。
2025 年 4 月,一件事加速了这个转向。Paradigm 领投了 Nous Research 的 A 轮融资,金额 5000 万美元,估值 10 亿美元。对于一个靠开源项目起家的团队来说,这笔钱是对他们下一步战略的重大背书。钱到位了,团队可以集中精力做一件大事。
整个 2025 年下半年,Nous Research 在闷头做一件事。外界能看到的只是 Hermes 4 和 Hermes-4.3-Seed 的陆续发布,但模型迭代的节奏明显放缓了。很多人以为 Nous 在掉队。
没人知道他们在酝酿什么。
4. 2026 年 2 月 25 日:Hermes Agent 横空出世
2026 年 2 月 25 日,Jeffrey Quesnelle 在社交媒体上发了一条很简单的消息,宣布 Hermes Agent 正式开源,GitHub 仓库随即上线。
如果当时你点开那个仓库,你会看到一个 README,开头写着一句话:
Hermes Agent is a self-improving AI agent.
自我改进的 AI 智能体。
这不是什么新概念。2024 年到 2025 年之间,学术界已经有大量关于「self-evolving agent」的论文——2025 年 7 月 arxiv 上甚至出了一篇 77 页的综述论文(2507.21046),27 位作者联名,系统梳理了自我进化智能体的各种范式。但把这个概念从论文变成一个真正可用的、面向普通用户的产品?没人做到过。
Hermes Agent 的 v0.1.0 版本就已经展示了它的核心设计理念——学习循环(Learning Loop)。
这个设计是这样的:当你给 Hermes Agent 一个任务,它会尝试完成。完成之后,它不会像普通 AI 助手那样「清空记忆,等待下一个指令」。相反,它会回顾自己刚才做了什么,把有价值的操作模式提炼成一个「技能」(Skill),保存下来。下次遇到类似任务时,它会直接调用这个技能,而不是从头开始摸索。
更关键的是,这些技能不是一成不变的。每次使用,Hermes Agent 都会评估效果,如果发现可以优化的地方,它会主动更新技能内容。用得越多,技能越精炼。
这很像人类学习的过程——做一件事,反思,总结经验,下次做得更好。
除了技能系统,v0.1.0 还包含了一套四层记忆架构:
第一层是会话记忆,就是当前对话的上下文,这个任何聊天 AI 都有。第二层是周期性提示词,Agent 会自主维护一组对当前用户最重要的提示信息,在每次交互时注入上下文。第三层是LLM 摘要记忆,把过去的对话压缩成摘要,用有限的 token 窗口保存尽可能多的历史信息。第四层就是前面说的技能系统,以 SKILL.md 文件的形式持久化存储。
四层记忆,从短期到长期,从模糊到精确。加上 FTS5 全文检索引擎做记忆搜索,Hermes Agent 实现了一种「跨会话的连续性」——它记得你,它记得自己学过什么。
v0.1.0 版本发布后,GitHub Star 数量开始爬升。速度不算爆炸性的,但足够引起注意。
5. 两个月,九个版本:闪电战式的迭代
接下来发生的事情,用一个词形容就够了:闪电战。
从 2 月 25 日到 4 月 13 日,不到 50 天,Hermes Agent 发布了 9 个版本。平均每 5-10 天一个新版本。每个版本都不是修修 bug 那种小迭代,而是实打实的功能扩展。
让我把这条时间线展开来看。
v0.2.0(3 月 12 日) —— 发布后仅两周多,第一次重大更新。重点是执行环境的扩展。v0.1.0 时,Agent 只能在本地运行代码。v0.2.0 加入了 Docker 容器执行和 SSH 远程执行。这意味着 Agent 可以安全地在隔离环境中运行它创建的代码,不用担心搞乱用户的系统。同时加入了浏览器自动化能力,Agent 可以操控浏览器完成网页交互任务。
v0.3.0(3 月 17 日) —— 仅仅 5 天后。这个版本的关键词是连接性。消息网关从最初支持的几个平台扩展到 10 个以上,Telegram、Discord、Slack、WhatsApp、Signal,甚至微信和企业微信都进了支持列表。MCP(Model Context Protocol)集成也是这个版本加入的——这让 Hermes Agent 可以接入大量第三方工具。
v0.4.0(3 月 23 日) —— 又是 6 天。子 Agent 委托功能上线。这是一个架构层面的升级:Hermes Agent 可以创建子 Agent 来并行处理多个任务。一个 Agent 拆分工作给多个子 Agent,各自执行,最后汇总结果。这把单线程的 AI 助手变成了一个多线程的指挥官。
v0.5.0(3 月 28 日) —— 5 天。用户建模系统全面升级。引入了 Honcho 方言的用户画像机制,Agent 不只是记住你说过什么,它会建立一个关于你的「认知模型」——你的偏好、习惯、工作风格、表达方式。交互越多,模型越精准。Karan Malhotra 在斯坦福学到的那套人类认知理论,在这个版本里真正落地了。
v0.6.0(3 月 30 日) —— 仅隔 2 天。Cron 定时调度功能加入。Agent 现在可以设定定时任务,自动在指定时间执行操作。这把 Agent 从一个「问答式助手」变成了一个「主动式管家」——它不再只是等你来问,它可以按计划自主行动。
v0.7.0(4 月 3 日) —— 4 天。执行后端扩展到 6 种:Local、Docker、SSH、Daytona、Singularity、Modal。特别是 Daytona 和 Modal 的加入,让 Agent 可以使用云端计算资源执行任务。同时,模型支持扩展到 200+ 种,通过 OpenRouter、Nous Portal 和自定义端点接入。
v0.8.0(4 月 8 日) —— 5 天。平台覆盖继续扩大,飞书、钉钉、iMessage、Email、Mattermost、Matrix 都加入了支持列表。消息网关支持的平台数达到 16 个。同时进一步优化了学习循环机制和记忆管理。
v0.9.0(4 月 13 日) —— 最新版本。Webhook 通用接口加入,这意味着任何能发 HTTP 请求的系统都可以跟 Hermes Agent 对话。SMS 短信支持也在这个版本上线。
九个版本,每个版本都在做一件事:让 Agent 能连接更多东西、在更多环境中运行、用更多方式跟用户交互。
如果把这个版本迭代画成图表,你会发现一条清晰的扩展曲线——从一个只能在本地跑、只支持命令行的原型,到一个覆盖 16 个通信平台、6 种执行环境、200+ 种模型、支持 MCP 工具生态的全栈 Agent 平台。50 天完成这种速度的扩展,在开源项目的历史上极为罕见。
6. 一部 AI 写的小说,和一个值得深想的问题
在版本迭代的噪音中,有一件事很容易被忽略,但它可能比任何一个版本更新都更有意味。
2026 年 3 月 20 日,Jeffrey Quesnelle 发了一条推文,宣布 Hermes Agent 独立完成了一部小说。
这不是那种「AI 帮你写大纲,你来填内容」的人机协作。而是 Hermes Agent 从开始到结束,完全自主地构思情节、塑造角色、撰写文本,最终产出了一部 79,000 字、19 章的完整长篇小说,名叫《The Second Son of the House of Bells》。
79,000 字是什么概念?大约相当于一本标准长度的英文小说。19 章的结构意味着它有完整的叙事弧线,不是随机拼凑的文字。
这件事之所以值得单独拎出来说,不是因为「AI 写小说」本身有多新奇——GPT-4 也能写小说。关键在于,这展示了 Hermes Agent 的学习循环在长期、复杂任务中的表现:Agent 需要在 19 章的跨度里保持人物设定的一致性、推动情节的发展、处理伏笔和回收。这要求它不断回顾自己之前写了什么(记忆系统),判断下一步该怎么写(推理能力),并在写作过程中逐渐形成自己的「写作风格」(技能学习)。
一个能写完一整本小说的 Agent,跟一个只能执行单步指令的 Agent,在本质上已经不是同一种东西了。
7. 增长曲线:从零到八万七千星
Hermes Agent 在 GitHub 上的增长轨迹,本身就是一个值得分析的案例。
前两周很平稳,Star 数在缓慢积累。社区里有人注意到了,有人在试用,有人在 GitHub Issues 里反馈,但还没形成爆发。
3 月中旬,Star 数突破 17,000。增长开始加速。这个时间点恰好是 v0.3.0 发布前后——大量平台接入和 MCP 支持吸引了更广泛的开发者群体。
3 月 22 日,突破 10,000 Star(有些统计口径显示这个时间点更早一些,但大约在这个区间)。开源社区有一个有趣的心理学规律:一旦一个项目突破万星,它就会被自动推到各种「精选列表」和「趋势榜单」上,形成正反馈循环。
4 月 3 日,33,000 Star。v0.7.0 发布,6 种执行后端 + 200+ 模型支持。这个版本让 Hermes Agent 从一个有趣的实验变成了一个真正可用的生产力工具。
4 月 8 日,40,000+ Star。v0.8.0 把平台覆盖推到了 16 个。同一天,项目登上 GitHub Trending 全球第一。
然后发生了一件疯狂的事。
4 月 11 日,单日新增 7,671 个 Star。总数飙升至 51,800。这在 GitHub 的历史上是非常罕见的单日增长数字。作为参考,大多数热门开源项目的巅峰日增长在 2,000-3,000 之间。
到我写这篇报告的时候(2026 年 4 月中旬),Hermes Agent 的 GitHub 数据是这样的:
87,700+ Star,11,900+ Fork,4,211 次提交,2,900+ Pull Request,1,600+ Issue,代码构成 Python 93.1%。MIT 许可证,完全开源。
从 2 月 25 日的 0 Star 到 4 月中旬的 87,700 Star——大约 50 天增长近 9 万星。这个增速在 GitHub 历史上排名极其靠前。
为什么增长这么快?我的判断是几个因素的叠加:
第一,时机对了。2026 年初,AI Agent 赛道正处于从「概念炒作」向「落地使用」转换的关键节点。开发者们已经厌倦了只能做 demo 的 Agent 框架,他们需要一个真正能用、能持续进化的东西。Hermes Agent 恰好在这个时间窗口出现。
第二,Nous Research 的品牌积累。Hermes 模型系列用了近三年时间在开源社区积累了大量信任。当 Nous Research 推出新产品时,社区的第一反应不是怀疑,而是期待。
第三,迭代速度制造了话题。每周一个新版本,每个版本都有实打实的功能增加——这种节奏让 Hermes Agent 持续占据社交媒体和技术社区的讨论热度。你刚写完上一个版本的测评,下一个版本就来了。
第四,真实场景的验证。79,000 字的小说、16 个平台的覆盖、200+ 模型的支持——这些不是纸面上的功能列表,而是实实在在的使用场景。开发者可以看到这个东西真的能干活。
8. 技术架构:为什么它不只是「又一个 Agent 框架」
要理解 Hermes Agent 跟其他 Agent 框架的本质区别,需要深入它的技术架构。
大多数 Agent 框架的核心逻辑是「编排」——你定义一组工具、一套流程、一个提示词模板,然后 Agent 按照你设定的路径执行任务。任务完成了就完成了,Agent 不会变得更聪明。下次遇到同样的任务,它从头来过。
Hermes Agent 的核心逻辑不是编排,而是进化。
学习循环是它跟其他框架最根本的区别。流程是这样的:用户给一个任务 → Agent 尝试完成 → 完成后反思做了什么 → 提炼出可复用的技能 → 以 SKILL.md 文件的形式持久化存储 → 下次遇到类似任务时自动调用并优化。这不是一个简单的「缓存」或「模板」系统,而是一种真正的学习机制——技能会随着使用而演进。
四层记忆系统前面已经讲过,这里补充一个关键设计细节:FTS5 全文检索引擎。这是 SQLite 内置的全文搜索扩展,Hermes Agent 用它来索引所有记忆内容。当 Agent 需要回忆某个信息时,它不是简单地翻看最近的聊天记录,而是通过语义相关的关键词搜索整个记忆库。这让长期记忆变得真正可用,而不只是一个越来越大的文本文件。
多平台消息网关是另一个亮点。到 v0.9.0,支持 16 个平台:Telegram、Discord、Slack、WhatsApp、Signal、微信、企业微信、飞书、钉钉、iMessage、Email、CLI、SMS、Mattermost、Matrix、Webhook。这种覆盖广度在 Agent 框架里是前所未有的。而且它不只是「能发消息」那么简单——每个平台的适配都处理了该平台特有的消息格式、权限模型、文件传输方式。
6 种执行后端——Local、Docker、SSH、Daytona、Singularity、Modal——覆盖了从「在你笔记本上跑」到「在云端 GPU 集群上跑」的全部场景。Docker 和 SSH 提供安全隔离,Daytona 和 Modal 提供按需的云计算资源,Singularity 则面向科研计算场景(HPC 集群)。
子 Agent 委托机制让 Hermes Agent 可以把复杂任务拆解成多个子任务,委派给不同的子 Agent 并行执行。这不是一个静态的「工作流编排」,而是一种动态的任务分解——Agent 根据任务的实际复杂度自主决定需要几个子 Agent、每个子 Agent 负责什么。
模型层面,通过 OpenRouter、Nous Portal 和自定义端点,Hermes Agent 支持 200+ 种大语言模型。这意味着用户可以根据任务需要(和预算)选择最合适的模型——简单任务用小模型降低成本,复杂推理用大模型保证质量。Nous 自家的 Hermes 系列模型自然是最适配的,但系统设计上完全不锁定特定模型。
还有两个经常被低估的功能。Cron 定时调度让 Agent 可以按计划自动执行任务——这把 Agent 从一个被动的问答工具变成一个主动的自动化系统。MCP 集成让 Agent 可以接入整个 MCP 工具生态中的第三方工具,极大地扩展了它的能力边界。
从学术角度看,Hermes Agent 的架构设计相当契合 2026 年 1 月发表在 TMLR 上的那篇综述论文(arXiv 2507.21046,"A Survey of Self-Evolving Agents")所提出的分类框架。这篇论文把自我进化智能体的关键维度分为三个问题:进化什么(模型/记忆/工具/架构)、何时进化(测试时推理内/推理间)、如何进化(标量奖励/文本反馈/单智能体/多智能体)。Hermes Agent 的四层记忆系统对应「记忆进化」,技能学习对应「工具进化」,子 Agent 委托对应「多智能体协作」。它几乎覆盖了这篇综述中描述的大多数进化维度。
9. 中国市场的涟漪
一个有意思的现象是,Hermes Agent 在中国技术社区引发了相当强烈的关注。
从 3 月中旬开始,知乎、掘金、CSDN、博客园、36 氪等中文技术媒体上陆续出现了大量关于 Hermes Agent 的文章和讨论。微信公众号上也有不少技术博主在做测评和解读。这种关注度的形成速度很快——通常一个海外开源项目要在中国社区形成讨论热度,需要至少一两个月的渗透期。Hermes Agent 几乎是同步引爆的。
2026 年 4 月 14 日,腾讯云轻量应用服务器(Lighthouse) 宣布推出 Hermes Agent 的一键部署模板。这意味着中国用户可以在腾讯云上几分钟内部署一个 Hermes Agent 实例,不需要折腾环境配置。
这个合作背后的信号很明确:云厂商已经把 Hermes Agent 视为一个有足够用户需求的产品来做集成支持了。这在开源 AI Agent 框架中是很少见的待遇——大多数 Agent 框架还停留在「开发者自己折腾」的阶段。
中国社区的讨论焦点主要集中在几个方面:自我进化的学习循环机制、对微信和企业微信的原生支持(这在中国市场的使用场景中极为重要)、以及它跟另一个超级明星项目 OpenClaw 的对比。后者我们在横向分析部分会详细展开。
10. 阶段划分与发展脉络
回顾从 Nous Research 成立到 Hermes Agent 爆发的整个时间线,可以清晰地划分为四个阶段:
第一阶段:社区萌芽期(2022 年底 - 2023 年中)。Discord 聊天室里的一群 AI 爱好者,从业余讨论到正式成立公司。核心矛盾是「能不能做出跟大公司掰手腕的开源模型」。
第二阶段:模型证明期(2023 年 7 月 - 2025 年初)。Hermes 1 到 Hermes 3,在开源 LLM 排行榜上反复证明自己。核心矛盾是「怎么在基座模型快速迭代的环境中保持领先」。这个阶段积累了品牌、社区和技术能力。
第三阶段:战略转型期(2025 年中 - 2026 年 2 月)。完成融资,从模型微调转向 Agent 平台。核心矛盾是「怎么从一个模型工坊转型为一个平台公司」。这个阶段对外界来说几乎是沉默的,但内部在做大量架构设计和开发工作。
第四阶段:Agent 爆发期(2026 年 2 月至今)。Hermes Agent 发布,50 天 9 个版本,87,000+ Star。核心矛盾是「怎么在爆炸性增长中保持代码质量和产品方向」。
这四个阶段有一条隐藏的逻辑线:Nous Research 从来不是在做一个产品,他们是在按照一条路线图执行。模型是基础设施,Agent 是上层建筑。没有 Hermes 模型系列在社区积累的信任和技术经验,Hermes Agent 不可能在发布第一天就获得如此多的关注。没有「Artificial Intelligence Made Human」的初始愿景,团队也不会在 Agent 方向上做出学习循环和用户建模这样的差异化设计。
每一步都在为下一步铺路。那些看起来像「偶然爆发」的成功,往往在几年前就已经开始了。
三、横向分析:竞争图谱
1. 一个拥挤到疯狂的赛道
2026 年的 AI Agent 市场,用一个词形容:热得发烫。
根据行业研究机构的数据,全球 AI Agent 市场规模在 2026 年约为 1091 亿美元,预计到 2033 年将达到 18,297 亿美元,复合年增长率约 49.6%。北美占据约 39.63% 的份额。这是一个以接近 50% 的速度膨胀的赛道——历史上很少有市场能维持这个增速超过三年。
在这个赛道上,玩家可以大致分为四类:开源框架派(Hermes Agent、OpenClaw、LangGraph、CrewAI、AutoGen、Smolagents)、大厂 SDK 派(Claude Agent SDK、OpenAI Agents SDK、Google ADK)、商业产品派(Devin、Manus AI)、中国平台派(Coze/扣子、文心智能体、蚂蚁 Agentar)。
Hermes Agent 属于第一类,但它的野心显然不止于此。
2. OpenClaw:那个房间里的大象
讨论 Hermes Agent 的竞争格局,必须从 OpenClaw 开始。
截至 2026 年 4 月,OpenClaw 在 GitHub 上有 354,000+ Star。是的,三十五万。这个数字让它成为 GitHub 上增长最快的 AI 项目之一,远超 Hermes Agent 的 87,000+。
OpenClaw 的定位是一个开源自主 AI 私人助理——它运行在用户自己的电脑上,官方口号是"真正会做事的 AI"。它的核心能力包括:多聊天平台集成(微信、Telegram、Discord、Slack 等 30+ 平台)、上下文记忆与自适应学习、浏览器自动化操作、系统级文件读写和脚本执行,以及一套可扩展的技能/插件系统。它强调本地部署、隐私优先,数据不出用户本机。
Hermes Agent 和 OpenClaw 经常被放在一起比较,这种比较是有道理的——两者的定位高度重叠,都是通用型 AI 助手框架,都能跨平台工作、记忆上下文、执行真实任务。
但仔细看,两者的侧重点有明显差异。
OpenClaw 的核心卖点是多平台聊天集成和本地隐私。它的设计哲学是"你在哪聊天,AI 就在哪干活"——无论你用微信、Telegram 还是 Slack,OpenClaw 都能接入,然后在本地执行任务。它更像是一个把各种消息入口统一起来的自动化中枢,强调的是连接性和隐私控制。
Hermes Agent 的核心卖点是自我改进和自主进化。它不只是执行你交给它的任务,而是会在使用过程中自主创建技能、为每个用户建立认知模型、跨会话保持记忆,甚至能独立完成像写一部 79,000 字长篇小说这样的复杂创作任务。它强调的是成长性——用得越久,能力越强。
用一个比喻来说:OpenClaw 是一个自带万能遥控器的智能家居中枢,什么设备都能接入、什么平台都能控制;Hermes Agent 是一个会自己学习新技能的管家,一开始可能不如你预期,但越用越懂你,最终能做到你没想到的事。
两者的用户画像也有微妙差异。OpenClaw 的典型用户是注重隐私、使用多个聊天平台、需要本地自动化的技术用户——他们不想把数据交给云端,更愿意在自己机器上跑 AI。Hermes Agent 的用户画像更侧重于需要一个能持续进化的 AI 伙伴的人——可以是开发者,也可以是研究者、内容创作者,他们看重的是 AI 在长期使用中变得越来越聪明。
有一个关键的交叉地带:两者都支持技能/插件扩展,都能执行系统命令和自动化任务。但 OpenClaw 在聊天平台覆盖面上更广(30+ 平台 vs Hermes Agent 目前主要通过 CLI 和 API 交互),而 Hermes Agent 在自主学习和认知建模上走得更远。
GitHub Star 数的巨大差距(354K vs 87K)也需要放在语境中理解。OpenClaw 比 Hermes Agent 早发布了相当一段时间,社区生态更成熟(900+ 贡献者),而且它的多平台聊天集成模式天然降低了使用门槛——用户不需要学任何新工具,直接在自己熟悉的聊天软件里就能用。
3. LangGraph:学院派的武器
LangGraph 是 LangChain 生态中的一个组件,GitHub Star 约 10 万(LangChain 整个生态)。它的定位是有状态的 AI 工作流编排引擎。
如果说 Hermes Agent 的核心理念是「让 Agent 自己学习」,LangGraph 的核心理念是「让开发者精确控制 Agent 的行为」。LangGraph 把 Agent 的执行流程建模为一个图(Graph)——节点是操作,边是状态转移条件。开发者可以精确定义在什么条件下做什么事,支持循环、分支、人工介入等复杂流程。
这种设计的优势是可控性和可预测性极强。在企业环境中,这两个特性比什么都重要——你不希望你的 Agent 「自由发挥」去做你没预期的事情。
但代价是灵活性和自主性不足。LangGraph 的 Agent 不会自己学习新技能,不会建立用户模型,不会在使用中变得更聪明。它严格按照开发者定义的图来执行,不多不少。
用户社区对 LangGraph 的评价比较两极化。赞的人说它是企业级 AI 应用的最佳选择,概念清晰、调试方便、生产环境稳定。骂的人说它过度设计、学习曲线陡峭、写一个简单的 Agent 要写一堆样板代码。
Hermes Agent 和 LangGraph 的关系,有点像「自适应系统 vs 规则系统」的经典对比。在简单、可预测的场景中,规则系统更可靠;在复杂、多变的场景中,自适应系统更有优势。对于大企业的合规性场景(金融、医疗),LangGraph 的确定性更有吸引力。对于个人用户和创业团队的通用助手场景,Hermes Agent 的进化能力更有价值。
4. CrewAI:角色扮演的魅力
CrewAI 在 GitHub 上有 45,900 Star,它的核心概念是基于角色的多 Agent 协作。
CrewAI 的设计很有想象力:你可以创建一个「研究员」Agent、一个「写手」Agent、一个「编辑」Agent,给每个角色设定不同的人格和技能,然后让它们像一个真实的团队一样协作完成任务。这种设计在内容创作、市场调研等场景中表现不错。
它的优势是直觉性强——即使不懂编程的人也能理解「让不同角色的 AI 合作」这个概念。上手门槛相对较低。
局限性在于角色的「人格」和「技能」是预设的,不会在使用中进化。CrewAI 的角色之间也没有真正的记忆共享和知识积累机制。每次执行任务,都是一次新的「演出」,上次学到的东西不会自动带到下次。
跟 Hermes Agent 比较的话,CrewAI 更像一个编排工具——它帮你安排谁做什么,但每个角色本身不会成长。Hermes Agent 则更像一个生命体——它在使用中积累经验,变得越来越了解你和你的需求。
CrewAI 的社区评价普遍比较正面,特别是在非技术用户群体中。但高级用户经常抱怨它在复杂任务中的可控性不够,以及多 Agent 协作时的上下文传递有时不够精确。
5. AutoGen:微软的大手笔
AutoGen 是微软开源的 Agent 框架,GitHub 28,500 Star。它的核心设计是多 Agent 对话——让多个 Agent 以对话的形式协作解决问题。
AutoGen 背靠微软的资源,在企业市场有天然的信任优势。它跟 Azure 生态的集成很顺畅,对于已经在微软技术栈上的企业来说,AutoGen 是一个低摩擦的选择。
它的技术特点是支持 Agent 之间的自然语言对话来协调任务,支持人类参与对话流程(human-in-the-loop),以及灵活的消息传递机制。
局限性跟 CrewAI 类似——Agent 不会自我进化。另外,AutoGen 的学习曲线不低,微软风格的抽象层有时候让人觉得过度复杂。社区反馈中提到最多的吐槽是文档质量和 API 稳定性——微软在 AutoGen 的迭代中曾经做过一些不向后兼容的大改动,让早期用户很不爽。
相比 Hermes Agent,AutoGen 的优势在于企业级特性和微软生态的集成;劣势在于缺少自我学习能力和用户建模,以及开源社区活跃度偏低。
6. Smolagents:小而美的极简主义
Smolagents 是 HuggingFace 开源的 Agent 框架,GitHub 17,800 Star。名字里的 "smol" 已经说明了一切——它追求极致的简单和轻量。
Smolagents 的核心卖点是「几行代码就能创建一个 Agent」。它砍掉了所有复杂的抽象层,提供最直接的 API。对于那些只需要一个简单 Agent 来执行特定任务的开发者来说,Smolagents 是最省心的选择。
它的优势跟 Hermes Agent 几乎是互补的:Smolagents 追求简单,Hermes Agent 追求全面。如果你的需求是「用 10 行 Python 调一个 Agent 帮我做一件事」,Smolagents 完胜。如果你的需求是「我要一个能在 16 个平台上跟我交互、自己学新技能、记住我是谁的长期 AI 助手」,那 Smolagents 完全不在这个量级上。
7. 大厂 SDK:800 磅大猩猩们的入场
2025 年到 2026 年间,三个最重要的 AI 大厂——Anthropic、OpenAI、Google——先后推出了各自的 Agent SDK。
Claude Agent SDK(Anthropic)的特点是强调安全性和可控性。Anthropic 一贯的风格是在能力和安全之间找平衡,Agent SDK 也不例外。它提供了精细的权限控制和执行沙箱。
OpenAI Agents SDK 的特点是生态优势。作为 GPT 系列的开发方,OpenAI 在 Agent SDK 中深度集成了 GPT-4、DALL-E、Code Interpreter 等自家产品。
Google ADK(Agent Development Kit)的特点是跟 Google Cloud 和 Gemini 模型的深度集成。
这三个 SDK 的共同特点是:跟自家模型绑定,闭源或半开源,面向企业开发者。
跟 Hermes Agent 的核心区别在于两点。第一,模型锁定 vs 模型自由。大厂 SDK 都或明或暗地把你往自家模型上引导,而 Hermes Agent 支持 200+ 种模型,完全不绑定任何一家。第二,功能提供 vs 能力生长。大厂 SDK 提供一组固定的功能,Agent 不会自己变得更强;Hermes Agent 的学习循环让 Agent 在使用中持续进化。
大厂 SDK 的优势在于品牌信任度、企业级支持、与云服务的集成。劣势在于供应商锁定和创新灵活性不足。对于大企业来说,选择大厂 SDK 是安全的;对于追求极致自定义和不想被锁定的团队来说,Hermes Agent 更有吸引力。
8. 商业产品:Devin 和 Manus 的故事
Devin 是 Cognition Labs 开发的「全球首个 AI 软件工程师」,估值一度达到 102 亿美元。它的定位非常垂直和激进——不是做通用 AI 助手,而是试图独立完成软件开发任务,取代部分人类工程师的角色。
Devin 的核心能力包括:独立规划和执行编码任务、使用常见的开发者工具(编辑器、浏览器、终端)、从用户反馈中学习。它在一些标准化的编程基准测试中表现亮眼。
但 Devin 是完全闭源的商业产品,定价不低,且目前主要面向软件开发场景。跟 Hermes Agent 的开源、通用、多平台定位完全不同。它们之间的竞争关系更像是 iPhone 跟 Android 的关系——一个封闭精致,一个开放灵活。
Manus AI 则是另一个有话题度的产品,主打「全能型 AI 助手」。但它同样是闭源商业产品,且可用性和功能深度一直受到社区质疑。
9. 中国平台:另一条赛道
在中国市场,AI Agent 的发展走的是一条不太一样的路。
Coze(扣子) 是字节跳动推出的 AI 应用开发平台,它的核心卖点是低代码/无代码——你不需要写一行程序,通过可视化界面就能创建 AI 应用。Coze 集成了字节自己的 Doubao 模型,以及各种第三方工具。它的优势是上手门槛极低、对中国用户的微信/抖音等平台集成做得很好。局限性在于可定制性有限,不适合需要深度自定义的技术用户。
文心智能体 是百度基于文心大模型构建的 Agent 平台,深度集成了百度搜索和百度生态的各种服务。对于需要利用百度搜索能力的场景来说,它是一个天然选择。
蚂蚁 Agentar 是蚂蚁集团的 Agent 平台,侧重金融和商业场景。
中国平台跟 Hermes Agent 的根本区别在于开放性。中国平台大多是封闭的、平台化的,用户在平台提供的能力范围内创建应用。Hermes Agent 是完全开源的,用户可以深度定制每一个组件。这两种模式各有受众:企业用户和非技术用户偏爱平台的便利性,技术用户和追求自主可控的团队偏爱开源的灵活性。
10. 竞争格局总览
把上面所有玩家放到一张图里看,当前的 AI Agent 赛道可以用一个二维矩阵来理解:
纵轴是专用性 vs 通用性——从只做一件事(比如 Devin 只做软件工程)到什么都能做(比如 Hermes Agent 和 OpenClaw)。
横轴是静态能力 vs 进化能力——从功能固定不变(比如 LangGraph)到能自我学习和进化(比如 Hermes Agent)。
在这个矩阵中,Hermes Agent 处于右上角——高通用性 + 高进化能力。这个位置目前几乎是空的,Hermes Agent 是第一个真正占据这个生态位的产品。
OpenClaw 在右上偏左——高通用性 + 中等进化能力(它有上下文记忆和自适应学习功能,但自主进化程度不如 Hermes Agent)。
LangGraph 和 AutoGen 在左下——中等通用性 + 低进化能力。
大厂 SDK 在中下方——中等通用性 + 低进化能力,但有强大的品牌和生态优势。
中国平台在右下——高通用性 + 低进化能力(平台虽然什么都能做,但 Agent 本身不会自己变强)。
这个格局中最值得关注的趋势是:进化能力正在从一个「nice to have」变成一个「must have」。随着用户对 AI Agent 的期望从「能用」升级到「好用」再到「越用越好用」,不具备自我进化能力的框架和平台将面临越来越大的压力。而这恰恰是 Hermes Agent 的核心差异化所在。
四、横纵交汇洞察
历史如何塑造了今天
把纵向时间线和横向竞争格局叠在一起看,几件事变得清晰了。
Hermes Agent 之所以能在一个极度拥挤的赛道上杀出来,不是因为它在某个单一维度上做到了最好——论多平台集成能力它不如 OpenClaw,论企业级编排它不如 LangGraph,论品牌信任度它不如大厂 SDK。它的杀手锏是从来没有人做好过的那个组合:一个真正能自我进化的、通用的、开源的 AI 助手。
这个组合能出现,直接源于 Nous Research 过去三年的积累。
Hermes 模型系列的持续迭代,让团队深度理解了大语言模型的能力边界——什么事情模型本身就能做好,什么事情需要外部系统来补足。这种理解直接转化成了 Hermes Agent 的架构设计:不试图让模型做所有事,而是建一个系统让模型的能力随着使用而增长。
Karan Malhotra 的认知科学背景,决定了 Hermes Agent 不会走 LangGraph 那条纯工程化的路。四层记忆系统和用户建模的设计,带着明显的「类人认知」色彩。这不是一个偶然的设计选择,而是团队 DNA 的自然表达。
Nous Research 在开源社区积累了三年的信任,让 Hermes Agent 在发布第一天就获得了远超普通新项目的关注度。信任不是免费的,它是 Hermes 1 到 Hermes 4 每一次高质量迭代换来的。
5000 万美元的融资则提供了一个关键资源:时间。如果没有这笔钱,Nous Research 可能被迫在模型微调的红海里继续搏杀,而不是有余裕花半年时间闭关开发一个全新的产品方向。
优势的根源和潜在的包袱
Hermes Agent 今天最核心的优势——学习循环和自我进化——可以追溯到 Nous Research 创立之初的那句 slogan:「Artificial Intelligence Made Human」。当其他 Agent 框架的创建者在思考「怎么让开发者更容易编排 AI 工作流」时,Nous 的人在思考「怎么让 AI 像人一样学习和成长」。不同的初始问题,导向了截然不同的架构设计。
但这个优势也可能变成包袱。
自我进化的系统天然更难预测和控制。当一个企业的合规部门问「你的 AI Agent 明天会做什么?」时,Hermes Agent 很难给出一个确定的答案。这是学习循环的本质——如果 Agent 的行为是完全可预测的,那它就没有真正在「学习」。这种不确定性在个人用户场景中是魅力,在企业合规场景中是风险。
另一个潜在的包袱是技术复杂度。四层记忆系统、6 种执行后端、16 个平台网关、200+ 模型支持——这些功能在 50 天内堆叠到一起,代码库的复杂度增长速度是惊人的。4,211 次提交、2,900+ PR、1,600+ Issue——这些数字同时说明了社区的活跃和系统的膨胀。在高速扩张期,技术债务的积累几乎是不可避免的。
三个剧本
最可能的剧本:与 OpenClaw 共存,各自为王。
Hermes Agent 和 OpenClaw 虽然都是通用型 AI 助手框架,但两者的核心差异足以支撑各自的生态位。OpenClaw 凭借 30+ 聊天平台集成和本地隐私优先的策略,继续主导"多平台自动化中枢"这个定位,吸引注重隐私和跨平台连接的用户。Hermes Agent 则凭借自我进化和自主技能创建能力,在"持续成长型 AI 伙伴"这个赛道上站稳脚跟。两者会有用户重叠——一些技术用户可能同时使用 OpenClaw 做跨平台自动化、用 Hermes Agent 做需要深度学习和长期记忆的任务。在这个剧本中,Hermes Agent 在一年内 Star 数突破 15-20 万,成为自我进化型 AI Agent 领域事实上的开源标准。Nous Research 在此基础上推出商业版(Nous Portal 的扩展),实现盈利。
最危险的剧本:底层模型太强,Agent 被架空。
这是一个需要认真考虑的风险。如果大语言模型本身的能力持续以当前速度增长,到某个点上,模型可能内置了大部分 Agent 框架提供的能力——长期记忆、工具使用、自主规划。到那时,像 Hermes Agent 这样的「模型之上的系统」可能变得多余。这个风险对所有 Agent 框架都存在,但对 Hermes Agent 尤其值得关注,因为它的核心卖点(学习循环、记忆系统)是最容易被底层模型能力增长所替代的。想象一下,如果明年出现一个能够在百万 token 窗口中维持完美一致性的模型,四层记忆系统的价值就大打折扣了。
最乐观的剧本:成为自我进化 Agent 的操作系统。
在这个剧本中,Hermes Agent 的开源架构成为整个 AI Agent 生态的基础设施。就像 Linux 不是一个应用,而是应用运行的基础。Hermes Agent 不再只是一个 Agent,而是一个 Agent 的操作系统——第三方开发者在上面构建各种专用 Agent(编程 Agent、运营 Agent、客服 Agent),这些 Agent 共享底层的学习循环、记忆系统和平台网关。Nous Research 的 Psyche 分布式网络为这个生态提供计算资源,Hermes 模型系列为专用 Agent 提供经过特别优化的推理能力。这个剧本的触发条件是:Hermes Agent 需要在接下来的 6-12 个月内建立一个足够强大的插件/扩展生态,让第三方开发者能够轻松地在其基础上构建专用解决方案。
不管哪个剧本成真,有一件事是确定的:Hermes Agent 已经证明了「自我进化的 AI 助手」不只是学术论文里的概念,而是一个真实的、有市场需求的产品形态。这个证明本身就是它对整个 AI Agent 赛道最大的贡献——无论 Hermes Agent 未来走向何方,「Agent 应该能学习和成长」这个理念已经不可逆地改变了整个行业的产品思维。
从一个 Discord 聊天室里的几个 AI 爱好者,到 50 天内在 GitHub 上收获近 9 万颗星,Hermes Agent 的故事读起来像是一个创业神话。但如果你仔细看那条时间线,你会发现每一步「突然」的背后都有长期的积累。模型系列三年的迭代积累了社区信任,融资提供了战略转型的空间,「让 AI 像人一样成长」的初始愿景指引了差异化的架构设计。
Jeffrey Quesnelle 在 Nous Research 的网站上写着:「We believe the most interesting AI systems will be the ones that learn and grow alongside their users.」
Hermes Agent 是这句话的第一个真正实现。至于它能走多远,取决于自我进化这件事到底有多深的潜力——而这个问题,可能连 Hermes Agent 自己都还在学习如何回答。
五、信息来源
- Hermes Agent GitHub 仓库 — 版本发布记录、代码统计、Issue 和 PR 数据
- Nous Research 官方网站 — 团队信息、使命声明、模型发布公告
- Nous Research Hermes 模型系列 - HuggingFace — Hermes 1-4 各版本的模型卡片和发布说明
- Paradigm 领投 Nous Research A 轮融资报道 - Fortune — 5000 万美元融资及 10 亿美元估值信息
- Jeffrey Quesnelle 社交媒体 — Hermes Agent 发布公告、小说创作公告
- arXiv 2507.21046 - A Survey of Self-Evolving Agents — 自我进化智能体综述论文(TMLR 2026年1月发表)
- 腾讯云轻量应用服务器 Hermes Agent 部署模板 — 一键部署公告(2026年4月14日)
- OpenClaw GitHub 仓库 — Star 数及功能对比参考
- LangGraph 文档 — 技术架构及设计理念
- CrewAI GitHub 仓库 — 功能特点和社区评价
- AutoGen GitHub 仓库 — 微软 Agent 框架技术文档
- Smolagents GitHub 仓库 — HuggingFace 轻量 Agent 框架
- Grand View Research - AI Agent 市场报告 — 全球 AI Agent 市场规模及增长预测
- CSDN / 掘金 / 知乎 / 博客园 等中文技术社区 — 中国社区用户讨论和测评
- 微信公众号文章 — 一串随机数、程序员行一、虾搞AI社等公众号的 Hermes Agent 评测和分析