AI 纵横：带你深入了解 Hermes AgentHermes Agent 是由 Nous Research 开发的开源

Hermes Agent 是由 Nous Research 开发的开源自我进化型 AI 智能体框架，它在用户交互中自主学习、创建技能、积累记忆，像一个真正「会长大」的 AI 助手，而不只是一个等待指令的工具。

一、一个安静的开源项目，吵醒了整个 AI 圈

2026 年 2 月 25 日，一个叫 Jeffrey Quesnelle 的人在社交媒体上发了一条很短的消息，宣布一个叫 Hermes Agent 的东西正式开源了。

没有发布会，没有预热海报，没有 KOL 矩阵联动推广。就一条消息，一个 GitHub 链接。

50 天后，这个项目的 Star 数逼近 9 万。4 月 11 日那天，单日新增 7,671 颗星——这个数字放在 GitHub 的历史上都极其罕见，大多数现象级开源项目的巅峰日增长也就两三千。它登上了 GitHub Trending 全球第一，版本号从 v0.1.0 一路冲到 v0.9.0，平均每 5 到 10 天发一个大版本。腾讯云在它发布不到两个月的时候就上线了一键部署模板。知乎、掘金、CSDN 上的讨论帖多到刷不完。有人说它是 2026 年最值得关注的 AI 开源项目，有人说它是 OpenClaw 之后第二个真正改变游戏规则的东西。

但要搞清楚 Hermes Agent 到底为什么火成这样，你不能只看这 50 天。你得往前看三年。

三年前，Nous Research 还只是 Discord 里一群不安分的 AI 爱好者。他们没有大厂的背书，没有充裕的资金，只有一个执念——要做出不输大公司的开源 AI 模型。从 Hermes 1 到 Hermes 4，十几个版本的迭代，覆盖 7B 到 405B 参数，他们用行动在开源社区积累了一种极其稀缺的东西：信任。2025 年 4 月，Paradigm 领投了 5000 万美元的 A 轮，估值 10 亿。然后整个下半年，这家公司几乎消失在公众视野里。

没人知道他们在憋什么大招。直到 2026 年 2 月 25 日，答案揭晓——他们不再只做模型了，他们做了一个会自己「长大」的 AI。

Hermes Agent 的 README 里写着一句话：Hermes Agent is a self-improving AI agent。自我改进的 AI 智能体。这话说起来轻飘飘的，但当你看到它能在使用过程中自主创建技能、在跨会话中保持记忆、为每一个用户建立认知模型、甚至独立写出了一部 79,000 字的完整长篇小说——你就知道，这不是又一个包装精美的 demo。

这是一个真的在学习的东西。

二、纵向分析：从诞生到当下

1. 一群不安分的人，在 Discord 里点了一把火

故事要从 2022 年底讲起。

那年年末，ChatGPT 横空出世，整个科技界像被扔进了一锅沸腾的油——所有人都在兴奋，所有人都在焦虑。大公司忙着调兵遣将，小团队忙着找方向。但在这股浪潮中，有一群人的反应很特别：他们不想等大公司施舍 API，他们想自己做模型。

这群人聚集在一个 Discord 服务器里。

Jeffrey Quesnelle，密歇根大学计算机科学的学术背景，研究兴趣横跨机器学习和自然语言处理。他不是那种在大厂里按部就班升 P8 的工程师，而是一个对「开放」有执念的人。在 AI 的世界里，「开放」意味着模型权重公开、训练方法透明、任何人都能在此基础上构建自己想要的东西。

Ryan，在社区里更为人知的 ID 是 Teknium。他的 GitHub 签名写着「开源 AI 先锋」。在 Hermes 之前，他已经因为一系列高质量的开源微调模型在社区里积累了声望。他的技术直觉极好——总能在 Meta、Mistral 等公司放出基座模型后的第一时间，找到最佳的微调策略，做出超越预期的版本。

Karan Malhotra，背景更学术一些。他在斯坦福的脑刺激实验室做过研究，研究方向涉及人类认知和行为。这个背景后来被证明极其重要——Hermes Agent 那套「理解用户、构建用户模型」的设计哲学，跟 Karan 对人类认知的理解密不可分。

还有 Shivani Mitra，在这个几乎全是技术宅的圈子里，她负责把技术落地成产品。

2023 年初，这几个人从 Discord 的业余讨论组变成了一家正式注册的公司，总部设在纽约。名字起得很直接：Nous Research，法语里 "nous" 是「我们」的意思。他们给自己定了一句 slogan：「Artificial Intelligence Made Human」。

这句话看起来像是一句普通的品牌口号，但如果你跟踪 Nous Research 后来三年的轨迹，会发现他们每一个关键决策——从模型微调到 Agent 架构设计——都在执行这句话。它不是 slogan，是路线图。

2. Hermes 系列模型：在开源世界证明自己

Nous Research 做的第一件事，是微调大语言模型。

2023 年 7 月，他们发布了 Hermes 1，基于 Meta 刚放出来的 Llama 2 13B 微调而成。在当时的开源 LLM 排行榜上，这个模型的表现让人吃了一惊——它在多项基准测试中跑出了远超同级别模型的分数。一个只有几个人的小团队，用社区贡献的数据集，做出了跟大公司产品掰手腕的东西。

开源社区的注意力一旦被吸引过来，雪球就开始滚了。

2024 年 1 月，Hermes 2 登场，这次他们切到了 Mistral 的 7B 架构上。随后几个月里，Hermes 2 像连珠炮一样迭代：Hermes 2 Pro（基于 Mistral 7B 和 Llama 3 8B 的双版本）、Hermes 2 Theta（Llama 3 8B）。每一次迭代都踩在上游基座模型放出新版本的时间点上，节奏极快。

到 2024 年 6 月，Hermes 2.5 发布，这回用上了 Mixtral 8x22B 的大杀器。8 个专家的混合架构，总参数量 1410 亿，但推理时只激活其中一部分。性能又上了一个台阶。

但真正让 Nous Research 在行业里站稳脚跟的，是 2024 年 8 月发布的 Hermes 3。

这是一个基于 Llama 3.1 405B 的巨型模型。405B——四千零五十亿参数。在开源世界里，这个量级的模型屈指可数。Hermes 3 的发布本身就是一个信号：Nous Research 不再只是一个做小模型微调的精品工坊，它有能力驾驭最顶级的基座模型。

Hermes 3 还有一个特别的地方：它引入了更丰富的系统提示词支持和角色扮演能力。用户可以通过精心设计的系统提示词，让 Hermes 3 表现出截然不同的「人格」。这不是一个纯粹的工程功能——它背后是 Karan Malhotra 那套关于「AI 行为可塑性」的理论在落地。

2024 年到 2025 年间，Hermes 系列继续推进。2025 年 2 月的 DeepHermes-3 把 DeepSeek 的推理增强技术整合进来；2025 年 8 月的 Hermes 4 实现了「混合推理」，模型可以在不同任务上自动切换推理深度；到 2025 年 12 月，Hermes-4.3-Seed 发布，这是一个 36B 参数的模型，但它的训练方式非常特别——使用了 Nous 自己的 Psyche 分布式训练网络，由全球社区成员贡献算力共同训练完成。

到这个时间点，Nous Research 已经发布了十几个版本的 Hermes 模型，覆盖了从 7B 到 405B 的各种尺寸，横跨 Llama、Mistral、Mixtral 等多个基座架构。他们证明了一件事：一个小团队，靠开源社区的力量，可以持续产出最前沿的 AI 模型。

但模型只是手段，不是目的。

3. 从模型到 Agent：一次关键的战略转向

如果你只看 Hermes 模型系列的迭代速度，你会觉得 Nous Research 就是一个「模型微调工厂」。但实际上，从 2024 年下半年开始，团队内部的重心已经在悄悄转移。

方向很明确：Agent。

这个转向有外部原因，也有内部逻辑。

外部原因很直接——纯模型的竞争太卷了。2024 年到 2025 年，开源 LLM 领域像是一场军备竞赛。Meta 隔几个月放一次 Llama 新版本，Mistral 在法国烧钱做模型，DeepSeek 从中国杀出来搅局，Qwen 在阿里的支持下快速迭代。每次有人放出新的基座模型，一周之内就会有十几个微调版本涌出来。模型微调本身的门槛在快速降低，差异化越来越难做。

内部逻辑则来自 Nous Research 的基因。回到他们的 slogan——「Artificial Intelligence Made Human」。一个模型再聪明，它也只是一个被动响应的文本生成器。它不会主动学习，不会记住你是谁，不会在失败后改进自己的方法。它不「human」。

要让 AI 真正 "Made Human"，需要的不是更大的模型，而是一套能让 AI 像人一样成长的系统。

这就是 Agent 的意义——不再是一个模型，而是一个系统。模型只是大脑，Agent 是整个身体加上后天的学习能力。

2025 年 4 月，一件事加速了这个转向。Paradigm 领投了 Nous Research 的 A 轮融资，金额 5000 万美元，估值 10 亿美元。对于一个靠开源项目起家的团队来说，这笔钱是对他们下一步战略的重大背书。钱到位了，团队可以集中精力做一件大事。

整个 2025 年下半年，Nous Research 在闷头做一件事。外界能看到的只是 Hermes 4 和 Hermes-4.3-Seed 的陆续发布，但模型迭代的节奏明显放缓了。很多人以为 Nous 在掉队。

没人知道他们在酝酿什么。

4. 2026 年 2 月 25 日：Hermes Agent 横空出世

2026 年 2 月 25 日，Jeffrey Quesnelle 在社交媒体上发了一条很简单的消息，宣布 Hermes Agent 正式开源，GitHub 仓库随即上线。

如果当时你点开那个仓库，你会看到一个 README，开头写着一句话：

Hermes Agent is a self-improving AI agent.

自我改进的 AI 智能体。

这不是什么新概念。2024 年到 2025 年之间，学术界已经有大量关于「self-evolving agent」的论文——2025 年 7 月 arxiv 上甚至出了一篇 77 页的综述论文（2507.21046），27 位作者联名，系统梳理了自我进化智能体的各种范式。但把这个概念从论文变成一个真正可用的、面向普通用户的产品？没人做到过。

Hermes Agent 的 v0.1.0 版本就已经展示了它的核心设计理念——学习循环（Learning Loop）。

这个设计是这样的：当你给 Hermes Agent 一个任务，它会尝试完成。完成之后，它不会像普通 AI 助手那样「清空记忆，等待下一个指令」。相反，它会回顾自己刚才做了什么，把有价值的操作模式提炼成一个「技能」（Skill），保存下来。下次遇到类似任务时，它会直接调用这个技能，而不是从头开始摸索。

更关键的是，这些技能不是一成不变的。每次使用，Hermes Agent 都会评估效果，如果发现可以优化的地方，它会主动更新技能内容。用得越多，技能越精炼。

这很像人类学习的过程——做一件事，反思，总结经验，下次做得更好。

除了技能系统，v0.1.0 还包含了一套四层记忆架构：

第一层是会话记忆，就是当前对话的上下文，这个任何聊天 AI 都有。第二层是周期性提示词，Agent 会自主维护一组对当前用户最重要的提示信息，在每次交互时注入上下文。第三层是LLM 摘要记忆，把过去的对话压缩成摘要，用有限的 token 窗口保存尽可能多的历史信息。第四层就是前面说的技能系统，以 SKILL.md 文件的形式持久化存储。

四层记忆，从短期到长期，从模糊到精确。加上 FTS5 全文检索引擎做记忆搜索，Hermes Agent 实现了一种「跨会话的连续性」——它记得你，它记得自己学过什么。

v0.1.0 版本发布后，GitHub Star 数量开始爬升。速度不算爆炸性的，但足够引起注意。

5. 两个月，九个版本：闪电战式的迭代

接下来发生的事情，用一个词形容就够了：闪电战。

从 2 月 25 日到 4 月 13 日，不到 50 天，Hermes Agent 发布了 9 个版本。平均每 5-10 天一个新版本。每个版本都不是修修 bug 那种小迭代，而是实打实的功能扩展。

让我把这条时间线展开来看。

v0.2.0（3 月 12 日） —— 发布后仅两周多，第一次重大更新。重点是执行环境的扩展。v0.1.0 时，Agent 只能在本地运行代码。v0.2.0 加入了 Docker 容器执行和 SSH 远程执行。这意味着 Agent 可以安全地在隔离环境中运行它创建的代码，不用担心搞乱用户的系统。同时加入了浏览器自动化能力，Agent 可以操控浏览器完成网页交互任务。

v0.3.0（3 月 17 日） —— 仅仅 5 天后。这个版本的关键词是连接性。消息网关从最初支持的几个平台扩展到 10 个以上，Telegram、Discord、Slack、WhatsApp、Signal，甚至微信和企业微信都进了支持列表。MCP（Model Context Protocol）集成也是这个版本加入的——这让 Hermes Agent 可以接入大量第三方工具。

v0.4.0（3 月 23 日） —— 又是 6 天。子 Agent 委托功能上线。这是一个架构层面的升级：Hermes Agent 可以创建子 Agent 来并行处理多个任务。一个 Agent 拆分工作给多个子 Agent，各自执行，最后汇总结果。这把单线程的 AI 助手变成了一个多线程的指挥官。

v0.5.0（3 月 28 日） —— 5 天。用户建模系统全面升级。引入了 Honcho 方言的用户画像机制，Agent 不只是记住你说过什么，它会建立一个关于你的「认知模型」——你的偏好、习惯、工作风格、表达方式。交互越多，模型越精准。Karan Malhotra 在斯坦福学到的那套人类认知理论，在这个版本里真正落地了。

v0.6.0（3 月 30 日） —— 仅隔 2 天。Cron 定时调度功能加入。Agent 现在可以设定定时任务，自动在指定时间执行操作。这把 Agent 从一个「问答式助手」变成了一个「主动式管家」——它不再只是等你来问，它可以按计划自主行动。

v0.7.0（4 月 3 日） —— 4 天。执行后端扩展到 6 种：Local、Docker、SSH、Daytona、Singularity、Modal。特别是 Daytona 和 Modal 的加入，让 Agent 可以使用云端计算资源执行任务。同时，模型支持扩展到 200+ 种，通过 OpenRouter、Nous Portal 和自定义端点接入。

v0.8.0（4 月 8 日） —— 5 天。平台覆盖继续扩大，飞书、钉钉、iMessage、Email、Mattermost、Matrix 都加入了支持列表。消息网关支持的平台数达到 16 个。同时进一步优化了学习循环机制和记忆管理。

v0.9.0（4 月 13 日） —— 最新版本。Webhook 通用接口加入，这意味着任何能发 HTTP 请求的系统都可以跟 Hermes Agent 对话。SMS 短信支持也在这个版本上线。

九个版本，每个版本都在做一件事：让 Agent 能连接更多东西、在更多环境中运行、用更多方式跟用户交互。

如果把这个版本迭代画成图表，你会发现一条清晰的扩展曲线——从一个只能在本地跑、只支持命令行的原型，到一个覆盖 16 个通信平台、6 种执行环境、200+ 种模型、支持 MCP 工具生态的全栈 Agent 平台。50 天完成这种速度的扩展，在开源项目的历史上极为罕见。

6. 一部 AI 写的小说，和一个值得深想的问题

在版本迭代的噪音中，有一件事很容易被忽略，但它可能比任何一个版本更新都更有意味。

2026 年 3 月 20 日，Jeffrey Quesnelle 发了一条推文，宣布 Hermes Agent 独立完成了一部小说。

这不是那种「AI 帮你写大纲，你来填内容」的人机协作。而是 Hermes Agent 从开始到结束，完全自主地构思情节、塑造角色、撰写文本，最终产出了一部 79,000 字、19 章的完整长篇小说，名叫《The Second Son of the House of Bells》。

79,000 字是什么概念？大约相当于一本标准长度的英文小说。19 章的结构意味着它有完整的叙事弧线，不是随机拼凑的文字。

这件事之所以值得单独拎出来说，不是因为「AI 写小说」本身有多新奇——GPT-4 也能写小说。关键在于，这展示了 Hermes Agent 的学习循环在长期、复杂任务中的表现：Agent 需要在 19 章的跨度里保持人物设定的一致性、推动情节的发展、处理伏笔和回收。这要求它不断回顾自己之前写了什么（记忆系统），判断下一步该怎么写（推理能力），并在写作过程中逐渐形成自己的「写作风格」（技能学习）。

一个能写完一整本小说的 Agent，跟一个只能执行单步指令的 Agent，在本质上已经不是同一种东西了。

7. 增长曲线：从零到八万七千星

Hermes Agent 在 GitHub 上的增长轨迹，本身就是一个值得分析的案例。

前两周很平稳，Star 数在缓慢积累。社区里有人注意到了，有人在试用，有人在 GitHub Issues 里反馈，但还没形成爆发。

3 月中旬，Star 数突破 17,000。增长开始加速。这个时间点恰好是 v0.3.0 发布前后——大量平台接入和 MCP 支持吸引了更广泛的开发者群体。

3 月 22 日，突破 10,000 Star（有些统计口径显示这个时间点更早一些，但大约在这个区间）。开源社区有一个有趣的心理学规律：一旦一个项目突破万星，它就会被自动推到各种「精选列表」和「趋势榜单」上，形成正反馈循环。

4 月 3 日，33,000 Star。v0.7.0 发布，6 种执行后端 + 200+ 模型支持。这个版本让 Hermes Agent 从一个有趣的实验变成了一个真正可用的生产力工具。

4 月 8 日，40,000+ Star。v0.8.0 把平台覆盖推到了 16 个。同一天，项目登上 GitHub Trending 全球第一。

然后发生了一件疯狂的事。

4 月 11 日，单日新增 7,671 个 Star。总数飙升至 51,800。这在 GitHub 的历史上是非常罕见的单日增长数字。作为参考，大多数热门开源项目的巅峰日增长在 2,000-3,000 之间。

到我写这篇报告的时候（2026 年 4 月中旬），Hermes Agent 的 GitHub 数据是这样的：

87,700+ Star，11,900+ Fork，4,211 次提交，2,900+ Pull Request，1,600+ Issue，代码构成 Python 93.1%。MIT 许可证，完全开源。

从 2 月 25 日的 0 Star 到 4 月中旬的 87,700 Star——大约 50 天增长近 9 万星。这个增速在 GitHub 历史上排名极其靠前。

为什么增长这么快？我的判断是几个因素的叠加：

第一，时机对了。2026 年初，AI Agent 赛道正处于从「概念炒作」向「落地使用」转换的关键节点。开发者们已经厌倦了只能做 demo 的 Agent 框架，他们需要一个真正能用、能持续进化的东西。Hermes Agent 恰好在这个时间窗口出现。

第二，Nous Research 的品牌积累。Hermes 模型系列用了近三年时间在开源社区积累了大量信任。当 Nous Research 推出新产品时，社区的第一反应不是怀疑，而是期待。

第三，迭代速度制造了话题。每周一个新版本，每个版本都有实打实的功能增加——这种节奏让 Hermes Agent 持续占据社交媒体和技术社区的讨论热度。你刚写完上一个版本的测评，下一个版本就来了。

第四，真实场景的验证。79,000 字的小说、16 个平台的覆盖、200+ 模型的支持——这些不是纸面上的功能列表，而是实实在在的使用场景。开发者可以看到这个东西真的能干活。

8. 技术架构：为什么它不只是「又一个 Agent 框架」

要理解 Hermes Agent 跟其他 Agent 框架的本质区别，需要深入它的技术架构。

大多数 Agent 框架的核心逻辑是「编排」——你定义一组工具、一套流程、一个提示词模板，然后 Agent 按照你设定的路径执行任务。任务完成了就完成了，Agent 不会变得更聪明。下次遇到同样的任务，它从头来过。

Hermes Agent 的核心逻辑不是编排，而是进化。

学习循环是它跟其他框架最根本的区别。流程是这样的：用户给一个任务 → Agent 尝试完成 → 完成后反思做了什么 → 提炼出可复用的技能 → 以 SKILL.md 文件的形式持久化存储 → 下次遇到类似任务时自动调用并优化。这不是一个简单的「缓存」或「模板」系统，而是一种真正的学习机制——技能会随着使用而演进。

四层记忆系统前面已经讲过，这里补充一个关键设计细节：FTS5 全文检索引擎。这是 SQLite 内置的全文搜索扩展，Hermes Agent 用它来索引所有记忆内容。当 Agent 需要回忆某个信息时，它不是简单地翻看最近的聊天记录，而是通过语义相关的关键词搜索整个记忆库。这让长期记忆变得真正可用，而不只是一个越来越大的文本文件。

多平台消息网关是另一个亮点。到 v0.9.0，支持 16 个平台：Telegram、Discord、Slack、WhatsApp、Signal、微信、企业微信、飞书、钉钉、iMessage、Email、CLI、SMS、Mattermost、Matrix、Webhook。这种覆盖广度在 Agent 框架里是前所未有的。而且它不只是「能发消息」那么简单——每个平台的适配都处理了该平台特有的消息格式、权限模型、文件传输方式。

6 种执行后端——Local、Docker、SSH、Daytona、Singularity、Modal——覆盖了从「在你笔记本上跑」到「在云端 GPU 集群上跑」的全部场景。Docker 和 SSH 提供安全隔离，Daytona 和 Modal 提供按需的云计算资源，Singularity 则面向科研计算场景（HPC 集群）。

子 Agent 委托机制让 Hermes Agent 可以把复杂任务拆解成多个子任务，委派给不同的子 Agent 并行执行。这不是一个静态的「工作流编排」，而是一种动态的任务分解——Agent 根据任务的实际复杂度自主决定需要几个子 Agent、每个子 Agent 负责什么。

模型层面，通过 OpenRouter、Nous Portal 和自定义端点，Hermes Agent 支持 200+ 种大语言模型。这意味着用户可以根据任务需要（和预算）选择最合适的模型——简单任务用小模型降低成本，复杂推理用大模型保证质量。Nous 自家的 Hermes 系列模型自然是最适配的，但系统设计上完全不锁定特定模型。

还有两个经常被低估的功能。Cron 定时调度让 Agent 可以按计划自动执行任务——这把 Agent 从一个被动的问答工具变成一个主动的自动化系统。MCP 集成让 Agent 可以接入整个 MCP 工具生态中的第三方工具，极大地扩展了它的能力边界。

从学术角度看，Hermes Agent 的架构设计相当契合 2026 年 1 月发表在 TMLR 上的那篇综述论文（arXiv 2507.21046，"A Survey of Self-Evolving Agents"）所提出的分类框架。这篇论文把自我进化智能体的关键维度分为三个问题：进化什么（模型/记忆/工具/架构）、何时进化（测试时推理内/推理间）、如何进化（标量奖励/文本反馈/单智能体/多智能体）。Hermes Agent 的四层记忆系统对应「记忆进化」，技能学习对应「工具进化」，子 Agent 委托对应「多智能体协作」。它几乎覆盖了这篇综述中描述的大多数进化维度。

9. 中国市场的涟漪

一个有意思的现象是，Hermes Agent 在中国技术社区引发了相当强烈的关注。

从 3 月中旬开始，知乎、掘金、CSDN、博客园、36 氪等中文技术媒体上陆续出现了大量关于 Hermes Agent 的文章和讨论。微信公众号上也有不少技术博主在做测评和解读。这种关注度的形成速度很快——通常一个海外开源项目要在中国社区形成讨论热度，需要至少一两个月的渗透期。Hermes Agent 几乎是同步引爆的。

2026 年 4 月 14 日，腾讯云轻量应用服务器（Lighthouse） 宣布推出 Hermes Agent 的一键部署模板。这意味着中国用户可以在腾讯云上几分钟内部署一个 Hermes Agent 实例，不需要折腾环境配置。

这个合作背后的信号很明确：云厂商已经把 Hermes Agent 视为一个有足够用户需求的产品来做集成支持了。这在开源 AI Agent 框架中是很少见的待遇——大多数 Agent 框架还停留在「开发者自己折腾」的阶段。

中国社区的讨论焦点主要集中在几个方面：自我进化的学习循环机制、对微信和企业微信的原生支持（这在中国市场的使用场景中极为重要）、以及它跟另一个超级明星项目 OpenClaw 的对比。后者我们在横向分析部分会详细展开。

10. 阶段划分与发展脉络

回顾从 Nous Research 成立到 Hermes Agent 爆发的整个时间线，可以清晰地划分为四个阶段：

第一阶段：社区萌芽期（2022 年底 - 2023 年中）。Discord 聊天室里的一群 AI 爱好者，从业余讨论到正式成立公司。核心矛盾是「能不能做出跟大公司掰手腕的开源模型」。

第二阶段：模型证明期（2023 年 7 月 - 2025 年初）。Hermes 1 到 Hermes 3，在开源 LLM 排行榜上反复证明自己。核心矛盾是「怎么在基座模型快速迭代的环境中保持领先」。这个阶段积累了品牌、社区和技术能力。

第三阶段：战略转型期（2025 年中 - 2026 年 2 月）。完成融资，从模型微调转向 Agent 平台。核心矛盾是「怎么从一个模型工坊转型为一个平台公司」。这个阶段对外界来说几乎是沉默的，但内部在做大量架构设计和开发工作。

第四阶段：Agent 爆发期（2026 年 2 月至今）。Hermes Agent 发布，50 天 9 个版本，87,000+ Star。核心矛盾是「怎么在爆炸性增长中保持代码质量和产品方向」。

这四个阶段有一条隐藏的逻辑线：Nous Research 从来不是在做一个产品，他们是在按照一条路线图执行。模型是基础设施，Agent 是上层建筑。没有 Hermes 模型系列在社区积累的信任和技术经验，Hermes Agent 不可能在发布第一天就获得如此多的关注。没有「Artificial Intelligence Made Human」的初始愿景，团队也不会在 Agent 方向上做出学习循环和用户建模这样的差异化设计。

每一步都在为下一步铺路。那些看起来像「偶然爆发」的成功，往往在几年前就已经开始了。

三、横向分析：竞争图谱

1. 一个拥挤到疯狂的赛道

2026 年的 AI Agent 市场，用一个词形容：热得发烫。

根据行业研究机构的数据，全球 AI Agent 市场规模在 2026 年约为 1091 亿美元，预计到 2033 年将达到 18,297 亿美元，复合年增长率约 49.6%。北美占据约 39.63% 的份额。这是一个以接近 50% 的速度膨胀的赛道——历史上很少有市场能维持这个增速超过三年。

在这个赛道上，玩家可以大致分为四类：开源框架派（Hermes Agent、OpenClaw、LangGraph、CrewAI、AutoGen、Smolagents）、大厂 SDK 派（Claude Agent SDK、OpenAI Agents SDK、Google ADK）、商业产品派（Devin、Manus AI）、中国平台派（Coze/扣子、文心智能体、蚂蚁 Agentar）。

Hermes Agent 属于第一类，但它的野心显然不止于此。

2. OpenClaw：那个房间里的大象

讨论 Hermes Agent 的竞争格局，必须从 OpenClaw 开始。

截至 2026 年 4 月，OpenClaw 在 GitHub 上有 354,000+ Star。是的，三十五万。这个数字让它成为 GitHub 上增长最快的 AI 项目之一，远超 Hermes Agent 的 87,000+。

OpenClaw 的定位是一个开源自主 AI 私人助理——它运行在用户自己的电脑上，官方口号是"真正会做事的 AI"。它的核心能力包括：多聊天平台集成（微信、Telegram、Discord、Slack 等 30+ 平台）、上下文记忆与自适应学习、浏览器自动化操作、系统级文件读写和脚本执行，以及一套可扩展的技能/插件系统。它强调本地部署、隐私优先，数据不出用户本机。

Hermes Agent 和 OpenClaw 经常被放在一起比较，这种比较是有道理的——两者的定位高度重叠，都是通用型 AI 助手框架，都能跨平台工作、记忆上下文、执行真实任务。

但仔细看，两者的侧重点有明显差异。

OpenClaw 的核心卖点是多平台聊天集成和本地隐私。它的设计哲学是"你在哪聊天，AI 就在哪干活"——无论你用微信、Telegram 还是 Slack，OpenClaw 都能接入，然后在本地执行任务。它更像是一个把各种消息入口统一起来的自动化中枢，强调的是连接性和隐私控制。

Hermes Agent 的核心卖点是自我改进和自主进化。它不只是执行你交给它的任务，而是会在使用过程中自主创建技能、为每个用户建立认知模型、跨会话保持记忆，甚至能独立完成像写一部 79,000 字长篇小说这样的复杂创作任务。它强调的是成长性——用得越久，能力越强。

用一个比喻来说：OpenClaw 是一个自带万能遥控器的智能家居中枢，什么设备都能接入、什么平台都能控制；Hermes Agent 是一个会自己学习新技能的管家，一开始可能不如你预期，但越用越懂你，最终能做到你没想到的事。

两者的用户画像也有微妙差异。OpenClaw 的典型用户是注重隐私、使用多个聊天平台、需要本地自动化的技术用户——他们不想把数据交给云端，更愿意在自己机器上跑 AI。Hermes Agent 的用户画像更侧重于需要一个能持续进化的 AI 伙伴的人——可以是开发者，也可以是研究者、内容创作者，他们看重的是 AI 在长期使用中变得越来越聪明。

有一个关键的交叉地带：两者都支持技能/插件扩展，都能执行系统命令和自动化任务。但 OpenClaw 在聊天平台覆盖面上更广（30+ 平台 vs Hermes Agent 目前主要通过 CLI 和 API 交互），而 Hermes Agent 在自主学习和认知建模上走得更远。

GitHub Star 数的巨大差距（354K vs 87K）也需要放在语境中理解。OpenClaw 比 Hermes Agent 早发布了相当一段时间，社区生态更成熟（900+ 贡献者），而且它的多平台聊天集成模式天然降低了使用门槛——用户不需要学任何新工具，直接在自己熟悉的聊天软件里就能用。

3. LangGraph：学院派的武器

LangGraph 是 LangChain 生态中的一个组件，GitHub Star 约 10 万（LangChain 整个生态）。它的定位是有状态的 AI 工作流编排引擎。

如果说 Hermes Agent 的核心理念是「让 Agent 自己学习」，LangGraph 的核心理念是「让开发者精确控制 Agent 的行为」。LangGraph 把 Agent 的执行流程建模为一个图（Graph）——节点是操作，边是状态转移条件。开发者可以精确定义在什么条件下做什么事，支持循环、分支、人工介入等复杂流程。

这种设计的优势是可控性和可预测性极强。在企业环境中，这两个特性比什么都重要——你不希望你的 Agent 「自由发挥」去做你没预期的事情。

但代价是灵活性和自主性不足。LangGraph 的 Agent 不会自己学习新技能，不会建立用户模型，不会在使用中变得更聪明。它严格按照开发者定义的图来执行，不多不少。

用户社区对 LangGraph 的评价比较两极化。赞的人说它是企业级 AI 应用的最佳选择，概念清晰、调试方便、生产环境稳定。骂的人说它过度设计、学习曲线陡峭、写一个简单的 Agent 要写一堆样板代码。

Hermes Agent 和 LangGraph 的关系，有点像「自适应系统 vs 规则系统」的经典对比。在简单、可预测的场景中，规则系统更可靠；在复杂、多变的场景中，自适应系统更有优势。对于大企业的合规性场景（金融、医疗），LangGraph 的确定性更有吸引力。对于个人用户和创业团队的通用助手场景，Hermes Agent 的进化能力更有价值。

4. CrewAI：角色扮演的魅力

CrewAI 在 GitHub 上有 45,900 Star，它的核心概念是基于角色的多 Agent 协作。

CrewAI 的设计很有想象力：你可以创建一个「研究员」Agent、一个「写手」Agent、一个「编辑」Agent，给每个角色设定不同的人格和技能，然后让它们像一个真实的团队一样协作完成任务。这种设计在内容创作、市场调研等场景中表现不错。

它的优势是直觉性强——即使不懂编程的人也能理解「让不同角色的 AI 合作」这个概念。上手门槛相对较低。

局限性在于角色的「人格」和「技能」是预设的，不会在使用中进化。CrewAI 的角色之间也没有真正的记忆共享和知识积累机制。每次执行任务，都是一次新的「演出」，上次学到的东西不会自动带到下次。

跟 Hermes Agent 比较的话，CrewAI 更像一个编排工具——它帮你安排谁做什么，但每个角色本身不会成长。Hermes Agent 则更像一个生命体——它在使用中积累经验，变得越来越了解你和你的需求。

CrewAI 的社区评价普遍比较正面，特别是在非技术用户群体中。但高级用户经常抱怨它在复杂任务中的可控性不够，以及多 Agent 协作时的上下文传递有时不够精确。

5. AutoGen：微软的大手笔

AutoGen 是微软开源的 Agent 框架，GitHub 28,500 Star。它的核心设计是多 Agent 对话——让多个 Agent 以对话的形式协作解决问题。

AutoGen 背靠微软的资源，在企业市场有天然的信任优势。它跟 Azure 生态的集成很顺畅，对于已经在微软技术栈上的企业来说，AutoGen 是一个低摩擦的选择。

它的技术特点是支持 Agent 之间的自然语言对话来协调任务，支持人类参与对话流程（human-in-the-loop），以及灵活的消息传递机制。

局限性跟 CrewAI 类似——Agent 不会自我进化。另外，AutoGen 的学习曲线不低，微软风格的抽象层有时候让人觉得过度复杂。社区反馈中提到最多的吐槽是文档质量和 API 稳定性——微软在 AutoGen 的迭代中曾经做过一些不向后兼容的大改动，让早期用户很不爽。

相比 Hermes Agent，AutoGen 的优势在于企业级特性和微软生态的集成；劣势在于缺少自我学习能力和用户建模，以及开源社区活跃度偏低。

6. Smolagents：小而美的极简主义

Smolagents 是 HuggingFace 开源的 Agent 框架，GitHub 17,800 Star。名字里的 "smol" 已经说明了一切——它追求极致的简单和轻量。

Smolagents 的核心卖点是「几行代码就能创建一个 Agent」。它砍掉了所有复杂的抽象层，提供最直接的 API。对于那些只需要一个简单 Agent 来执行特定任务的开发者来说，Smolagents 是最省心的选择。

它的优势跟 Hermes Agent 几乎是互补的：Smolagents 追求简单，Hermes Agent 追求全面。如果你的需求是「用 10 行 Python 调一个 Agent 帮我做一件事」，Smolagents 完胜。如果你的需求是「我要一个能在 16 个平台上跟我交互、自己学新技能、记住我是谁的长期 AI 助手」，那 Smolagents 完全不在这个量级上。

7. 大厂 SDK：800 磅大猩猩们的入场

2025 年到 2026 年间，三个最重要的 AI 大厂——Anthropic、OpenAI、Google——先后推出了各自的 Agent SDK。

Claude Agent SDK（Anthropic）的特点是强调安全性和可控性。Anthropic 一贯的风格是在能力和安全之间找平衡，Agent SDK 也不例外。它提供了精细的权限控制和执行沙箱。

OpenAI Agents SDK 的特点是生态优势。作为 GPT 系列的开发方，OpenAI 在 Agent SDK 中深度集成了 GPT-4、DALL-E、Code Interpreter 等自家产品。

Google ADK（Agent Development Kit）的特点是跟 Google Cloud 和 Gemini 模型的深度集成。

这三个 SDK 的共同特点是：跟自家模型绑定，闭源或半开源，面向企业开发者。

跟 Hermes Agent 的核心区别在于两点。第一，模型锁定 vs 模型自由。大厂 SDK 都或明或暗地把你往自家模型上引导，而 Hermes Agent 支持 200+ 种模型，完全不绑定任何一家。第二，功能提供 vs 能力生长。大厂 SDK 提供一组固定的功能，Agent 不会自己变得更强；Hermes Agent 的学习循环让 Agent 在使用中持续进化。

大厂 SDK 的优势在于品牌信任度、企业级支持、与云服务的集成。劣势在于供应商锁定和创新灵活性不足。对于大企业来说，选择大厂 SDK 是安全的；对于追求极致自定义和不想被锁定的团队来说，Hermes Agent 更有吸引力。

8. 商业产品：Devin 和 Manus 的故事

Devin 是 Cognition Labs 开发的「全球首个 AI 软件工程师」，估值一度达到 102 亿美元。它的定位非常垂直和激进——不是做通用 AI 助手，而是试图独立完成软件开发任务，取代部分人类工程师的角色。

Devin 的核心能力包括：独立规划和执行编码任务、使用常见的开发者工具（编辑器、浏览器、终端）、从用户反馈中学习。它在一些标准化的编程基准测试中表现亮眼。

但 Devin 是完全闭源的商业产品，定价不低，且目前主要面向软件开发场景。跟 Hermes Agent 的开源、通用、多平台定位完全不同。它们之间的竞争关系更像是 iPhone 跟 Android 的关系——一个封闭精致，一个开放灵活。

Manus AI 则是另一个有话题度的产品，主打「全能型 AI 助手」。但它同样是闭源商业产品，且可用性和功能深度一直受到社区质疑。

9. 中国平台：另一条赛道

在中国市场，AI Agent 的发展走的是一条不太一样的路。

Coze（扣子） 是字节跳动推出的 AI 应用开发平台，它的核心卖点是低代码/无代码——你不需要写一行程序，通过可视化界面就能创建 AI 应用。Coze 集成了字节自己的 Doubao 模型，以及各种第三方工具。它的优势是上手门槛极低、对中国用户的微信/抖音等平台集成做得很好。局限性在于可定制性有限，不适合需要深度自定义的技术用户。

文心智能体 是百度基于文心大模型构建的 Agent 平台，深度集成了百度搜索和百度生态的各种服务。对于需要利用百度搜索能力的场景来说，它是一个天然选择。

蚂蚁 Agentar 是蚂蚁集团的 Agent 平台，侧重金融和商业场景。

中国平台跟 Hermes Agent 的根本区别在于开放性。中国平台大多是封闭的、平台化的，用户在平台提供的能力范围内创建应用。Hermes Agent 是完全开源的，用户可以深度定制每一个组件。这两种模式各有受众：企业用户和非技术用户偏爱平台的便利性，技术用户和追求自主可控的团队偏爱开源的灵活性。

10. 竞争格局总览

把上面所有玩家放到一张图里看，当前的 AI Agent 赛道可以用一个二维矩阵来理解：

纵轴是专用性 vs 通用性——从只做一件事（比如 Devin 只做软件工程）到什么都能做（比如 Hermes Agent 和 OpenClaw）。

横轴是静态能力 vs 进化能力——从功能固定不变（比如 LangGraph）到能自我学习和进化（比如 Hermes Agent）。

在这个矩阵中，Hermes Agent 处于右上角——高通用性 + 高进化能力。这个位置目前几乎是空的，Hermes Agent 是第一个真正占据这个生态位的产品。

OpenClaw 在右上偏左——高通用性 + 中等进化能力（它有上下文记忆和自适应学习功能，但自主进化程度不如 Hermes Agent）。

LangGraph 和 AutoGen 在左下——中等通用性 + 低进化能力。

大厂 SDK 在中下方——中等通用性 + 低进化能力，但有强大的品牌和生态优势。

中国平台在右下——高通用性 + 低进化能力（平台虽然什么都能做，但 Agent 本身不会自己变强）。

这个格局中最值得关注的趋势是：进化能力正在从一个「nice to have」变成一个「must have」。随着用户对 AI Agent 的期望从「能用」升级到「好用」再到「越用越好用」，不具备自我进化能力的框架和平台将面临越来越大的压力。而这恰恰是 Hermes Agent 的核心差异化所在。

四、横纵交汇洞察

历史如何塑造了今天

把纵向时间线和横向竞争格局叠在一起看，几件事变得清晰了。

Hermes Agent 之所以能在一个极度拥挤的赛道上杀出来，不是因为它在某个单一维度上做到了最好——论多平台集成能力它不如 OpenClaw，论企业级编排它不如 LangGraph，论品牌信任度它不如大厂 SDK。它的杀手锏是从来没有人做好过的那个组合：一个真正能自我进化的、通用的、开源的 AI 助手。

这个组合能出现，直接源于 Nous Research 过去三年的积累。

Hermes 模型系列的持续迭代，让团队深度理解了大语言模型的能力边界——什么事情模型本身就能做好，什么事情需要外部系统来补足。这种理解直接转化成了 Hermes Agent 的架构设计：不试图让模型做所有事，而是建一个系统让模型的能力随着使用而增长。

Karan Malhotra 的认知科学背景，决定了 Hermes Agent 不会走 LangGraph 那条纯工程化的路。四层记忆系统和用户建模的设计，带着明显的「类人认知」色彩。这不是一个偶然的设计选择，而是团队 DNA 的自然表达。

Nous Research 在开源社区积累了三年的信任，让 Hermes Agent 在发布第一天就获得了远超普通新项目的关注度。信任不是免费的，它是 Hermes 1 到 Hermes 4 每一次高质量迭代换来的。

5000 万美元的融资则提供了一个关键资源：时间。如果没有这笔钱，Nous Research 可能被迫在模型微调的红海里继续搏杀，而不是有余裕花半年时间闭关开发一个全新的产品方向。

优势的根源和潜在的包袱

Hermes Agent 今天最核心的优势——学习循环和自我进化——可以追溯到 Nous Research 创立之初的那句 slogan：「Artificial Intelligence Made Human」。当其他 Agent 框架的创建者在思考「怎么让开发者更容易编排 AI 工作流」时，Nous 的人在思考「怎么让 AI 像人一样学习和成长」。不同的初始问题，导向了截然不同的架构设计。

但这个优势也可能变成包袱。

自我进化的系统天然更难预测和控制。当一个企业的合规部门问「你的 AI Agent 明天会做什么？」时，Hermes Agent 很难给出一个确定的答案。这是学习循环的本质——如果 Agent 的行为是完全可预测的，那它就没有真正在「学习」。这种不确定性在个人用户场景中是魅力，在企业合规场景中是风险。

另一个潜在的包袱是技术复杂度。四层记忆系统、6 种执行后端、16 个平台网关、200+ 模型支持——这些功能在 50 天内堆叠到一起，代码库的复杂度增长速度是惊人的。4,211 次提交、2,900+ PR、1,600+ Issue——这些数字同时说明了社区的活跃和系统的膨胀。在高速扩张期，技术债务的积累几乎是不可避免的。

三个剧本

最可能的剧本：与 OpenClaw 共存，各自为王。

Hermes Agent 和 OpenClaw 虽然都是通用型 AI 助手框架，但两者的核心差异足以支撑各自的生态位。OpenClaw 凭借 30+ 聊天平台集成和本地隐私优先的策略，继续主导"多平台自动化中枢"这个定位，吸引注重隐私和跨平台连接的用户。Hermes Agent 则凭借自我进化和自主技能创建能力，在"持续成长型 AI 伙伴"这个赛道上站稳脚跟。两者会有用户重叠——一些技术用户可能同时使用 OpenClaw 做跨平台自动化、用 Hermes Agent 做需要深度学习和长期记忆的任务。在这个剧本中，Hermes Agent 在一年内 Star 数突破 15-20 万，成为自我进化型 AI Agent 领域事实上的开源标准。Nous Research 在此基础上推出商业版（Nous Portal 的扩展），实现盈利。

最危险的剧本：底层模型太强，Agent 被架空。

这是一个需要认真考虑的风险。如果大语言模型本身的能力持续以当前速度增长，到某个点上，模型可能内置了大部分 Agent 框架提供的能力——长期记忆、工具使用、自主规划。到那时，像 Hermes Agent 这样的「模型之上的系统」可能变得多余。这个风险对所有 Agent 框架都存在，但对 Hermes Agent 尤其值得关注，因为它的核心卖点（学习循环、记忆系统）是最容易被底层模型能力增长所替代的。想象一下，如果明年出现一个能够在百万 token 窗口中维持完美一致性的模型，四层记忆系统的价值就大打折扣了。

最乐观的剧本：成为自我进化 Agent 的操作系统。

在这个剧本中，Hermes Agent 的开源架构成为整个 AI Agent 生态的基础设施。就像 Linux 不是一个应用，而是应用运行的基础。Hermes Agent 不再只是一个 Agent，而是一个 Agent 的操作系统——第三方开发者在上面构建各种专用 Agent（编程 Agent、运营 Agent、客服 Agent），这些 Agent 共享底层的学习循环、记忆系统和平台网关。Nous Research 的 Psyche 分布式网络为这个生态提供计算资源，Hermes 模型系列为专用 Agent 提供经过特别优化的推理能力。这个剧本的触发条件是：Hermes Agent 需要在接下来的 6-12 个月内建立一个足够强大的插件/扩展生态，让第三方开发者能够轻松地在其基础上构建专用解决方案。

不管哪个剧本成真，有一件事是确定的：Hermes Agent 已经证明了「自我进化的 AI 助手」不只是学术论文里的概念，而是一个真实的、有市场需求的产品形态。这个证明本身就是它对整个 AI Agent 赛道最大的贡献——无论 Hermes Agent 未来走向何方，「Agent 应该能学习和成长」这个理念已经不可逆地改变了整个行业的产品思维。

从一个 Discord 聊天室里的几个 AI 爱好者，到 50 天内在 GitHub 上收获近 9 万颗星，Hermes Agent 的故事读起来像是一个创业神话。但如果你仔细看那条时间线，你会发现每一步「突然」的背后都有长期的积累。模型系列三年的迭代积累了社区信任，融资提供了战略转型的空间，「让 AI 像人一样成长」的初始愿景指引了差异化的架构设计。

Jeffrey Quesnelle 在 Nous Research 的网站上写着：「We believe the most interesting AI systems will be the ones that learn and grow alongside their users.」

Hermes Agent 是这句话的第一个真正实现。至于它能走多远，取决于自我进化这件事到底有多深的潜力——而这个问题，可能连 Hermes Agent 自己都还在学习如何回答。

五、信息来源

Hermes Agent GitHub 仓库 — 版本发布记录、代码统计、Issue 和 PR 数据
Nous Research 官方网站 — 团队信息、使命声明、模型发布公告
Nous Research Hermes 模型系列 - HuggingFace — Hermes 1-4 各版本的模型卡片和发布说明
Paradigm 领投 Nous Research A 轮融资报道 - Fortune — 5000 万美元融资及 10 亿美元估值信息
Jeffrey Quesnelle 社交媒体 — Hermes Agent 发布公告、小说创作公告
arXiv 2507.21046 - A Survey of Self-Evolving Agents — 自我进化智能体综述论文（TMLR 2026年1月发表）
腾讯云轻量应用服务器 Hermes Agent 部署模板 — 一键部署公告（2026年4月14日）
OpenClaw GitHub 仓库 — Star 数及功能对比参考
LangGraph 文档 — 技术架构及设计理念
CrewAI GitHub 仓库 — 功能特点和社区评价
AutoGen GitHub 仓库 — 微软 Agent 框架技术文档
Smolagents GitHub 仓库 — HuggingFace 轻量 Agent 框架
Grand View Research - AI Agent 市场报告 — 全球 AI Agent 市场规模及增长预测
CSDN / 掘金 / 知乎 / 博客园等中文技术社区 — 中国社区用户讨论和测评
微信公众号文章 — 一串随机数、程序员行一、虾搞AI社等公众号的 Hermes Agent 评测和分析