一文带你了解火过 OpenClaw 的 Hermes Agent截至 4 月 20 日，Hermes Agent 已斩获

截至 4 月 20 日，Hermes Agent 已斩获 100k+ Star，持续霸榜 GitHub，成为近期开发者社区最受关注的 Agent 之一。技术大佬更是直言它是"OpenClaw 上线以来第一个真正意义上的竞争对手。"

图1.png

过去大家往往在意 Agent 会不会调用工具、能不能接更多入口、做不做得完任务。而对 Hermes 的讨论更进一步触及 Learning Loop、自我反思，以及 Skill 自进化这类更底层的能力机制。

Hermes 是什么

图2.PNG

Hermes Agent 由 Nous Research 在 2026 年 2 月开源发布。官方的定义很直接："The self-improving AI agent"。它最大特点是内置学习环路（learning loop），能从任务中提炼 Skill，在使用中持续改进，主动沉淀知识，搜索过往会话，并在跨会话过程中逐步形成对用户的长期理解。

简单说，它试图成为一个会持续积累经验的个人 AI Agent。

OpenClaw 与 Hermes

提到 Hermes，不可避免地要和 OpenClaw 一起讨论。它们都不只是单点脚本、聊天 bot，而是把模型、工具、会话、记忆、Skill 和运行环境包在一起的通用 Agent 系统。目前，Hermes 与 OpenClaw 都已越过所谓"模型包装器"的阶段，区别不在"是不是 Agent"，而是"厚度长在什么地方"。

两者在系统重心上有所区别：OpenClaw 管入口和秩序，更像控制面，重点是把入口、会话、权限、路由和秩序组织进系统；Hermes 管执行和经验，更像学习循环，重点是把执行中的方法沉淀下来，并在后续任务里复用。

此外，这两个工具的差异还体现在 Skill 上。OpenClaw 的 Skill 更像团队里的 SOP 库，强调来源、加载、优先级和治理；Hermes 的 Skill 更像任务完成后沉淀下来的工作笔记，强调把成功路径保存成可复用的方法。也就是说，前者更强调把能力组织起来，后者更强调把方法留下来，进行后续的迭代加强。

再往下拆，两者的差异还可以概括成下面这几个维度：

图3.PNG

Skill 自进化：Hermes 最值得聊的东西

这不是设计师画的，也不是程序员写的——这是 Hermes Agent 调用自己创建的 Skill 生成的。

图4.PNG

Hermes 的 Skill 不是插件，不是扩展，而是 Agent 在完成复杂任务后自动生成的操作手册——一个名为 SKILL.md 的文件。

格式很简单：YAML 头部（名称、描述、标签、版本）加 Markdown 正文（使用场景、操作步骤、常见坑、验证方法）。文件则保存在 ~/.hermes/skills/ 目录下。

一句话概括：OpenClaw 存储你说了什么（memory），Hermes 存储它学到了什么（skill）。

需要注意的点，Skill 不是 Hermes 的私有格式。agentskills.io 是 Skill 的开放标准规范，已经被 Claude Code、Cursor、Kiro、VS Code 等 16 个 AI 产品采纳。无疑，Skill 是目前 AI 行业采用最广泛的事实标准。

自进化是怎么发生的？

过程拆解开，如下：

第一次执行复杂任务
完成（5+ tool calls 成功）
Agent 自动抽象步骤 → 生成 SKILL.md
第二次遇到类似任务
Agent 调用已有 Skill → 速度更快、步骤更少
如果有新发现 → Agent 自动 patch SKILL.md
Skill 越用越精准

当中关键点：

生成 SKILL.md 的触发条件是完成 5 次以上复杂任务的工具调用（tool call），像是你和 AI 之间的简单问答并不会生成 Skill

自进化方式是 LLM 驱动的 Markdown 改写

高级玩法：hermes-agent-self-evolution 用 DSPy + 遗传算法做 Skill 变异优化，单次进化开销在 $2-$ 10 之间

实战：用 architecture-diagram 走一遍全流程

相信不少人对"自进化"的说法保持怀疑，现在我们来简单验证一下：

第一步：让 Hermes 画一张架构图

给个常见需求："画一个 React + Node.js + PostgreSQL + Redis + S3 的系统架构图。"

Hermes 调用内置的 architecture-diagram Skill，接着 7 步：

分析需求

规划布局

计算坐标

生成 SVG

包装成 HTML

输出一个独立 HTML 文件

浏览器打开

图5.png

简单讲解下色块，它十分清晰，Skill 以对应技术产品的 logo 色作为参考。像是前端 React 的青色、后端 Node.js 的翡翠、PostgreSQL 数据库的紫色、云服务 S3 的淡黄、Redis 数据库的淡橙。我们不需要指定配色，Skill 文件里默认这套配色设计，你可以按需自行修改对应的配色。

图6.png

第二步：Skill "操作手册"长什么样

打开 ~/.hermes/skills/creative/architecture-diagram/SKILL.md，里面有完整的 Workflow、Design System、连线规则、间距逻辑。这是 Hermes 在反复执行架构图任务后积累形成的。

图7.png

第三步：用 Anthropic 官方工具验证这个 Skill

skill-creator 来自 anthropics/skills 仓库，是 Anthropic 官方出品的 13 个标准 Skill 之一。它的定位很特别——Meta-Skill：专门用来创建、测试、迭代其他 Skill。

它能自动生成 eval 测试用例、跑 benchmark、给出质量评分、建议改进方向。把 Hermes 生成的 architecture-diagram SKILL.md 喂给了 skill-creator，结果很有意思：它指出了几个真实问题。

比如：8 个以上组件时布局会乱、连线路由在密集场景下会重叠、验证步骤不够完整…

图8.png

第四步：按建议改进 → 再验证 → 分数提升

根据 skill-creator 的反馈，我们来改进下 Skill：补充组件数量警告、增加布局验证步骤、完善边缘场景处理。再跑一次验证，分数上去了，图片也更美观了。

图9.png

这就是自进化，一个可重复的、有方法论的闭环：

Hermes 创建 Skill → Anthropic 官方工具验证质量 → 发现问题 → 改进 → 再验证 → 能力提升

图10.png

不止于此：正在成型的 Skill 生态

Hermes 绘制架构图只是开始，Hermes 的 Skill 已初具生态规模：

官方开箱即用： 官方 optional-skills/ 目录下已沉淀 28+ 个 Skill，覆盖了 DevOps、代码研究、安全审计等 13 个常见开发场景
拥抱开放标准： 采用 agentskills.io 规范，这意味它生成的 Skill 可以与 Claude Code、Cursor 等其他 10+ 种主流 AI 工具互通
极客的高阶玩法： 开发者社区已经开始出现基于 DSPy 和遗传算法的衍生项目（hermes-agent-self-evolution），通过程序让 Skill 自行变异、跑测和择优

当然，赞叹之余，我们还需要客观认清其能力边界：

触发有门槛： 简单的日常闲聊无效，只有成功完成复杂任务（5+ tool calls）才会触发总结机制
是"记笔记"，而非"微调训练"： 官方宣称的 "Self-improving" 有夸大成分。它没有在底层微调大模型，只是让 Agent 写了一份高质量 SOP 留给下次参考
仍需人工审核： HN 极客曾吐槽传统 Memory 流是一团乱麻（"a complete mess"）。Hermes 的 Skill 虽高度结构化，但在极端复杂场景下，依然离不开开发者的人工微调
验证的是规范： 本文工具验证的是 Skill 文档的逻辑与格式完整性，并不是在给 AI 测智力

即便我们罗列一些槽点，但这不影响核心结论：凭借这套可复用的经验沉淀机制，Hermes 已经是目前开源框架中最接近"越用越强"的实现。它不完美，但方向对了。

让"自进化"飞轮持续转下去

Hermes 的"自进化"依赖于真实任务的反复试错与积累。跑通只是第一步，长线运行才是让它"越用越强"的关键。

如果你已经跨过了本地尝鲜阶段，希望专属 Agent 能 7x24 小时在线待命，并随时随地复用它积攒下来的 SKILL.md，可以借助七牛云的现成基建快速落地：

七牛云 LAS： 10 分钟轻松部署，免折腾环境，实现 Agent 的云端常驻与能力持久化
七牛云 MaaS： 无缝接入主流大模型，低成本 Token 足以覆盖 Agent 日常跑 Demo

无论是开发者们在本地手搓，还是在云端长期挂机，Hermes 都值得每个开发者亲自上手一试。

👉 [上手专属] 七牛云 LAS 特惠活动：s.qiniu.com/IviUfa

👉 [算力弹药] 邀好友最高领百亿 Token：s.qiniu.com/rAzUZ3

👉【10分钟部署】Hermes Agent 一站式部署教程:mp.weixin.qq.com/s/ugqS0neWE…