截至 4 月 20 日,Hermes Agent 已斩获 100k+ Star,持续霸榜 GitHub,成为近期开发者社区最受关注的 Agent 之一。技术大佬更是直言它是"OpenClaw 上线以来第一个真正意义上的竞争对手。"
过去大家往往在意 Agent 会不会调用工具、能不能接更多入口、做不做得完任务。而对 Hermes 的讨论更进一步触及 Learning Loop、自我反思,以及 Skill 自进化这类更底层的能力机制。
Hermes 是什么
Hermes Agent 由 Nous Research 在 2026 年 2 月开源发布。官方的定义很直接:"The self-improving AI agent"。它最大特点是内置学习环路(learning loop),能从任务中提炼 Skill,在使用中持续改进,主动沉淀知识,搜索过往会话,并在跨会话过程中逐步形成对用户的长期理解。
简单说,它试图成为一个会持续积累经验的个人 AI Agent。
OpenClaw 与 Hermes
提到 Hermes,不可避免地要和 OpenClaw 一起讨论。它们都不只是单点脚本、聊天 bot,而是把模型、工具、会话、记忆、Skill 和运行环境包在一起的通用 Agent 系统。目前,Hermes 与 OpenClaw 都已越过所谓"模型包装器"的阶段,区别不在"是不是 Agent",而是"厚度长在什么地方"。
两者在系统重心上有所区别:OpenClaw 管入口和秩序,更像控制面,重点是把入口、会话、权限、路由和秩序组织进系统;Hermes 管执行和经验,更像学习循环,重点是把执行中的方法沉淀下来,并在后续任务里复用。
此外,这两个工具的差异还体现在 Skill 上。OpenClaw 的 Skill 更像团队里的 SOP 库,强调来源、加载、优先级和治理;Hermes 的 Skill 更像任务完成后沉淀下来的工作笔记,强调把成功路径保存成可复用的方法。也就是说,前者更强调把能力组织起来,后者更强调把方法留下来,进行后续的迭代加强。
再往下拆,两者的差异还可以概括成下面这几个维度:
Skill 自进化:Hermes 最值得聊的东西
这不是设计师画的,也不是程序员写的——这是 Hermes Agent 调用自己创建的 Skill 生成的。
Hermes 的 Skill 不是插件,不是扩展,而是 Agent 在完成复杂任务后自动生成的操作手册——一个名为 SKILL.md 的文件。
格式很简单:YAML 头部(名称、描述、标签、版本)加 Markdown 正文(使用场景、操作步骤、常见坑、验证方法)。文件则保存在 ~/.hermes/skills/ 目录下。
一句话概括:OpenClaw 存储你说了什么(memory),Hermes 存储它学到了什么(skill)。
需要注意的点,Skill 不是 Hermes 的私有格式。agentskills.io 是 Skill 的开放标准规范,已经被 Claude Code、Cursor、Kiro、VS Code 等 16 个 AI 产品采纳。无疑,Skill 是目前 AI 行业采用最广泛的事实标准。
自进化是怎么发生的?
过程拆解开,如下:
- 第一次执行复杂任务
- 完成(5+ tool calls 成功)
- Agent 自动抽象步骤 → 生成 SKILL.md
- 第二次遇到类似任务
- Agent 调用已有 Skill → 速度更快、步骤更少
- 如果有新发现 → Agent 自动 patch SKILL.md
- Skill 越用越精准
当中关键点:
- 生成 SKILL.md 的触发条件是完成 5 次以上复杂任务的工具调用(tool call),像是你和 AI 之间的简单问答并不会生成 Skill
- 自进化方式是 LLM 驱动的 Markdown 改写
- 高级玩法:hermes-agent-self-evolution 用 DSPy + 遗传算法做 Skill 变异优化,单次进化开销在 10 之间
实战:用 architecture-diagram 走一遍全流程
相信不少人对"自进化"的说法保持怀疑,现在我们来简单验证一下:
第一步:让 Hermes 画一张架构图
给个常见需求:"画一个 React + Node.js + PostgreSQL + Redis + S3 的系统架构图。"
Hermes 调用内置的 architecture-diagram Skill,接着 7 步:
- 分析需求
- 规划布局
- 计算坐标
- 生成 SVG
- 包装成 HTML
- 输出一个独立 HTML 文件
- 浏览器打开
简单讲解下色块,它十分清晰,Skill 以对应技术产品的 logo 色作为参考。像是前端 React 的青色、后端 Node.js 的翡翠、PostgreSQL 数据库的紫色、云服务 S3 的淡黄、Redis 数据库的淡橙。我们不需要指定配色,Skill 文件里默认这套配色设计,你可以按需自行修改对应的配色。
第二步:Skill "操作手册"长什么样
打开 ~/.hermes/skills/creative/architecture-diagram/SKILL.md,里面有完整的 Workflow、Design System、连线规则、间距逻辑。这是 Hermes 在反复执行架构图任务后积累形成的。
第三步:用 Anthropic 官方工具验证这个 Skill
skill-creator 来自
anthropics/skills仓库,是 Anthropic 官方出品的 13 个标准 Skill 之一。它的定位很特别——Meta-Skill:专门用来创建、测试、迭代其他 Skill。它能自动生成 eval 测试用例、跑 benchmark、给出质量评分、建议改进方向。把 Hermes 生成的 architecture-diagram SKILL.md 喂给了 skill-creator,结果很有意思:它指出了几个真实问题。
比如:8 个以上组件时布局会乱、连线路由在密集场景下会重叠、验证步骤不够完整…
第四步:按建议改进 → 再验证 → 分数提升
根据 skill-creator 的反馈,我们来改进下 Skill:补充组件数量警告、增加布局验证步骤、完善边缘场景处理。再跑一次验证,分数上去了,图片也更美观了。
这就是自进化,一个可重复的、有方法论的闭环:
Hermes 创建 Skill → Anthropic 官方工具验证质量 → 发现问题 → 改进 → 再验证 → 能力提升
不止于此:正在成型的 Skill 生态
Hermes 绘制架构图只是开始,Hermes 的 Skill 已初具生态规模:
- 官方开箱即用: 官方 optional-skills/ 目录下已沉淀 28+ 个 Skill,覆盖了 DevOps、代码研究、安全审计等 13 个常见开发场景
- 拥抱开放标准: 采用 agentskills.io 规范,这意味它生成的 Skill 可以与 Claude Code、Cursor 等其他 10+ 种主流 AI 工具互通
- 极客的高阶玩法: 开发者社区已经开始出现基于 DSPy 和遗传算法的衍生项目(hermes-agent-self-evolution),通过程序让 Skill 自行变异、跑测和择优
当然,赞叹之余,我们还需要客观认清其能力边界:
- 触发有门槛: 简单的日常闲聊无效,只有成功完成复杂任务(5+ tool calls)才会触发总结机制
- 是"记笔记",而非"微调训练": 官方宣称的 "Self-improving" 有夸大成分。它没有在底层微调大模型,只是让 Agent 写了一份高质量 SOP 留给下次参考
- 仍需人工审核: HN 极客曾吐槽传统 Memory 流是一团乱麻("a complete mess")。Hermes 的 Skill 虽高度结构化,但在极端复杂场景下,依然离不开开发者的人工微调
- 验证的是规范: 本文工具验证的是 Skill 文档的逻辑与格式完整性,并不是在给 AI 测智力
即便我们罗列一些槽点,但这不影响核心结论:凭借这套可复用的经验沉淀机制,Hermes 已经是目前开源框架中最接近"越用越强"的实现。它不完美,但方向对了。
让"自进化"飞轮持续转下去
Hermes 的"自进化"依赖于真实任务的反复试错与积累。跑通只是第一步,长线运行才是让它"越用越强"的关键。
如果你已经跨过了本地尝鲜阶段,希望专属 Agent 能 7x24 小时在线待命,并随时随地复用它积攒下来的 SKILL.md,可以借助七牛云的现成基建快速落地:
- 七牛云 LAS: 10 分钟轻松部署,免折腾环境,实现 Agent 的云端常驻与能力持久化
- 七牛云 MaaS: 无缝接入主流大模型,低成本 Token 足以覆盖 Agent 日常跑 Demo
无论是开发者们在本地手搓,还是在云端长期挂机,Hermes 都值得每个开发者亲自上手一试。
👉 [上手专属] 七牛云 LAS 特惠活动:s.qiniu.com/IviUfa
👉 [算力弹药] 邀好友最高领百亿 Token:s.qiniu.com/rAzUZ3
👉【10分钟部署】Hermes Agent 一站式部署教程:mp.weixin.qq.com/s/ugqS0neWE…