OpenClaw 和 Hermes Agent 走出了两条路,像极了当年的 Android 和 iPhone

0 阅读15分钟

Gemini_Generated_Image_sg7lgcsg7lgcsg7l.jpeg

我桌上这台 Mac Mini 已经连续跑了三个月了。

它同时运行着两个 AI Agent。一个是 OpenClaw,接管了我 6 个聊天软件的工作对话,39 个角色随时待命。另一个是 Hermes Agent,负责我的个人笔记、技术调研和日常自动化。

三个月前装 Hermes 的时候,我觉得它们干的事差不多,无非就是接收指令、调用工具、返回结果。顶多一个插件多一些,一个记忆好一些。

三个月后我发现,这两个东西正在变成完全不同的物种。

不是功能层面的不同。是它们对「AI Agent 应该是什么」这个问题,给出了截然相反的回答。

如果你最近在选 Agent 工具,或者在考虑要不要从一个换到另一个,这篇可能会帮你省掉不少弯路。因为这个选择的核心不是功能清单的对比,是一个关于信仰的判断。

我尽量把这三个月的观察和思考都掏出来。可能有些想法还不成熟,但至少是真实的。

故事得从一个奥地利人说起。

Peter Steinberger 在 iOS 开发社区耕了好多年,之前主要身份是开发者工具公司的创始人。大模型火了之后,他跟所有技术极客一样,开始给自己写工具。

但他写的东西跟大多数人不一样。

大多数人写的是一个聊天界面的包装,打开用完就关了。他写的是一个后台进程,像 Nginx 一样常驻在机器上。你在 Telegram 上发条消息,它就开始干活。干完了给你回消息。你不需要一直盯着终端。

他给这个东西起了个名字叫 Clawdbot。Claw 是龙虾爪子的意思,Bot 是机器人。放在一起,明眼人都能看出来,这是对 Anthropic 的 Claude 模型的致敬。龙虾爪子机器人,你品品。

2025 年 11 月 24 号,Clawdbot 在 GitHub 开源。

然后 Anthropic 的律师来了。

说名字太像 Claude,疑似商标侵权。Steinberger 很快改了名,叫 Moltbot,molt 是龙虾脱壳的意思,继续保持龙虾主题但去掉了 Claude 的影子。三天后又改了一次。OpenClaw。Open 表明开源,Claw 保留龙虾基因,足够独特不会惹来第二封律师函。

一周内改两次名这件事本身,成了最好的传播素材。GitHub 上到处是讨论帖,Reddit 和 Twitter 上全在吃瓜。热度远超任何一次正常的产品发布。

OpenClaw 在改名后一周内突破了 10 万 GitHub Stars。

10 万是什么概念?大多数 YC 明星项目的全生命周期 Star 数都达不到这个数字。整个 2025 年能在一个月内到这个量级的项目,一只手数得过来。OpenClaw 只用了七天。

我就是在那个时候开始用它的。

现在回过头看,OpenClaw 做对了一个关键的架构决策。它把 Agent 做成了一个 Gateway 服务。

你想想看,如果 Agent 只是一个 CLI 工具,打开终端敲命令用完就关,那它就是一个增强版的 ChatGPT。但如果 Agent 是一个 Gateway,就像你的路由器一样一直在那运行,那它就需要连接管理、会话路由、认证体系。一旦有了这些基础设施,多 Agent 协作、插件系统、企业级安全就成了自然的延伸。

这就是为什么 OpenClaw 后来能接 20 多个聊天渠道,能跑 HighClaw 多 Agent 协作,能搞出 NemoClaw 安全沙箱。因为 Gateway 架构天然支持这些东西。社区开发者在不改核心代码的前提下造出了一整套生态。到 2026 年 4 月,ClawHub 上已经有超过 5700 个社区贡献的 Skill,247000 名开发者加入了这个生态系统。

但这个「好决策」也有代价。

Gateway 复杂。要获得 OpenClaw 的全部能力,你需要装好几个组件。我自己配完全套的时候,记忆模块装了 LosslessClaw,安全模块装了 NemoClaw,多 Agent 编排用了 HighClaw。每一个都很好用,但每一个都需要单独安装和配置。对新用户来说,面对的不是一个产品,是一个生态系统。

img-01-架构对比.png

与此同时,另一个团队在观察。

Nous Research 不是新玩家。这个 AI 研究实验室在 2023 到 2025 年间以 Hermes 模型系列建立了声誉。一系列面向通用指令遵循和工具调用优化的开源大语言模型,Hermes 3 在 2024 年 8 月发布的时候,已经是 HuggingFace 上最受欢迎的开源指令微调模型之一。

但模型只是大脑。

Nous Research 也在做 Atropos,一个用于强化学习训练的环境框架。以及 DisTrO,分布式训练优化。这些技术积累指向一个很清晰的方向,他们想做能自己变好的系统。

模型是大脑,Agent 是身体,强化学习是进化机制。

2026 年 2 月,Hermes Agent 正式发布。MIT 协议开源。

我差不多是发布第一周就装上了。装完之后第一个感觉是,太轻了。OpenClaw 要配置半天,Hermes 几分钟就跑起来。一台 5 美元一个月的 VPS 就够用了。

但真正让我震的不是安装体验。

是用了大概三天之后发生的事。

它自己创建了一个 Skill。

我没有写任何 Markdown 文件,没有做任何配置。它在处理完一个复杂的多步骤任务之后,自己分析了任务中的可复用模式,然后写了一个 Skill 文件出来。下次遇到类似的事,它直接用这个 Skill 了。

说真的,那一刻我是有点愣住的。

这是我第一次切身体会到两者的根本区别。

如果把 OpenClaw 想象成一栋大楼,它有大堂就是 Gateway,有电梯就是路由,有各种房间就是插件,你需要自己设计布局,决定每个房间装什么。

Hermes Agent 更像一个实习生。第一天什么都不会。但每天都在变好。

OpenClaw 的 Skill 是静态的。你写好一个 Markdown 文件,Agent 按照它执行,有问题你手动改。ClawHub 上有 5700 多个社区贡献的 Skill,从邮件管理到浏览器自动化到代码审查,应有尽有。但到了你的机器上,它们就固定了。

Hermes 的 Skill 是活的。Agent 自己创建、自己修改、自己淘汰。它有一个内置的自进化循环,分五步。先体验,完成一个复杂任务。然后提取,识别任务中的可复用模式。接着创建,把模式写成 Skill 文件。之后精炼,下次遇到类似任务时 Skill 会自我改进。最后回顾,每 15 个任务它会复盘自己的表现,分析成功和失败。

这个循环不是一个可选功能。它是整个架构的脊柱。

坦率的讲,这两种思路代表了对 Agent 的两种根本信仰。

OpenClaw 相信 Agent 是工具。工具应该被精确配置、被组合使用、被团队共享。工具的核心价值是可靠和可控。

Hermes Agent 相信 Agent 是同事。同事应该自己学习、自己成长、自己记住你的偏好。同事的核心价值是越来越懂你。

工具论 vs 同事论。

记忆系统上这个差异体现得更明显。OpenClaw 的记忆就是三个 Markdown 文件,SOUL.md 管人设,MEMORY.md 管持久化笔记,USER.md 管用户画像。你可以直接用文本编辑器打开它们,读得懂、改得了。透明度极高。但跨会话记忆需要你手动配置,没有自动的知识沉淀机制。想要更强的记忆?装 LosslessClaw,一个基于 DAG 的层级摘要引擎,没有任何消息会被丢弃。但那是第三方组件,你得额外安装。

Hermes 的记忆系统是内置的多层栈。持久化笔记由 Agent 自己筛选,会话历史用 FTS5 全文搜索加 LLM 摘要,用户建模用 Honcho 辩证法随时间加深理解,Skill 本身就是程序化记忆。冷热分离严格控制 Token 消耗。这些开箱就有,你不需要配任何东西。

两周前我让 Hermes 帮我整理一个技术调研报告,它自动用了一个它自己创建的 Skill,那个 Skill 是一个月前处理类似任务时生成的。整个过程比我预期的快了不少,而且输出格式恰好是我喜欢的样子。

它记住了我喜欢什么格式。我从来没有明确告诉过它。

这种感觉很难用功能清单来衡量。但你如果自己体验过,你会知道我在说什么。

img-02-Android-vs-iPhone.png

这让我想到了 2007 年。

那一年 iPhone 发布,Android 也开始进入公众视野。当时所有人都在问「哪个好」。功能对比表满天飞。屏幕参数、摄像头像素、App 数量。

十几年后回头看,那些对比表没有一张能预测后来发生的事。

iPhone 没有因为「不能换电池」而失败。Android 没有因为「碎片化」而消亡。它们各自找到了自己的用户,各自建立了自己的生态。

真正决定胜负的,从来不是功能清单。是产品背后的那个信念,以及那个信念能吸引到什么样的人。

OpenClaw 就是 Android。开放、可定制、生态丰富、碎片化。偶尔有安全问题。适合构建者。

Hermes Agent 就是 iPhone。开箱即用、体验一致、安全默认值高。扩展受限。适合操作者。

我两个都用了三个月,这个类比是真的越想越觉得贴切。

回到这块来聊聊用户。社区里的声音也很有意思。

用 OpenClaw 的人最常夸的是什么呢,「插件生态太丰富了」「HighClaw 的多 Agent 协作真的能用在生产环境」「LosslessClaw 的上下文管理吊打一切」。最常吐槽的呢,「配置太复杂」「全套体验需要装太多东西」「刚装完就看到 CVE 新闻有点慌」。

用 Hermes 的人最常夸的是,「装完就能用」「用了两周明显感觉它变聪明了」「自动创建 Skill 的体验太惊艳」「零遥测很安心」。最常吐槽的是,「渠道太少,没有飞书和 QQ」「不支持完整的多 Agent 编排」「生态比 OpenClaw 小得多」。

我自己的体验呢。OpenClaw 我用来管 39 个角色,接管 6 个聊天渠道的工作对话。这是它的绝对领地,Hermes 在多渠道和多 Agent 协作上差得太远。我需要同时跟 Telegram、Discord、Slack、飞书上的人和 Agent 对话,只有 OpenClaw 能干这事。

但日常私人使用,我确实在明显倾向 Hermes。

成本也是一个因素。OpenClaw 的 LLM 费用大概每天 65 美元左右。Hermes 通过 OpenRouter 走便宜模型,一个月下来 2 到 65 美元不等,看你怎么用。加上一台 5 美元的 VPS,总成本差距是很大的。

当然选型不能只看体验和成本。安全也得聊。

2026 年 2 月初,安全研究人员披露了 CVE-2026-25253,CVSS 评分 8.8,高危。漏洞原理说起来有点让人不安。OpenClaw 的控制界面对一个叫 gatewayUrl 的参数缺乏校验。攻击者只需要构造一个恶意链接,当你这个已经登录了 OpenClaw 的人点击它,浏览器会自动建立到攻击者服务器的 WebSocket 连接,把你的认证令牌传过去。

一个链接,完全接管。即使你的 OpenClaw 只绑定在 localhost 上也没用。你自己的浏览器就是攻击者的桥梁。

更要命的是 ClawHub。Koi Security 在上面发现了 1467 个恶意 Skill。伪装成加密货币追踪器、YouTube 工具之类的东西,文档里嵌入「前置依赖」指令,诱导你在终端里运行恶意命令。包括 Atomic macOS Stealer 那种窃取浏览器密码和加密钱包的木马。Snyk 的报告说超过 4 万个自托管 OpenClaw 实例使用了不安全的默认配置在运行。

这事直接动摇了社区信心。Reddit 和 Hacker News 上吵了好几天。

漏洞已经修了。但信任这种东西,修起来比代码慢得多。

Hermes Agent 这边呢,安全策略更保守但更难出错。零遥测,没有任何数据离开你的机器。内置 Prompt 注入扫描。凭证自动脱敏,错误日志里的 API Key 自动打码。容器强化,只读根文件系统,Linux capability 全部丢弃,PID 限制 256,完整命名空间隔离。

不是说它绝对安全,没有什么软件敢这么讲。但安全默认值确实高。

然后还有一个很戏剧性的事。2026 年 2 月 14 号,情人节,Peter Steinberger 宣布加入 OpenAI。领导他们的「下一代个人 Agent」部门。

一个开源 AI Agent 平台的创始人,跳去了全球最大的闭源 AI 公司。

社区的反应很复杂。一方面觉得这验证了 OpenClaw 方向的正确性,连 OpenAI 都认了。另一方面,创始人走了,多少有点不安。OpenClaw 后来转型为独立非营利基金会治理,变成了真正的社区项目。

聊了这么多历史和现状,我觉得有必要往前看一步。

这个赛道接下来会怎么走?我脑子里有三个剧本。

最可能发生的,是和平共处,各占山头。OpenClaw 在团队协作和企业场景中稳固地位,变成 AI Agent 领域的 Kubernetes。Hermes Agent 在个人生产力和研究场景中快速增长,变成 AI Agent 领域的 macOS。两者通过 agentskills.io 等开放标准实现部分互操作。getclaw.sh 同时提供两者的托管服务,其实它已经在这么做了。

最危险的剧本,是 OpenClaw 的安全问题持续发酵。如果 2026 年下半年再出一个高影响力的 CVE,或者 ClawHub 恶意 Skill 造成了实际的数据泄露事件,信任可能会崩塌。基金会治理模式下没有商业实体可以快速做危机公关和安全加固。开源项目的信任一旦崩了,重建是真的难。

最有意思的剧本,是合流。

你知道 Hermes 有一个命令叫 hermes claw migrate 吗?一键把你的 OpenClaw 配置迁移到 Hermes。这说明 Nous Research 非常清楚,OpenClaw 的存量用户就是他们最大的潜在用户池。而 OpenClaw 社区也在讨论如何引入学习循环。如果两者在功能上趋同,竞争就变成了「谁的体验更好」。agentskills.io 变成 AI Agent 领域的 HTTP 协议。整个赛道的蛋糕做大,两者都受益。

img-03-未来三个剧本.png

我觉得第三个剧本最有意思,也最值得期待。

但不管哪个剧本发生,有一件事是确定的。

两种信念都有道理,也都有盲区。

工具论的盲区是,规模越大,维护 Skill 的人力成本越高。5700 个 Skill 听着很美,但谁来保证它们都是最新的、安全的、互相兼容的?

同事论的盲区是,一个自进化的 Agent 如果在错误的方向上自我强化,纠错成本可能比重新配置一个静态 Skill 还高。在受监管行业,银行、医院、律所,「不可预测的行为变化」不是优势,是风险。

我两个都用着。但我得诚实地说,我的偏好正在倾斜。

Hermes 那个「越用越好」的感觉,一旦体验过就很难回去。它让我觉得我不是在使用一个工具,而是在培养一个属于自己的 AI。这种关系随着时间会变得越来越有价值。三月份它处理某类任务的表现,到今天已经有可观测的提升了。不是因为我做了什么配置,是它自己学会的。

但 OpenClaw 的多渠道和多 Agent 能力,目前没有替代品。当我需要指挥一支 AI 团队同时在六个平台上工作的时候,只有它能干。

我有时候觉得,也许最好的状态就是两个都用。就像很多人同时用 Mac 和 Windows 一样。不是因为选不出来,而是因为它们各自在各自的领域里,确实是最好的选择。

说到这里又想到一件事。

2010 年前后,科技媒体上铺天盖地都是「Android vs iPhone 谁更好」的文章。十几年后再看,这个问题本身就问错了。从来不是谁更好。是你是什么类型的用户。

想要完全掌控一切、享受搭积木过程、需要跨多个渠道协作的人,OpenClaw 是你的 Android。

想要东西开箱即用、不想管基础设施、在意长期积累效应的人,Hermes Agent 是你的 iPhone。

三个月前我说它们正在变成不同的物种,现在我更确定了。但不同物种不意味着非此即彼。

大时代啊,朋友们。

你现在在用什么 Agent?或者你打算从哪个开始?评论区聊聊。

下一篇我准备拆一下 ClawHub 那 1467 个恶意 Skill 的事,到底发生了什么,怎么自保。感兴趣的可以先关注。

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标 ⭐ ~

谢谢你看我的文章,我们,下次再见。