前两天,有个用 OpenClaw 挺久的朋友发消息问我,说最近感觉 OpenClaw 的社区有点安静,是不是出什么事了。
我说,没出什么事,只是这波浪潮走得太快了。
OpenClaw 的时代结束得没什么声音。 不是因为它不好,是因为有个东西把它的用户往那边拉走了。 那个东西叫 Hermes Agent,是 Nous Research 做的。如果你现在还不知道这个名字,我建议你把这篇文章看完。
我第一次看到 Hermes Agent 的介绍,是在 X 上一个英文帖子的评论区里,有人说,这是第一个真正「不绑在你笔记本上」的个人 AI 智能体。
我当时没太在意,觉得又是一个吹过头的宣传。但点进去看完之后,我愣了一会儿。
它不是一个 AI 编程助手。
这一点要说清楚,因为很多人看到 CLI、看到 Nous Research,第一反应会觉得这是类似 Claude Code 的东西,用来写代码的。但 Hermes Agent 完全不是这个定位。官方的描述是,自我进化的 AI 智能体,唯一内置学习闭环的 Agent。
具体是什么意思呢。
它会在你用它的过程中主动积累记忆,记住你是谁、你习惯怎么做事、你上次让它做了什么。它会在完成复杂任务之后自己生成技能,下次遇到类似的事情,它会用上次学到的方式来处理,还会在用的过程中把那个技能继续改进。这是一个持续在跑的学习闭环,不是一次性的对话。
你不用每次开一个新对话都重新解释一遍你是谁、你的项目是什么结构、你喜欢什么风格的回复。它记得。
然后是它跑在哪里这件事。
它不绑在你的笔记本上。你可以把它部署在一台 5 美元一个月的 VPS 上,然后通过 Telegram 和它说话,它在那台云服务器上帮你干活,你在手机上收结果。闲置的时候它几乎不烧钱,因为它支持 serverless 的休眠唤醒模式。
还支持 Discord、Slack、WhatsApp、Signal。一个 gateway 进程,你在哪个平台它就在哪个平台。
消息平台这块,对中国用户还有一个额外的好消息。它支持 Kimi、MiniMax、GLM 这些国内模型提供商,通过 OpenRouter 也能接 200 多个模型。你不需要翻墙才能用,不需要美国信用卡,切换模型一条命令就能搞定。
再加上内置的 cron 调度器,你可以让它每天早上给你发一份简报,每周五帮你做一次项目回顾,完全无人值守地跑着。
但问题来了,也就是让我后来决定动手的那个原因。
Hermes Agent 的官方文档,全是英文的。
整整 102 篇。Getting Started,User Guide,Features,Messaging Platforms,Integrations,Developer Guide,Reference,密密麻麻,排版精良,逻辑清晰,对英文读者来说真的很友好。
我搜了一圈,没有中文翻译版。去 X 上搜,中文的介绍和教程寥寥无几,大多数只是简单提了一下这个工具的存在,没有深入的使用说明。
你大概能感受到这是什么处境。你想把它部署起来、接上 Telegram,但光是「Messaging Gateway」那一章就有好几篇,细节很多,一旦某个配置理解偏了,整个流程就起不来。
然后我脑子里出现了一个画面。不是我自己,是一个下班后在研究 AI 工具的人,英文勉强够用,打开 Hermes Agent 的文档,扫了几屏,觉得太费劲,然后默默关掉了页面。
这个画面出现之后,我就开始动手了。
我给这个项目起的名字是 hermes-docs-feishu-automation。
做之前我想清楚了一件事,我不想做一次性的翻译。那种翻完扔在那里、之后再也没人维护的项目,我见过不少,最后要么链接失效,要么内容和官方严重脱节,反而给人造成困扰。
我想做的是,Hermes Agent 的官方文档更新了,我这边能自动感知到,然后把变更的内容重新翻译发出来。持续维护,长期有效。
所以整个项目的设计围绕「批次」这个概念展开。
每天跑一次上游同步,程序去把 Hermes Agent 的 GitHub 仓库拉下来,用 SHA256 算每个文档文件的哈希值,和上次记录的版本对比,找出新增的、内容改变了的文档。这些文档被打包成一个「批次」,带着时间戳,等待翻译。
翻译这块,我用的是宝玉大佬的 baoyu-translate 的 refined 模式。这是一个六步的翻译工作流,第一步分析原文,提炼关键词和专有名词;第二步组装面向翻译任务的提示词;第三步出初稿;第四步自我审查,检查有没有翻错或者翻偏的地方;第五步修订;第六步润色,让最终输出的中文读起来像是人写的,不是翻译腔。
这六步走完,每篇文档都会有对应的中间文件,哪一步出了问题,翻回去看就清楚。
翻完之后不是直接发。我加了一个人工审核的环节,必须我过目了、觉得没问题,才跑命令把这个批次发布出去。这个设计是在翻了前几篇之后加上的,原因很现实,AI 翻译的专有名词处理有时候不稳定,「checkpoint」有时候会被翻成「检查点」,有时候翻成「断点存档」,语境对但统一性差,如果不过一遍就直接发,积累下来的体验会很差。
飞书那块,是整个项目里最麻烦的部分。
我把翻译好的文档发布到两个地方,一个是飞书知识库,一个是用 Docusaurus 搭的独立网站。飞书这边走的是两层架构,有一个私有的「审核库」,翻译完的稿子先进去,我在飞书里看完没问题,再从私有库推送到公开的用户访问库。
但飞书的 Markdown 渲染,坑多。
Hermes 官方文档用的是 Docusaurus,里面有很多这样的提示框语法,三个冒号加 tip,:::tip,飞书完全不认识,渲染出来是乱的。GitHub 风格的提示框语法,飞书也不行。HTML 标签也不支持。
所以每篇文档进飞书之前,要先经过一次格式适配,把这些语法转换成飞书能正确渲染的格式,最终用带 emoji 的引用块格式来替代。
还有一个更细的坑。飞书的 wiki 页面一旦创建就不能删除,只能归档或者替换内容。上游如果删了某篇文档,我这边没法跟着删,只能把那个页面的内容替换成一段「此页面已下线」的提示。
听起来简单,但写代码的时候这些边界情况要一个一个对上,不写到这里你不会知道还有这层逻辑要处理。
还有代码块的处理。飞书的 lark-cli 工具在把 Markdown 上传成飞书块的时候,每个代码块末尾会多一个空行,影响阅读,这个得在上传完之后通过 Block API 单独去修复。就是一个很琐碎的收尾动作,但不做,代码块里全是莫名其妙的空白。
这些细节,不真的做一遍,真的不知道。
Docusaurus 那边的同步,是另一条独立的链路。
翻译好的文档会通过一个脚本同步进 Docusaurus 的 i18n 目录,然后跑构建,发布到独立域名。这条链路的好处是,网站支持全文搜索,移动端阅读体验比飞书好,适合不用飞书的用户。
主题我做了还原,参照 Hermes Agent 官方文档的金色暗黑主题,尽量接近官方的视觉风格,让中文用户看到的和英文用户看到的是同一个「感觉」的文档站,而不是一个完全陌生的界面。
做完这个项目,我反复想一件事。
Hermes Agent 的文档质量,是真的高。Nous Research 的工程师在文档上花了不少心思,示例清晰,概念解释不绕弯子,新手能看懂,有经验的人也不会觉得废话多。
但这套文档对中文读者来说,那道语言的门槛是实实在在的。
我把这个现象叫做「信息折叠」。我们都在同一个互联网上,但我们能看到的那一层,不完全相同。英文社区里今天在讨论的东西,中文世界可能要等几个月才会有人写成教程,还不一定是全面的版本。等你看到某篇标题叫「XXX真的太强了」的文章,说不定那个东西的下一代版本已经出来了。
不是因为中国工程师学得慢,是因为信息在传递的过程里,有损耗,有延迟,有变形。
Hermes Agent 支持 Kimi、GLM、MiniMax,它从设计上就考虑到了中文用户。但如果入门文档对中文用户不友好,支持再多的国内模型也还是隔着一堵墙。
做这个项目,我想做的就是把这堵墙,磨薄一点点。不是什么了不起的事情,只是我能做到、也愿意做的一件小事。
哪怕只是让那个下班后打开文档然后默默关掉页面的人,下次打开的时候,看到的是中文。
目前的状态,102 篇文档全部翻译完成,两个访问渠道都已上线,持续维护中。 关注之后回复【hermes-agent】就可以看到全部的102篇内容啦!
这是一个小小的测试,看看有多少人真的需要这个东西。如果反馈不错,后面我还会做更多这类「把英文世界里值得关注的工具翻译过来」的事情。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~
谢谢你看我的文章,我们,下次再见。