2026年3月3日,OpenClaw在GitHub上的总Star数突破25万,超越React,成为GitHub史上增长最快的开源项目。这只“龙虾”凭借60天的爆发式增长,将“24小时数字员工”的叙事带进了每个AI从业者的视野。
不到三个月后,风向急转直下。2026年4月,OpenClaw访问量腰斩至1420万,腾讯旗下QClaw暴跌99.19%。一篇题为《“全民养虾”50天:一场AI套利狂欢与它的骤然终结》的文章,为这场短暂而疯狂的叙事画上了句号。
“龙虾”到底怎么了?退潮之后我们看见了什么?Hermes Agent接棒“养马”的逻辑是什么?大厂腾讯在这个牌桌上又扮演了什么角色?
一、OpenClaw的50天辉煌与骤然退潮
1.1 一场“套利”引爆的增长神话
2026年初,OpenClaw凭借一个简单却精妙的设计引爆了AI圈:它通过模拟Claude客户端请求,让用户以每月200美元的固定订阅费,换取价值数千甚至上万美元的API调用。行业分析师估算,Anthropic每月为每位OpenClaw重度用户补贴数百美元。
这本质是一场“钻空子”的权宜之计——有了近乎免费的算力作为“燃料”,才激发了OpenClaw病毒式传播的开端。
截至3月15日,OpenClaw当月累计Token调用量达10.4T,成为全球Token调用量最高的AI应用。3月3日,其GitHub星标超越React,用不到60天完成了后者十年的积累。微信指数一度飙升至1.65亿,腾讯等大厂也迅速跟进,推出QClaw等产品。
1.2 四个“耳光”让狂热戛然而止
但巅峰来得太快,退潮也来得出人意料。OpenClaw的骤然退潮,是四重打击叠加的结果:
第一重:Anthropic“拉电闸”。 2026年4月,Anthropic突然宣布订阅服务不再支持OpenClaw,只留给用户一天缓冲期。对于那些依赖套利模式搭建工作流的用户而言,这无异于在派对高潮时被突然拉下电闸。
第二重:使用体验“翻车”。 大量用户发现,OpenClaw在复杂多步骤任务中不稳定、易崩溃,不同环境下的可靠性也参差不齐。对于那些寄希望于“24小时数字员工”的创业者而言,龙虾不仅没能成为数字员工,反而成了需要日夜“供着”的“数字祖宗”。
第三重:实操门槛过高。 OpenClaw并非开箱即用,部署、API调用、权限配置等操作对普通用户极不友好。其最火的几周里,国内甚至出现付费代安装的服务,供不应求。需要付费找人帮忙安装,本身就说明它距离真正的大众化产品还很远。
第四重:安全风险暴露。 OpenClaw拥有远超普通AI助手的系统权限——它能打开文件夹、发邮件、执行命令,权限之大远超用户的认知。奇安信3月发布的首份国内《OpenClaw生态威胁分析报告》进一步加剧了用户对数据安全和隐私风险的担忧。
叠加4月核心架构调整导致大面积用户体验中断的“自残式”打击,这只“龙虾”彻底凉了。更具戏剧性的是,就在Anthropic“踢走”龙虾的同时,OpenAI的Sam Altman却宣布ChatGPT用户可以登录OpenClaw——“happy lobstering”。一方封杀、一方接入,将AI智能体产业中的利益博弈展露无遗。
二、Hermes Agent的逆袭:从“龙虾退潮”到“爱马仕上位”
2.1 数据说话:它凭什么能接棒?
OpenClaw迅速跌落,但AI Agent的热潮并未退散,而是进入了第二幕。
2026年5月9日,Hermes Agent以单日2710亿Token消耗量反超OpenClaw,迅速成为新宠。5月12日,OpenRouter数据显示,Hermes Agent日Token调用量高达2910亿,最近一周调用量超1.75万亿,稳居全球调用量榜首。截至5月12日,米哈游旗下的MiMo模型已累计为Hermes Agent送出近80万亿Token调用量。
在GitHub上,Hermes Agent星标突破14万。5月16日发布的v0.14版本更新了808次提交、合并了633个PR,修改了1,393个文件,代码新增超过16万行,社区贡献者达215人。这些数字背后,是Hermes Agent从“开源玩具”迈向“生产级工具”的坚实步伐。
2.2 它到底厉害在哪?
在OpenClaw暴露的三大痛点——记忆不可持续、无法自我迭代、安全边界模糊——面前,Hermes Agent给出的答案是一条贯穿性的“自进化”架构:
第一,三层记忆架构,真正解决“转头就忘”。 Hermes Agent不是被动记录对话历史,而是通过FTS5检索技术主动“策划记忆”——在每次互动后判断哪些信息值得存入长期记忆,而不是简单存储全部原始数据。新会话开始时,它能自动加载相关历史记忆,实现真正的跨会话连贯体验。
第二,技能自主创建与迭代,越用越“懂你”。 Hermes Agent内置了“学习闭环”——它能把一次成功完成复杂任务的经验,自主提炼成一个可复用的“程序化技能”,并在后续使用中持续优化和改进。
第三,海量生态集成,将“可用性”拉到极致。 不同于OpenClaw对Claude的单一依赖,Hermes Agent原生兼容包括OpenAI、Anthropic、Google Gemini、MiniMax等在内的多种大语言模型提供商,并支持通过Telegram、Discord、Slack、WhatsApp等消息平台访问。2026年4月15日起,Hermes Agent甚至实现了原生微信个人号接入——扫码即可链接,不需要公网IP。
第四,NVIDIA与xAI战略加持,算力生态进一步深化。 2026年5月,NVIDIA宣布针对RTX PC和DGX Spark工作站优化Hermes Agent的本地运行性能,使其支持24/7全天候本地值守。同月,xAI宣布Grok订阅用户可直接在Hermes Agent中调用Grok 4.3模型,支持100万Token的超长上下文窗口。
2.3 隐忧:CVE-2026-9350安全漏洞危机
不过,Hermes Agent并非完美无缺。2026年5月,国家信息安全漏洞库(VulDB)披露了编号为CVE-2026-9350的安全漏洞,影响Hermes Agent 2026.4.16及更早版本。该漏洞位于tools/approval.py中的check_all_command_guards函数,属于严重的权限绕过漏洞,允许攻击者远程绕过命令执行权限验证。
更令人担忧的是,供应商(Nous Research)被提前通知了这一安全漏洞,但未给出任何回应,也没有提供修复措施。攻击利用代码已被公开,这意味着大量未及时升级的用户面临着被远程攻击、数据泄露甚至系统被入侵的风险。
对于任何承诺“24小时在线值守”的AI智能体产品而言,这个漏洞无疑是当头棒喝。它提醒整个行业:AI智能体的“自进化”再强,若安全防线一触即溃,一切能力都是空中楼阁。
三、Harness:AI智能体从“拼模型”到“拼系统”的关键转折
3.1 “龙虾”翻车戳破幻觉:AI Agent的内核到底是什么?
OpenClaw的退潮,远比表面的“访问量腰斩”深刻得多。它揭示了一个全行业的反思:AI Agent的性能,真的只是由背后的“大脑”(大语言模型)决定的吗?
答案是否定的。2026年5月,伯克利AI实验室发表了题为《From Model Scaling to System Scaling: Scaling the Harness in Agentic AI》的论文,明确提出了一个核心论断:Agent性能并非仅由模型决定,而是由模型与执行层(Harness)共同组成的一个系统。论文深入剖析了Harness由上下文构造层、记忆层、工具路由层、编排层和验证治理层等模块协同组成的架构。
而在《Stop Comparing LLM Agents Without Disclosing the Harness》一文中,研究者更进一步指出:在当今头部模型能力趋近的情况下,Harness配置对Agent性能的方差影响,甚至可能超过更换底层模型本身。这篇论文提出的“约束锚定命题”直击要害——不披露Harness配置,长周期任务的榜单对比就是不完整的、可能误导的。
3.2 当Harness从“基础设施”走向“竞争核心”
在此认知转变下,Harness从一个“暗箱”中的配角,变成了行业最核心的竞争焦点。
一篇关于“AI Harness Engineering”的系统性研究将Harness拆解为11个核心职责:任务规范、上下文选择、工具访问、项目记忆、任务状态、可观测性、故障归因、验证、权限、熵审计和干预记录。而另一项前沿研究提出了“Agentic Harness Engineering”闭环——通过三个“可观测性支柱”(组件可观测性、经验可观测性、决策可观测性),让Harness编辑变成一个可以被验证、被优化的过程。
值得注意的是,Harness并非只有“安全控制”这一项功能。硅谷CreaoAI公司的实践为Harness的价值提供了一个极具说服力的注脚:在其Harness Agent系统驱动下,99%的代码由AI完成,每天平均3到8次生产部署,过去六周的工程流程,现在一天就能跑完。
这些数字催生了一个新的思考:Harness不是“捆绑AI手脚”的枷锁,而是让AI从“不可靠的实习生”转变为“可信任的数字同事”的基石。它是将AI的能力“安全地”转化为生产力的核心工程。
对于这一演进逻辑,有一种巧妙的比喻:如果把OpenClaw看作“AI动手干活”的第一次探索,Harness就是“给AI野马套上缰绳”的系统方法论,而Hermes Agent则是“出厂自带缰绳”的新物种。 前两者开创了局面,后者则将“缰绳”内化为系统的组成部分,实现了从“手工驯化”到“自动驾驭”的跨越。
四、腾讯马维斯:大厂入场后的格局之变
4.1 告别“跟风龙虾”,腾讯亮出真家伙
腾讯的AI智能体之路,起步并不顺利。回顾“龙虾”狂热期间,腾讯也曾跟风推出QClaw——但4月的数据令人震惊:QClaw月度访问量环比暴跌99.19%。
2026年1月腾讯年会上,马化腾罕见地坦承:“我们整个动作其实是慢了。”他评价这个“落后追赶的阶段”时直言,腾讯慢了“9个月到1年”。5月13日腾讯股东大会上,他用更生动的比喻回溯这一年: “原来一年前我们以为上了船,后来发现那个船漏水了,现在感觉站上去了,还坐不下去,还是希望船速能快一点。”
但到了2026年5月20日,腾讯拿出了真正的底牌——Marvis(马维斯),Windows、Mac、安卓三端同步开放下载,无需邀请码。
马维斯的核心定位极其明确:“操作系统层级”的AI助手——不是另一个“龙虾”。
马维斯业务负责人蔡建涛明确表示:“我们是一个贯穿于操作系统层级的AI、个性化的AI助手,而不是一个像AI PPT,或者像类似于做一个‘龙虾’一样的产品。”
腾讯之所以能打出“系统级”这张牌,背后是深厚的技术积累:马维斯借助与微软的战略合作,通过WinML推理框架和MCP on Windows提供的本地设备代理注册表,能够通过自然语言直接操作电脑文件,这是普通应用层AI无法做到的。与英特尔的合作则通过OpenVINO加速技术,使端侧模型推理性能提升20%以上。
4.2 6个“电子牛马”怎么干活?
马维斯的差异化竞争力在于“出厂预装6个Agent组成的AI团队” ——一个主管Agent(PM)负责拆解任务,五个专项Agent分别负责File(文件)、Computer(系统)、App(应用)、Browser(网页)和Search(搜索)。
用户体验是“装上就能用”——不需要搭建复杂的工作流,不需要配置skills,用户只需通过自然语言下达任务。在此基础上,马维斯的生态优势进一步降低了使用门槛。它每天向每位用户提供1000万免费Token额度,大幅降低了普通用户的尝试成本。
在安全性方面,马维斯提供两种运行模式:效率模式端云协同;隐私模式端侧模型本地运行,所有数据解析、图片识别与对话均在本地完成、完全不上云,断网亦可使用。
马维斯还支持跨端可视化操控——用户可以在手机上直接查看电脑桌面、远程输入密码解锁,甚至离线时能切换成云端模式继续使用。
简而言之,腾讯马维斯试图以一种完全不同的姿态入场:不是聊天框,不是OpenClaw那样的套利工具,而是一个**“装上就能用”的操作系统级AI助手**。它的差异化壁垒在于腾讯与操作系统和硬件厂商的长期合作关系带来的系统级授权——这是个人开发者和小型创业公司几乎无法复制的。
五、总结与展望:AI智能体的未来
半年来“龙虾—Hermes—Harness—马维斯”的热潮演进,可以看作AI智能体从“概念验证”走向“系统级产品”的加速缩影。
从行业大盘来看,全球智能体市场正处于爆发前夜。CIDC白皮书数据显示,2025年中国企业级AI智能体市场规模已达212亿元,预计2026年增至449亿元,到2029年有望突破3320亿元。普华永道调研显示,79%的组织已在不同程度采用AI Agent技术。这股浪潮不再只是一场少数极客的狂欢,而是正在变成企业生产力的新引擎。
展望未来,AI智能体正沿着一条清晰的演进路线发展:
从“套利狂欢”到“生态构建”。 OpenClaw的退潮揭示了一个真相:靠“钻空子”套利不可持续。未来的竞争焦点,将是Harness的稳定性、系统的安全性以及应用的深度生态整合。
从“单一Agent”到“Agent团队协同”。 马维斯已经展示出“6个Agent团队”的雏形,而Hermes Agent正从单一助手进化为能在VPS上通过调度器指挥一整套团队工作的“能产生复利的数字员工”。
从“云端对话”到“系统级执行”。 AI助手正从“能聊能写”进化为“能调系统、管设备、控应用”的操作系统级AI。正如马化腾所言,腾讯虽然起步较慢,但正通过大规模投资稳扎稳打——2025年腾讯在AI新产品上投入了180亿元,2026年这一数字至少翻倍。
从“技术驱动”到“信任驱动”。 Hermes Agent的安全漏洞(CVE-2026-9350)和马维斯的隐私模式都说明:没有安全,就没有大规模使用。能否建立“可信任的数字员工”机制,决定了AI智能体能否真正进入企业核心业务流程。
正如《2026:智能体爆发年》一文所言,智能体时代的到来不是平滑的线性增长,而是一个“基础设施快速铺设期”——我们正处于这场范式革命的序章,而非高潮。智能体能否成为下一代人机交互的核心形式,取决于我们能否在接下来的三到五年内,围绕记忆可持续、安全性、成本优化和系统稳定性四个维度,构建一个真正“既可信任又高效”的数字员工生态。
2007年的iPhone不仅重塑了手机,更催生了“移动应用经济”。AI智能体的故事,或许也才刚刚开始。