OpenAI 用 Harness Engineering 让 Codex 写出了百万行零人工代码;Nous Research 的 Hermes Agent 凭借自进化学习环路两个月拿下 6.4 万 Star;而 OpenClaw 在爆火的同时也暴露了 82 个安全漏洞。当 Agent 从「代码助手」进化为「全权执行者」,一个核心问题浮出水面——你的 Agent 应该跑在谁的机器上? 本文梳理 2026 年 Agent 技术三大前沿趋势,并介绍一种正在成型的新范式:预装 OpenClaw 的本地智能终端。
01 | 2026 年 Agent 领域的三股暗流
如果你在过去三个月关注过 GitHub Trending,你一定注意到了三件事情的同时发生:
暗流一:Harness Engineering 的兴起——"模型不是难题,工程才是"
2026 年 2 月,OpenAI 发表了一篇影响深远的工程博文《Harness Engineering》。他们披露 Codex 团队构建了一个超过 100 万行代码的生产应用,其中没有一行是人类手写的。工程师的工作不再是写代码,而是设计让 AI 可靠地写代码的约束环境、反馈回路和执行护栏——这套系统被称为 Harness(缰绳系统)。
Martin Fowler 随后在 Thoughtworks 的技术雷达中将 Harness Engineering 定义为 2026 年最值得关注的工程实践之一:
Agent = Model + Harness。模型负责推理,Harness 负责让推理可靠。
Red Hat 的工程团队也分享了他们的实践经验:结构化的上下文输入比自由格式的需求描述,能让 Agent 输出的一致性提升数个量级。Anthropic 则设计了一套三 Agent 协同 Harness(规划 Agent + 生成 Agent + 评估 Agent),让 AI 在多小时的自主编码会话中保持连贯性。
这对开发者意味着什么? Agent 的能力上限不再取决于你用了哪个模型,而取决于你给它构建了怎样的运行环境。而环境的核心要素——工具链、记忆系统、权限边界、安全护栏——天然适合在本地可控环境中实现。
暗流二:Hermes Agent 的爆发——"Agent 应该越用越聪明"
2026 年 2 月 25 日,Nous Research 发布了 Hermes Agent v0.1.0。两个月后的 4 月 8 日,它已经迭代到 v0.8.0,合并了 209 个 PR,GitHub Star 突破 8.5 万。
Hermes Agent 的核心卖点不是又一个 Agent 框架,而是内置学习环路(Learning Loop) :
- 持久记忆:跨会话保持对用户项目、偏好和上下文的认知,基于 SQLite + FTS5 全文检索
- 自动技能创建:当 Hermes 解决了一个复杂问题,它会自动将解法写成可复用的 Skill 文档
- 自优化:v0.8.0 最亮眼的 PR 之一是"自动化行为基准测试驱动的 GPT/Codex 工具调用优化"——Agent 自己发现自己的盲区,然后自己修补
Reddit、X 上到处都是"我从 OpenClaw 迁移到 Hermes"的帖子。Hermes 甚至内置了 hermes claw migrate 命令来平滑迁移 OpenClaw 的配置、记忆、技能和密钥。
值得注意的是,Hermes Agent 的设计哲学与 Harness Engineering 高度共鸣——它强调的不是模型能力,而是运行环境的持久性、可学习性和可控性。一个 $5/月的 VPS 就能跑,MIT 协议完全开源,支持 200+ 模型。
暗流三:OpenClaw 的安全危机——"高权限 Agent 的信任成本"
OpenClaw 在 2026 年初创下了 GitHub 增长纪录(Star 突破 31.5 万),但安全问题同样触目惊心:
| CVE 编号 | CVSS 评分 | 漏洞类型 | 影响 |
|---|---|---|---|
| CVE-2026-25253 | 8.8 | 跨站 WebSocket 劫持 | 一键点击 RCE,已在野利用 |
| CVE-2026-32922 | 9.9 | 权限提升 | 低权限 Token 可获取完整管理权限 |
| CVE-2026-32918 | 9.2 | 沙箱逃逸 | 容器化部署可被突破 |
| CVE-2026-33579 | 8.6 | 设备配对授权缺陷 | 6 周内第 6 个同类漏洞 |
安全内参数据显示:截至 2026 年 3 月,CNNVD 共收录 OpenClaw 漏洞 82 个,其中超危 12 个、高危 21 个。SecurityScorecard 探测到超过 46.9 万个公网暴露实例,其中 27.2% 存在已知高危漏洞。ClawHub 技能市场曾有约 20% 的插件被标记为恶意或可疑。
Cisco 的安全研究员将 OpenClaw 称为"security nightmare"——在分析的 31,000 个 Agent Skills 中,26% 至少包含一个安全漏洞。
问题的根源不在 OpenClaw 本身,而在于 Agent 的本质:AI Agent 不是聊天机器人,它拥有推理能力、工具调用能力和自动执行能力。一旦某一步被攻破,攻击者获得的不是一句错误回复,而是一条可以持续扩大的行动链。
02 | 三股暗流的交汇点:本地智能
把这三件事放在一起看,一条清晰的逻辑链条浮现出来:
- Harness Engineering 证明了:Agent 的可靠性取决于运行环境的工程质量,而不仅仅是模型能力
- Hermes Agent 证明了:持久记忆 + 自进化 + 本地部署 + 用户可控,是 Agent 的正确进化方向
- OpenClaw 安全事件证明了:高权限 Agent 在缺乏产品化安全防护的情况下,裸跑是危险的
三条线索指向同一个结论:Agent 需要一个安全、持久、用户可控的本地运行环境。
但这个结论对普通用户(甚至大部分开发者)来说,执行起来有巨大的门槛:
- 你需要一台合适的硬件(ARM/x86 + NPU 算力 + 足够存储)
- 你需要配置操作系统、Docker、网络、安全策略
- 你需要部署 OpenClaw 或 Hermes 并持续跟进安全补丁
- 你需要管理技能插件的供应链安全
有没有一种方案,把上面这些全部产品化?
03 | 端脑科技的解法:预装 OpenClaw 的本地智能终端
端脑科技(Cephalon)在 2026 年 3 月的发布会上给出了一个完整的产品矩阵:
硬件层
脑花 AI NPC——本地智能中枢
- 四核 Cortex-A76 处理器 + 800MHz VideoCore V1 GPU
- 支持 126 TOPS AI 算力(NPU)
- 4GB LPDDR4X 内存,microSD 扩展存储
- micro HDMI 输出(支持 4K60)
- 千兆以太网 + 双频 Wi-Fi + 蓝牙 5.0
- 预装 OpenClaw + Lucy AI OS
龙虾派——入门级本地智能小主机
- ¥1499 起,预装 OpenClaw
- 开箱即用,免安装、免配置
- 核心卖点:零门槛体验本地 AI Agent
软件层
Lucy AI OS——不是传统 OS,而是智能体引擎
- 管理 OpenClaw 技能的调度、运行和安全隔离
- 类比:如果 OpenClaw 是应用,Lucy AI OS 就是它的 Harness
- 与传统 OS(iOS/Windows/HarmonyOS)的区别在于,它的核心调度对象是 Agent 技能而非传统应用
Lucy APP——手机端控制入口
- 手机下达任务 → 设备本地执行 → 结果回传/归档
- 实现了「随身采、本地算、安全存」的闭环
Skill Map——安全审核的技能生态
- 所有上架技能经过安全审核
- 对标 ClawHub,但增加了供应链安全层
- 开发者可以提交技能并获得分发与变现
安全层
这是端脑产品矩阵中我认为最值得技术社区关注的部分:
- 端侧优先数据处理:核心计算在本地完成,敏感数据不出设备
- 技能审核机制:端脑云升级为 OpenClaw 安全技能库,所有技能通过安全审核后才能上架
- ZKP(零知识证明)协议:在不暴露原始数据的前提下完成身份验证和数据交互
从 Harness Engineering 的视角来看,端脑实际上做了一件事:把 Agent 的 Harness 从开发者自行搭建,变成了出厂预装。 这恰好回应了 OpenAI 在博文中反复强调的观点——Agent 能力的天花板,取决于它运行环境的工程质量。
04 | 技术对比:端脑 vs 自建 vs 纯云端
| 维度 | 端脑(脑花/龙虾派) | 自建 OpenClaw/Hermes | 纯云端 AI |
|---|---|---|---|
| 部署门槛 | 开箱即用 | 高(需要 Linux/Docker/网络知识) | 零(注册即用) |
| 数据位置 | 本地设备 | 本地设备 | 第三方服务器 |
| 安全防护 | 产品化(技能审核 + ZKP + 沙箱) | 自行配置(需持续跟进 CVE 补丁) | 依赖平台 |
| 持久记忆 | 原生支持(Lucy AI OS) | 需自行配置 | 有限(多数对话无法持久化) |
| 算力独占 | 是 | 是 | 否(共享资源池) |
| 生态丰富度 | Skill Map(建设中) | ClawHub / agentskills.io | 平台内建 |
| 适合人群 | 普通用户 / 小团队 | 有运维能力的开发者 | 轻度使用者 |
| 成本 | 一次购买(¥999 起) | 硬件 + 运维时间 | 持续订阅 |
05 | 对开发者的启示
如果你是一个关注 Agent 生态的开发者,端脑的产品矩阵提供了几个值得思考的方向:
-
Skill 开发者的新分发渠道
端脑的 Skill Map 本质上是一个有安全审核的 Agent 技能市场。如果你正在为 OpenClaw 或 Hermes 开发技能,多一个分发渠道意味着多一个变现可能。而且由于 Skill Map 内置了审核机制,通过审核的技能天然具备"安全可信"的标签——这在 ClawHub 恶意插件事件之后,对用户的吸引力是显而易见的。
-
Harness Engineering 的硬件化实践
端脑做的事情,可以理解为将 Harness Engineering 的最佳实践固化到硬件产品中。如果你认同"Agent = Model + Harness"的公式,那么端脑提供的就是一个出厂级 Harness——预配置的安全策略、预集成的技能运行时、预设的权限边界。
这不是要取代你自建 Agent 环境的自由度,而是为那些没有运维能力但有 Agent 需求的用户提供了一个可靠的起点。
-
云边端协同的架构探索
端脑的技术架构不是纯本地——它设计了一套「云上有平台,桌上有终端,手机上有入口」的协同体系:
- 简单任务:本地处理(转写、归档、检索、自动化)
- 复杂推理:可选择走云端模型
- 敏感数据:永远不离开本地
这种架构思路与 Hermes Agent 强调的"自托管 + 多模型支持"哲学是一致的,但端脑把它做成了对非技术用户友好的产品形态。
结语
2026 年的 AI Agent 赛道正在经历一次深刻的分化:
- 一侧是云端——模型更大、能力更强、生态更丰富,但数据控制权在平台手里
- 一侧是本地——算力有限、生态尚早,但数据主权在用户手里
Harness Engineering 告诉我们,Agent 的可靠性不在于模型,而在于运行环境的工程质量。Hermes Agent 告诉我们,Agent 的终极形态是"越用越聪明的长期伴侣"。OpenClaw 的安全事件告诉我们,高权限 Agent 不能裸奔。
端脑科技正在尝试的,是在这三者之间找到一个交汇点——把经过安全加固的 Agent 运行环境,做成普通人买得起、用得上的硬件产品。
这不是云端 vs 本地的对立,而是给用户多了一个选择:
你的 Agent,可以跑在你自己的桌上。
📎 相关资源
- 端脑科技官网:cephalon.cloud
- OpenClaw GitHub:github.com/openclaw/op…
- Hermes Agent GitHub:github.com/NousResearc…
- OpenAI Harness Engineering 博文:openai.com/index/harne…
- Martin Fowler Harness Engineering 文章:martinfowler.com/articles/ha…
- OpenClaw 安全漏洞分析(安全内参):secrss.com/articles/88…