拆解龙虾🦞,拆解OpenClaw的架构与设计

0 阅读3分钟

我们从技术的角度去拆解一下OpenClaw的架构,主要拆解出来OpenClaw的创新技术或者思想。在ai漫天飞的今天,技术不在是主导,思想确定一切。

OpenClaw 自动干活原理

核心架构定位

以 Gateway 为中心构建统一代理平台,集中管理渠道接入、设备连接、会话状态、消息路由、任务调度等关键能力。部署上通常一台主机运行一个 Gateway,特殊场景支持同机部署多个完全隔离的 Gateway 实例。

冯伟简历内容总结 (1).png

Gateway

冯伟简历内容总结.png

所有请求的第一站,类似智能门禁。负责身份验证、连接管理、多用户隔离和请求路由,确保从网页、手机或聊天软件发出的指令准确送达系统内部正确模块。技术上是 API 网关和会话管理系统,没有它助理无法识别指令来源。

Agent

这是OpenClaw 的大脑,有专门人设。负责理解用户意图、制定分步计划、判断调用哪些工具或技能。技术上是 LLM + 推理循环系统,通过观察、思考、计划、执行和反思不断自我校正,能根据任务结果调整策略,是处理复杂任务的核心。 这是多agent框架中react架构的典型设计,每执行一步都需要决策,感知,行动,反馈。每一步都是实时响应,如果先一步不符合结果预期,下一步都是一个新的步骤策略。但是缺点就是和模型的交互增加,从而增加模型费用。个人认为这也是OpenClaw的缺点,模型的花费可能大于你的收益。

冯伟简历内容总结 (2).png

Skills

助理的工具箱,包含发邮件、写代码、操作浏览器、处理文件、调用 API、生成文档等功能。每个 Skill 是独立模块,遵循标准化接口,可被 Agent 调用。Agent 决定做什么,Skills 决定怎么做,两者缺一不可。

冯伟简历内容总结 (3).png

Channels

负责用户与助理的交流,将网页、WhatsApp、Telegram 等不同通信方式的消息统一转换成系统能理解的格式,保证指令准确送达 Agent,实现换通信方式不影响助理理解指令。

image.png

Nodes

实现跨设备工作的轻量客户端代理,安装在各设备上,通过网络与 Agent 通讯,带有自动重连和心跳机制。让云端大脑能远程操作不同设备(如客厅、卧室、书房的设备),打开文件、修改文档、调用摄像头、获取系统通知和定位信息。

image.png

Memory

记住用户偏好和习惯,分短期和长期。短期保存当前对话上下文,长期存储在 Markdown 文件和向量数据库里,通过语义检索快速找到相关信息,让助理不仅记住信息,还能理解需求,越来越懂用户。

image.png

Heartbeat

助理的主动巡逻机制,是后台守护进程,定时触发 Agent 执行检查任务。即便用户未发指令,也会主动检查邮箱、日历和任务状态,发现异常立即提醒,使助理从被动响应变为主动监控。

image.png

Cron

时间调度系统,根据标准时间表达式执行一次性或周期性任务,如每天叫醒、每周整理总结、每月提醒缴费等。与 Heartbeat 协同,Heartbeat 巡逻发现变化,Cron 精准执行任务,让助理既主动又守时。

image.png

八大能力协同运作

image.png

用户通过 Channel 发出指令,Gateway 确认身份,Agent 思考并打开 Skills 工具箱,让 Nodes 在设备上执行,同时从 Memory 调用用户习惯;用户沉默时,Heartbeat 巡逻,Cron 按计划执行任务。OpenClaw 是会思考、记忆、执行、提醒、跨设备行动的智能数字私人助理。