我们从技术的角度去拆解一下OpenClaw的架构,主要拆解出来OpenClaw的创新技术或者思想。在ai漫天飞的今天,技术不再是主导,思想决定一切。
OpenClaw 架构设计详解
核心架构定位
以 Gateway 为中心构建统一控制代理,集中管理渠道接入、设备连接、会话状态、消息路由、任务调度等关键能力。部署上通常一台主机运行一个 Gateway,特殊场景支持同机部署多个完全隔离的 Gateway 实例。
六层架构概述
整体架构分为六层,从接入层到扩展与自动化层层层协同,实现从接入到自动化的完整闭环。
接入层
系统入口,负责统一汇聚外部对象,包括三类核心对象:外部消息渠道(如 WhatsApp、Telegram,由 Gateway 内部维护适配器)、控制端客户端(如 CLI、Web 管理界面,通过 WebSocket 接入)、节点设备(如 macOS、iOS、Android,通过 WebSocket 连接并声明能力)。所有对象不直接通信,统一汇聚到 Gateway 进行中转、校验和编排。
Gateway 控制层
系统中枢,相当于平台的总线和总调度台。通过 WebSocket 提供控制平面及 HI、A2UI 等辅助接口,负责连接握手、身份认证、协议校验、消息归一化、事件发布、通道状态维护和系统级控制。所有连接、消息、控制指令均需经过统一调度。
会话与路由层
实现多渠道、多用户场景下的上下文隔离。将不同渠道消息抽象为统一事件,根据会话键、渠道、群组、用户身份和 Agent 绑定规则完成路由。会话系统管理上下文历史、生命周期、重置策略、压缩策略和持久化存储;按会话维度串行处理以减少并发冲突,同一会话任务顺序执行,不同会话由全局调度机制协调。
Agent 运行时
核心引擎,负责理解请求、调用模型、执行任务,嵌入在 Gateway 内部。主链路包括接收输入、装配上下文、读取工作空间文件(如 AGENTS.md、TOOLS.md)、选择模型、触发推理、调用工具、处理工具结果、流式输出、写回会话与记忆。工作空间文件共同决定 Agent 的角色设定、行为边界、工具权限和上下文风格。
能力系统
Agent 能力的核心支撑,内置文件、命令执行、进程、网页、浏览器、会话、记忆、消息、节点等多类工具。节点系统延伸设备侧能力(如相机、屏幕录制、定位、Canvas 交互);记忆系统负责跨会话信息保留和语义检索;多 Agent 机制支持主 Agent 调用子 Agent,用于专业分工、复杂任务拆解和隔离执行。
扩展与自动化层
体现可扩展架构设计,插件系统可扩展新渠道、新工具、新 Hook、新记忆后端及新模型提供者能力。Hook 和 Cron 分别提供事件驱动和时间驱动的自动化能力,适用于通知、同步、巡检和批处理流程,使 OpenClaw 成为可持续外接能力的自动化平台。
架构全景总结
六层架构从接入层到扩展层层层协同,构建以 Gateway 为中心的统一智能代理平台:接入层统一汇聚、控制层统一调度、路由层上下文隔离、Agent Runtime 智能执行、能力系统提供工具支撑、扩展层持续增强能力。六层通过 Gateway 紧密连接,形成完整、灵活、可扩展的智能代理平台架构。