OpenClaw 是面向本地优先、模型无关、可执行任务的 AI Agent 操作系统,核心采用Gateway 中心化分层架构,将通信、调度、执行、记忆与扩展能力解耦,实现跨平台、可持久化、安全可控的智能体运行环境。整体架构可分为网关层、智能体运行时、技能系统、记忆体系、节点与渠道适配、安全沙箱六大核心部分,设计哲学强调“本地优先、沙箱执行、模型中立”。
一、Gateway 网关层(控制平面)
Gateway 是系统唯一核心枢纽,本质是本地 WebSocket 服务(默认端口18789),承担消息路由、会话管理、权限控制与流量调度,遵循“单网关、本地优先”原则。
• 统一接入:聚合 WhatsApp、Telegram、Slack、Web UI、CLI、macOS 客户端等20+消息渠道,将异构协议标准化为内部事件流。
• 会话调度:以Lane Queue(任务通道)为核心,每个会话独占串行队列,默认串行、显式并行,彻底解决异步并发竞态问题,保障对话连贯性。
• 安全隔离:强制握手认证、设备配对审批、本地连接自动信任、非本地连接签名校验,默认绑定127.0.0.1,最小化暴露面。
二、Agent Runtime 智能体运行时(核心大脑)
Agent Runtime 是智能体的执行引擎,运行端到端 AI 循环,串联上下文组装、模型调用、工具执行与状态持久化。
• 模型中立:支持50+大模型(本地/云端),包括通义千问、Claude、GPT 系列等,通过统一接口封装,无缝切换模型而不改动业务逻辑。
• 上下文引擎:从会话历史、分层记忆中动态组装上下文,控制 Token 消耗,平衡对话长度与响应速度。
• 工具调用闭环:解析模型输出的工具指令,调度技能系统执行浏览器自动化、文件操作、定时任务等,结果回传模型形成思考-行动循环。
三、Skills 技能系统(能力扩展层)
技能系统是 OpenClaw 的“手脚”,采用插件化、可插拔设计,无需修改核心代码即可扩展能力。
• 技能分类:内置浏览器控制、文件管理、系统命令、邮件处理、数据解析等基础技能;支持自定义开发,通过 JSON 声明接口与参数。
• 沙箱执行:所有技能调用在独立沙箱中运行,命令白名单+三级审批(allowOnce/always/deny),防止恶意操作与权限滥用。
• 动态注册:技能启动时自动注册到 Gateway,模型可感知可用能力,按需调用,实现“能力随需扩展”。
四、Memory 分层记忆体系(持久化核心)
区别于传统 AI 仅依赖上下文窗口,OpenClaw 采用三级本地文件记忆架构,实现跨会话持久化与个性化。
• L1 工作记忆:存储于模型上下文窗口,含实时对话历史与系统提示词,生命周期为单个会话,容量受 Token 限制。
• L2 短期记忆:按日归档 Markdown 文件,记录会话摘要与关键信息,默认保留30天,支持检索回溯。
• L3 长期记忆:持久化用户画像、偏好设置、事实库与技能配置(SOUL.md/TOOLS.md),永久存储,Agent 初始化时注入,实现“越用越懂用户”。
五、Nodes 节点与渠道适配(分布式扩展)
Nodes 是跨终端执行节点,支持 macOS/iOS/Android/无头设备,通过 WebSocket 连接 Gateway,声明 role:node 接入集群。
• 分布式执行:复杂任务可分发到多个节点并行处理,Gateway 统一调度,突破单设备资源限制。
• 渠道适配器:将外部平台协议转换为 Gateway 内部事件,屏蔽异构差异,新增渠道只需开发对应适配器。
六、核心设计优势
-
本地优先+安全可控:数据本地存储、计算本地执行,沙箱+权限审批,避免隐私泄露。
-
模块化+高扩展:Gateway、Agent、Skills、Memory 解耦,支持模型、技能、渠道无缝扩展。
-
持久化+个性化:分层记忆实现跨会话记忆,长期沉淀用户偏好,提供连贯智能服务。
-
简洁高效:基于 TypeScript 开发,轻量无依赖,单进程部署,易安装易运维。
总结
OpenClaw 架构以 Gateway 为中枢、Agent 为核心、Skills 为能力、Memory 为持久化、Nodes 为扩展,构建了一个本地优先、安全可控、高度可扩展的 AI Agent 操作系统,让大模型从“对话工具”升级为“可执行复杂任务的智能助手”。