MimiClaw: 仅5美元的OpenClaw私有化搭建助手

47 阅读5分钟

添加图片注释,不超过 140 字(可选)

Star History Chart

添加图片注释,不超过 140 字(可选)

TD;LR

去年年底,OpenClaw 和 Nanobot 这两个项目在开发者社区引起了不小的讨论。OpenClaw 提出了"Any OS, Any Platform"的跨平台 AI 助理概念,Nanobot 则是一个轻量化的 Python 实现(号称"Ultra-Lightweight Clawdbot")。这两个项目的共同点是:它们都在探索如何让 AI 助理摆脱对大型云端基础设施的依赖,变得更轻量、更可控

但看完它们的实现后,我脑子里冒出了一个更激进的想法:既然都要做轻量化了,为什么不干脆把它做到嵌入式芯片上? OpenClaw 和 Nanobot 虽然比传统的 LangChain 方案轻很多,但仍然需要 Python 运行时、需要一台能跑 Linux 的设备(树莓派/NUC/服务器),部署和维护的门槛依然存在。

我当时就在想:如果能把 AI Agent 压缩到一块 ESP32 芯片上,做成一个真正"插电即用"的小设备,像路由器那样放在家里一直开着,完全不需要操作系统、不需要运行时、不需要任何运维,该有多好。而且从技术上看,这件事是完全可行的——现在的嵌入式芯片算力已经足够跑一个完整的 Agent 循环了(ESP32-S3 有双核 240MHz + 8MB PSRAM),LLM 推理可以走 API(Claude/OpenAI),本地只需要负责对话管理、工具调用、记忆存储,这些用纯 C 和 FreeRTOS 完全能搞定。

于是,参考 OpenClaw 和 Nanobot 的架构思路,用纯 C 和 FreeRTOS 在 ESP32-S3 上从头实现了一个完整的 AI Agent 固件。它支持 ReAct 工具调用、本地持久化记忆、Telegram/WebSocket/飞书多通道对话、定时任务、子 Agent 委派等能力,功耗只有 0.5W,硬件成本不到 30 块钱。这就是MimiClaw的由来——把"AI 助理"这件事做到嵌入式固件级别,让它真正变成一个你可以随身携带的小设备。

MimiClaw Star History

这个项目能做什么

MimiClaw 核心架构图

在设计功能的时候,刻意避开了"做一个玩具 Demo"的思路,而是按照"长期可用的个人助理"来规划能力边界。目前 MimiClaw 支持以下几个核心功能:

多轮对话与上下文记忆:基于 Anthropic Claude API 实现完整的多轮对话能力,每次请求前会自动加载你的人格设定(SOUL.md)、用户档案(USER.md)、长期记忆(MEMORY.md)以及最近的聊天历史,确保它能记住你们之前聊过什么,不会每次都像第一次见面一样重新自我介绍。

ReAct 工具调用:MimiClaw 支持 Anthropic 原生的 tool use 协议,可以在对话中主动调用工具来完成任务。比如你问"今天深圳天气怎样",它会自动调用 web_search 工具去 Brave Search 查询实时信息,然后把结果整合到回复里;如果你问"现在几点了",它会调用 get_current_time 去 NTP 服务器拿时间并同步系统时钟。这个循环可以最多迭代 10 次,直到把任务完成为止,完全就是一个标准的 ReAct Agent。

本地持久化记忆:所有的记忆都存成纯文本文件(Markdown 和 JSONL 格式),你可以直接读取和编辑。SOUL.md 定义了 AI 的人格和说话风格,USER.md 记录了你的个人信息和偏好,MEMORY.md 用来存放长期有效的事实性记忆,每天的对话还会自动生成一份 YYYY-MM-DD.md 日记。这种设计的好处在于,你随时可以用串口 CLI 或者直接读 Flash 文件系统来查看和修改记忆内容,完全透明可控。

多通道接入:支持三种输入方式——Telegram Bot(长轮询模式)、局域网 WebSocket 服务器(端口 18789)、以及 USB 串口 CLI。这意味着你既可以在外面通过 Telegram 远程对话,也可以在家里用 WebSocket 客户端直连,甚至插上 USB 线直接通过串口调试和配置。

运行时配置与 OTA 升级:所有的关键配置(WiFi、Telegram Token、API Key、代理设置等)都可以通过串口 CLI 在运行时修改并持久化到 NVS Flash,改完立即生效,完全不需要重新编译固件。固件升级也支持 OTA(Over-The-Air),你可以通过 WiFi 远程推送新版本,整个过程不需要拔板子接电脑。

写在最后

MimiClaw 想探索的是另一条路:把 AI 能力"下沉"到边缘设备,让它变成一个你可以真正拥有和掌控的"物理实体"。它不需要联网登录(虽然需要联网调 API,但这是可以被本阅付费(硬件成本一次性),不需要持续运维(插电即用),不需要担心数据泄露(所有记忆都在你的 Flash 里)。这种"拥有感"和"可控感",是云端服务永远给不了的。

如果你对感兴趣,欢迎去 GitHub 上 star 一下,或者加入 Discord 社区一起讨论。如果你有什么想法、建议、或者想贡献代码,随时欢迎提 Issue。

GitHub 仓库:github.com/memovai/mim…