从零手搓我的钢铁侠管家 J.A.R.V.I.S - 02 周末手搓极简WeClaw

0 阅读8分钟

01 引子

在上一篇文章里面,我们讲了openclaw的部署和体验,具体文章链接:从零手搓我的钢铁侠管家 J.A.R.V.I.S - 01 体验openclaw

我们发现了几个问题:

  1. 安全问题:openclaw作为AI助理,我们会给它一些权限账号或者和它交流一些隐私数据,如果因安全问题泄露,那么就会非常的麻烦,下图是我搜的一个新闻片段:

CleanShot 2026-03-07 at 12.51.07@2x.png

  1. 功能繁重:openclaw为了兼容各类大模型、各类channel渠道,写了非常多的这类适配器代码,整体比较臃肿
  2. 部署复杂: 虽然目前云服务器厂商提供一键部署,但是我实体体验下来,部署后存在相关配置工作,比如我要适配企业微信应用,比如我希望暴露端口临时调试什么的,会遇到各种问题,需要花时间进行调试测试,并不是开箱即用

基于我们实际部署体验后的感受,我们决定在周末手搓1个精简版"openclaw",取名叫:WeClaw

目前网上也有相关大佬发布了一些精简版的openclaw,甚至有大佬把openclaw装到了esp32里面,直接让openclaw写单片机代码,非常的厉害

02 产品效果

先直接上效果图:
CleanShot 2026-03-07 at 13.07.21.gif

看效果是不是感觉很cool,和openclaw感觉差不多,而且AI助理反馈消息的速度比openclaw还要快一点(我个人感觉o(^▽^)o)

03 技术思路

接下来我分别从产品经理、架构师角度分别来讲下:产品构思、核心架构

产品构思

1、入口选型
在开讲前,我先说一个我的痛点:不知道大家有没有把微信的文件传输助手当备忘录用过,我日常会微信文件传输助手当备忘录在用,因为它在不同设备都可以同步;可以发图片、文字;入口寻找方便

所以我希望weclaw的入口也能这么方便,这边我选择了微信公众号(测试号)

公众号又分为订阅号和服务号,前者个人可以申请,但是能力比较少,比如不可以主动推送消息给用户;后者服务号能力满足,但是需要企业资质申请(每年还有个300的认证费用)

而微信测试号是用来给开发者调试开发使用的,具备了服务号的能力,适合验证MVP

2、使用场景
网上可以看到这样一个场景:大家跟风部署了openclaw,但是实际使用的时候却发现好像没有场景需要助理去做,反观各路大佬,硬是玩出了花:

  • 比如Token不够用了
  • 比如用openclaw去自动化炒股赚了多少多少钱
  • 比如让openclaw自己全自动化写代码提交
  • 甚至还有1个论坛是由AI创造的,上面不允许人类发帖,只能围观的

所以我们在做之前,需要想好使用场景(可以先有,后续逐步增加):

以下是我想的一些场景,场景这东西我觉得和个人息息相关,本质是善于发现日常生活的痛点,然后思考能否自动化解决,如果可以则让weclaw去做:

  • 比如我可以让它帮记录备忘,再结合AI的能力,它可以快速检索历史备忘,而不是原先翻微信聊天记录
  • 比如我可以把一些看到的好玩的、有用的文章链接发给weclaw,让它去阅读,生成总结
  • 比如打通obsidian笔记,可以将上面的总结笔记直接同步到我的obsidian笔记
  • 比如我工作上的任务是通过滴答清单管理的,当我下班后有一些想法,我也可以发给weclaw,让它直接帮我生成任务到我的滴答清单
  • 比如帮我搜索调研某项技术
  • 等等...

核心架构
在讲完产品构思这块,我这边讲下weclaw的核心架构:
weclaw-architecture.png
上一篇文章我们也讲到openclaw的核心其实就是1个ReAct循环的Agent,我们的weclaw也是,然后搭配了外网的比如接入层、模型提供、skills、状态存储、定时任务等能力,就构建了增强版的Agent,也可以称为AI产品

这边我岔开说下最核心的:ReAct循环的Agent的架构
weclaw-agent-react-architecture.png

当然我也非常好奇cladue code的架构,让AI给我画了1个:
claude-code-architecture.png

可以看到大家其实都基于最核心的ReAct Agent,然后搭配一些能力,变成了不同的AI产品

再说下weclaw的一些设计点:

  1. 配置管理(密钥安全)
    比如我希望weclaw自己对接下github,拉取1个私有仓库,它肯定会问我账号密码,而我只能通过对话的方式传递账号密码(可以上服务器配置,但是这样麻烦且有门槛),必然会涉及密钥安全问题,这边我们做了1个机制,通过/set 命令对话输入,这时候账号密码是不会发给大模型厂商的,而是直接落盘存储了

  2. Skills系统
    这边直接使用了anthropic推出的skills标准,并且参考openclaw,内置了最基本的几个skill,另外对接了openclaw的clawhub,可以安装别人做好的skill

  3. 工具系统
    这边内置了一些基础工具,比如读写文件,比如bash_execute

    目前有一个观点就是bash即一切,意思是不用给AI准备太多的工具,基础的bash命令就可以完成所以的任务,也就是什么都可以让AI手搓

CleanShot 2026-03-07 at 13.47.45@2x.png
4. 记忆系统
如果没有记忆系统,你让weclaw记录的备忘很可能在服务重启后就遗忘了,weclaw参考openclaw设计了基于 SQLite + 向量搜索,AI 可以记住用户的偏好和重要信息

  1. 定时任务
    通过定时任务,AI可以在指定时间触发执行,这是AI助理相关能力的一个支撑

"手搓开发"
介绍完产品构思和关键架构设计,就到了我的“产品经理”魔法时刻:以前如果要自己从零写这么一个包含微信通道对接、状态机流转、大模型接口调用的系统,还要折腾各种数据库持久化,没有一个多星期是搞不定的。

但这次的开发体验完全不同。我没有去一行行敲代码,而是把自己当成一个发号施令的产品经理。 我只负责画出上面的这层架构图,然后直接把要求扔给 AI(比如:“帮我写一个 Node.js 的服务,用 SQLite 做持久化,暴露出两个接口用来接收和验证微信服务器的回调”)。 哪怕中间由于微信服务器复杂的 Token 验证机制报了错,我也只是把报错日志扔给 AI,它反手就给出了修复方案。

在这整个周末里,“写代码”的时间不到 20%,80% 的时间我都在做系统设计和逻辑梳理。这就是给开源做减法的底气所在。

04 极简部署

结合我自己部署openclaw的感受,能够简单部署和配置,最好是开箱即用才是适合用户的,否则能力再强,用户卡在部署环节也是白瞎

另外需要考虑门槛,很多用户并不是IT这行的,需要尽可能的简单

所以这边我会通过1个脚本实现一键部署,效果如图:
CleanShot 2026-03-07 at 14.13.57@2x.png

目前我自己还处于试用阶段,大家可以关注点赞github仓库,有相关问题可以留言,但是受限精力,我会按照适合我自己的路线去迭代开发,也欢迎大家提PR

05 思考

在AI时代,技术平权的趋势越来越明显,以手搓weclaw的过程来说,借助AI大模型,我可以很短时间弄懂openclaw的架构设计,并让AI按照我的想法快速开发出1个精简版,网上也有相关案例,一个完全不会代码的文科生,可以让AI开发出1个可以落地运行的APP

那么在AI时代,我觉得更稀缺的能力反而是产品思维以及执行力:

  • 产品思维:能够善于发现日常的痛点并思考、完成整个问题发现->产品最小化设计->实践验证想法,以及能从用户角度看问题
  • 执行力:我本人属于那种想法多,但是执行力弱的,俗称:思想上的巨人,行动上的矮子,执行力也非常重要,AI时代,快速写demo的工作已经被AI替代了,原先执行可能因为不熟xx技术,就搁置了,但是AI时代这个问题不存在了,所以要多实践,实践反过来指引认知(这也是毛选实践论的核心思想)

06 预告

到目前为止,WeClaw 已经长出了最强大脑,也能在微信里和我们谈笑风生了。

但是,一个只会聊天的管家不是好管家。

真正的 J.A.R.V.I.S 是能够帮你处理现实世界繁杂事物的。所以在下一篇中,我们将打开上帝视角,给 WeClaw 装上“手脚”:打通任务管理软件——滴答清单。

届时我会演示:如何在下班路上,对着微信随口说一句话,AI 管家就能自动理解你的意图,帮你拆解任务,并工工整整地安排进你的日程表里!敬请期待。

07 系列文章

从零手搓我的钢铁侠管家 J.A.R.V.I.S - 01 体验openclaw