OpenClaw小龙虾0405新版本发布,用做梦解决记忆问题,省token了,也支持图片音乐模型啦!

0 阅读8分钟

这周的AI圈节奏拉满,刚经历两大行业事件,小龙虾就带着重磅更新来了。3月31日Claude Code 51万行源码意外泄漏,4月4日Anthropic直接封杀小龙虾的订阅接入,而就在4月5日,小龙虾推出2026.4.5版本,这也是社区公认的今年至今最大的一次更新。

图片

记忆管理混乱、token消耗太高,一直是小龙虾被社区吐槽最多的两个问题,其中高token消耗更是Anthropic封杀它的核心原因。这次更新,小龙虾直接瞄准这两大痛点下手,官方推文最后用三句话表明态度:Anthropic把我们切了。GPT-5.4变强了。我们往前走了。没有抱怨,只有坚定的前进方向。

小龙虾学会“做梦”,彻底解决记忆混乱难题

养过小龙虾的人,大概率都遇过这种糟心情况:一觉醒来小龙虾突然失忆,聊得久了还会注意力涣散,前面确认的事后面又反复追问,很多人以为是模型不够聪明,其实根源在记忆机制。

小龙虾的记忆原本分三层,看似完整但实际用起来问题百出。

图片

第一层是工作记忆,就是当前的会话历史,能维持本轮对话的连续性,但上下文窗口满了就会被压缩,细节容易丢失,还会在每天凌晨4点默认重置,也能手动开新会话或配置空闲超时重置,可靠性最差;

第二层是短期记忆,存在memory/YYYY-MM-DD.md里,就是当天的对话流水账,由对话压缩前自动刷写、新会话提取关键内容、Agent随时写入三个渠道生成,每次对话会自动加载今明两天的内容,更早的需要搜索召回;

第三层是长期记忆,也就是MEMORY.md,存的是偏好、决策、项目状态这类精炼后的持久信息,私聊会自动加载,但每次启动都会消耗上下文预算。

实际使用中,这套记忆系统完全达不到预期:该自动记进长期记忆的内容啥也没存,存了的信息又会出现矛盾,比如三个月前的周三周会和后来改的周四周会同时存在,小龙虾根本无法判断;

更麻烦的是,MEMORY.md内容越堆越多,没人清理过期信息,最后不仅拖累响应速度,还会让回答质量变差,到最后很多人只能放弃自动记忆,改成手动维护,本该AI帮人记,反倒变成了人帮AI记。

这次2026.4.5版本的重磅功能Dreaming,就是专门解决这个问题的,它补上了记忆系统的最后一环:自动从短期记忆的流水账里提炼精华,还能自动清理过期、矛盾的内容。

这个功能的工作原理和人类的睡眠记忆机制高度相似,白天记一堆流水账,晚上后台自动整理,重要的提炼进长期记忆,没用的直接淘汰。

Dreaming会在每天凌晨3点自动运行,按light轻度扫描、REM回顾关联、deep决策写入三个阶段依次执行,只有deep阶段会真正修改MEMORY.md,前两个阶段只做筛选和准备。

整理时会从频率、相关度、话题多样性、时间新鲜度、跨天重复度、概念丰富度六个维度给信息打分,只有全部达标的内容,才会被“提拔”到长期记忆里;同时会清理矛盾信息、把“昨天”这类相对日期转换成具体日期、移除失效的文件引用,让长期记忆保持干净、准确、不臃肿。

整理完成后还会生成DREAMS.md梦境日记,用户能清晰看到小龙虾到底整理了哪些内容。

其实Claude Code在3月下旬就推出了类似的Auto Memory和Auto Dream功能,而小龙虾的Dreaming是同一方向的开源实现,还做了专属设计:六维度加权打分、分阶段整理、梦境日记可视化,且在Claude Code源码泄漏6天后就完成上线,节奏非常紧凑。现在在小龙虾对话里输入/dreaming on就能开启这个功能,输入/dreaming status可查看状态,默认是关闭的,Dashboard里也专门更新了“梦境”页面。

这次的新版本,还专门优了Prompt Caching,小龙虾终于学会省钱。因为,除了记忆混乱,小龙虾被吐槽最多的就是太费token,这也是Anthropic封杀它的核心原因。

此前小龙虾和大模型对话时,会把系统提示、工具清单、历史上下文一股脑全部发送,哪怕这些内容跟上一轮完全一样,也要重新发、重新处理;再加上工具清单存在重复、排序每次都不一样,导致缓存反复失效,简单说就是,每次用都像第一次去医院,不管上周来没来过,都要重新念一遍身份证号、家庭住址、过往病史。

这里其实涉及到大模型侧的一个技术叫做Prompt caching,有兴趣的朋友可以自己去查一下,主流大模型都支持,只是OpenClaw一直没有针对这个功能做优化,现在终于搞定啦。

可能也是因为,当时Anthropic禁止OpenClaw访问时,专门明确的表示了,自家的订阅模式本就不是为第三方工具的用量设计的,第三方工具不做缓存优化,根本无法可持续支撑;

有意思的是,此话一出,Claude Code的负责人还专门背着公司跑去为小龙虾提交了几个PR,帮着优化Claude的缓存命中率,你看这就是开源精神。小米大模型负责人也分析了,小龙虾一个用户的查询,实际产生的请求数量可能是Claude Code自家框架的好几倍,极端情况下还会拉高其他查询的缓存失效率,换算成API定价,实际成本可能是订阅价格的几十倍。

而这次更新,小龙虾直接对Prompt Caching做了大幅优化:没变的系统指令和上下文可以跨轮次复用,不用每次都重新处理;删掉了重复的工具清单,对MCP工具排序做了确定性处理,避免因顺序变化导致缓存失效;还支持心跳保活,防止缓存过期后重新写入。简单说就是,现在医院会把你的档案存起来,再去的时候直接说“我是上次那个”就行,不用从头念一遍信息。这个优化对所有养虾党来说都是实实在在的福利,不管是按API按量付费还是用OpenRouter,都能少花不少钱,同样的任务消耗的token大幅减少。

不止做梦和省钱,还有好几个重磅的功能升级呢,体验感拉满。
这次直接内置视频+音乐生成功能,不用再手动配置,开箱即用,一句话就能生成,视频方面集成了Runway、通义万相、xAI等平台,音乐方面则支持Google Lyria、MiniMax;
深度适配GPT-5.4,提供原生支持和个性化配置,结合官方的表态能看出,在引导配置界面已经没有Claude模型可选了。是啊,你都不让我调用了,我在选项里面列出来干嘛呢?

还有一点特别好,就是针对长时间的复杂任务现在会分步骤汇报进度啦。以前执行复杂任务只能对着屏幕盲等,小龙虾啥都不回,都以为它死掉了,很多人都很吐槽这点。现在每一步的进度、状态都能清晰看到,不用再猜测执行到哪了;

控制面板和文档直接新增了简体中文和繁体中文,对国内用户更友好了。

封杀不是终点,而是进化的起点

回头看这一周的时间线,能感受到小龙虾的迭代速度有多快:

- 3月31日Claude Code源码泄漏,51万行代码、Auto Dream实现细节全部公开;

- 4月4日Anthropic正式封杀小龙虾,订阅额度不再覆盖第三方工具;

- 4月6日小龙虾就发布了今年的最大更新,Dreaming、缓存优化、视频音乐生成、GPT-5.4适配全部上线。

值得一提的是,这次的2026.4.5版本,有103位贡献者参与开发,这就是开源社区的强大力量:一家公司可以封杀你的接入,但根本挡不住上百位开发者同时为你写代码。

此前就有人戏称Claude封杀小龙虾,那就给小龙虾换“饲料”吧!现在看来,不只是换了饲料,还完成了一次重要进化。在AI这个行业里,封杀从来都不是终点,而是进化的起点,下次再看到“封杀”“禁止”的新闻,完全不用恐慌,开源世界的回应速度,永远比你想象的更快。