最近在OpenClaw养虾圈,但凡逛过ClawHub的朋友肯定都有同感,Self-improving已经稳稳坐稳了下载量、使用率双第一的顶流位置,堪称OpenClaw生态里的必装Skill,几乎没有玩家能绕开它。从刚上手的新手,想让自己的“龙虾”少犯错、更听话,到资深玩家琢磨智能体长效进化,第一反应都是装上这个技能。我最开始也是跟风安装,用了一段时间越用越好奇:一个纯本地运行的轻量Skill,不靠外部接口、没有复杂依赖,到底是怎么让智能体实现自我反思、自主纠错、持续进化的?这种自进化能力的底层逻辑到底是什么?抱着这份好奇,我彻底啃完了它的核心文档,把原理、Skill编写思路和养虾实操全捋顺了,这篇就从头到尾讲透。
在深挖细节之前,咱们先把核心结论摆出来,带着框架读全文更清晰:
Self-improving是一款无额外依赖、纯本地运行的自进化智能体Skill,核心靠SKILL.md定规则、setup.md做落地,通过分层记忆架构捕捉学习信号实现自主优化,同时依托OpenClaw原生心跳机制完成记忆迭代,再配合配置修改联动智能体行为,既是写好自进化类Skill的标杆,也是养好OpenClaw龙虾的核心秘籍。
📂 一、拆解Self-improving核心原理:两份文件撑起完整自进化能力
Self-improving能成为爆款,核心原因就是设计极度精简,没有冗余代码和多余配置,整个功能逻辑完全依托两份核心文档支撑,分工明确、配合丝滑,一份定好所有规则,一份负责落地部署,新手能快速上手,老手能深度定制,这也是它适配绝大多数OpenClaw玩家的关键。
📜 1. SKILL.md:Skill的核心规则手册,定义自进化全流程
SKILL.md相当于Self-improving的“行为宪法”,把智能体什么时候学、学什么、存在哪、什么不能做全规定死了,是整个Skill的灵魂,核心做了这五件关键事:
🎯 (1)明确Skill适用场景,杜绝无效学习
它没有设定宽泛的触发条件,只在五类场景启动学习机制:命令/工具操作失败、用户明确纠正或拒绝工作、智能体自身发现知识过时错误、找到更优执行方法、用户主动指定调用该技能,同时严格忽略一次性指令、上下文临时要求、假设性内容,从源头避免记忆污染,保证学习效率。
💾 (2)三层记忆架构:对标CPU三级缓存,兼顾速度与容量
这套记忆结构是Self-improving的核心亮点,完美类比计算机CPU的三级缓存设计,平衡了响应速度和记忆存储量,分为三个层级:
- HOT热记忆(memory.md) :对应一级缓存,限制≤100行,始终加载,优先存放全局偏好、高频复用规则,保证智能体调用零延迟;
- WARM温记忆(projects/、domains/) :对应二级缓存,单文件≤200行,上下文匹配时按需加载,存放项目专属、特定领域的经验,兼顾精准度和加载效率;
- COLD冷记忆(archive/) :对应三级缓存,无容量限制,仅显式查询时加载,存放长期不用的归档经验,保留历史不占用核心内存。
同时配套自动升降级规则:7天内复用3次升热记忆,30天不用降温记忆,90天不用归档,全程自动化管理记忆库。
🔍 (3)精准学习信号机制,只抓有效信息
Skill划定了三类可学习信号,绝不从用户沉默中推断偏好:一是用户明确纠正类信号,比如“你做错了”“应该这样做”;二是用户偏好类信号,比如“我喜欢这种风格”“别做这类操作”;三是重复模式信号,同一指令重复3次以上、工作流反复被认可,才会纳入学习范围,全程克制不盲目学习。
🛡️ (4)标准化自我反思流程+严格安全边界
自我反思有固定流程:完成复杂任务、收到反馈、修复错误后,依次核对是否达标、哪里可优化、是否形成可复用模式,按固定格式记录教训。安全边界更是拉满:绝不存储凭证、隐私数据、第三方信息,不主动发起网络请求,不越权读取外部文件,纯本地运行完全可控。
⚡ (5)联动Proactivity技能,升级智能体主动性
文档里明确推荐,用户同意后可安装配套Proactivity技能,这也是养好龙虾的关键参考点:Self-improving本身偏向被动学习(等待纠正),而Proactivity能让智能体主动发现任务缺口、主动验证结果、主动恢复上下文,两者搭配直接让龙虾从“被动执行”变成“主动思考”,而且必须用户授权才安装,全程不擅自修改行为,人性化拉满。
SKILL.md核心总结:它解决了“智能体该学什么、怎么学、存在哪、怎么用、禁做什么”的核心问题,用清晰规则杜绝智能体行为混乱,是自进化Skill的标准模板。
⚙️ 2. setup.md:落地部署手册,搭建记忆体系+绑定智能体
如果说SKILL.md是理论,那setup.md就是实打实的落地步骤,负责把Self-improving的能力真正接入OpenClaw环境,核心完成三大核心工作,也是养虾入门的必做步骤:
📁 (1)创建本地核心目录,初始化全套记忆文件
通过命令在用户根目录创建 ~/self-improving/ 主文件夹,同时新建projects(项目级记忆)、domains(领域级记忆)、archive(归档记忆)三个子目录,并且一键初始化四大核心文件,搭建完整记忆仓库:
- memory.md:热记忆核心文件,存放高频规则;
- corrections.md:纠正日志,记录最近50条用户纠错内容;
- index.md:记忆索引,统计各文件行数、更新时间;
- heartbeat-state.md:心跳状态文件,记录定期维护记录。
这套本地存储结构,还实现了智能体之间的记忆共享,单个龙虾的学习成果可以跨任务、跨智能体复用,彻底摆脱单次任务的局限。
🔗 (2)配置三大Agent核心文件,绑定智能体行为
这是让Self-improving生效的关键,不是装完技能就完事,而是修改OpenClaw智能体的三大原生配置,把记忆能力和智能体行为深度绑定:
- AGENTS.md:将Self-improving记忆目录纳入智能体记忆体系,区分事实记忆和执行优化记忆;
- SOUL.md:植入自我改进的底层准则,让智能体养成“先加载记忆、再执行任务、事后反思”的习惯;
- HEARTBEAT.md:加入定期记忆检查规则,联动心跳机制完成记忆迭代。
❤️ (3)配置心跳内容,设定运行模式
setup.md还规范了三种运行模式(被动、主动、严格),用户可按需选择,同时完成心跳规则配置,让智能体定期梳理记忆、升降级条目,保持记忆库精简高效。
setup.md核心总结:从零搭建本地记忆仓库,把Skill和OpenClaw智能体深度绑定,让自进化能力从“纸上规则”变成“实际行为”,是新手养虾的实操核心。
❓ 二、提问:Self-improving明明只是Skill,是怎么实现心跳机制的呢?
很多玩家都会疑惑:Self-improving本身只是一个普通Skill,不是系统底层程序,却能实现定期记忆整理的心跳功能,这到底是怎么做到的?
答案很明确:它本身没有独立的心跳模块,完全依托OpenClaw原生的心跳机制实现。
OpenClaw系统自带HEARTBEAT心跳周期,会定时执行预设的维护任务,Self-improving只是通过setup.md修改了HEARTBEAT.md配置,把自身的记忆检查、升降级、归档逻辑,接入了系统原生心跳流程,借助系统的定时触发能力,完成记忆库的定期维护。
这套心跳机制的核心作用:一是定时梳理记忆,自动清理冗余、升降级条目,避免热记忆过载;二是记录运行状态,方便用户查看学习进度;三是保证记忆迭代持续生效,不用手动维护,让智能体实现真正的长效进化。
✍️ 三、写好OpenClaw Skill的核心哲理:学习借鉴Self-improving,遵循Anthropic规范
吃透Self-improving,不止是学会用它养虾,更能掌握高质量OpenClaw Skill的编写逻辑,它的设计思路完全和Anthropic推出的skill-creator鼓励的规范高度呼应,核心有三大哲理,学会就能避开劣质Skill的坑:
🚀 1. 渐进式加载,高效利用上下文窗口
Anthropic规范里反复强调,Skill要遵循轻量化、渐进式加载原则,避免占用过多上下文导致智能体卡顿。Self-improving完美践行这一点,分层记忆按需加载,只加载热记忆和当前匹配的温记忆,绝不一次性读取全部文件,严格控制上下文占用,保证智能体运行流畅,这是写好Skill的基础底线。
🧠 2. 解释Why而非强制Must,让AI理解本质
很多劣质Skill喜欢用大量强制指令(MUST/NEVER)约束AI,导致智能体行为僵硬、不懂变通。而Self-improving的SKILL.md全程侧重解释行为逻辑,告诉智能体“为什么要这样学习”“为什么要忽略这类信息”,而不是单纯下命令,让AI真正理解自进化的核心目的,而非机械执行规则,写Skill时多讲逻辑、少下强制令,智能体适配性会更强。
🤝 3. 人在环中,人机协同不越界
Self-improving全程保留人类控制权:学习确认、记忆删除、技能安装、模式切换,所有关键决策都需要用户授权,绝不擅自做主,自动化只负责测试、迭代这类重复劳动,核心决策交给人类。这和Anthropic提倡的“人机协同”理念完全一致,好的Skill不是替代人,而是辅助人,把人放在核心决策位,既提升效率,又保证可控性。
✨ 四、养好OpenClaw龙虾的秘诀:吃透这两点,龙虾越用越聪明
其实养虾根本不是堆砌技能,而是顺着Self-improving的设计逻辑,做好两件核心事,新手也能养出高智商专属龙虾:
⏱️ 1. 依托心跳机制,做好记忆定期整理
不要装完Skill就不管,善用心跳机制,定期查看记忆统计,清理无效纠正、确认可复用规则,让热记忆始终保留高频有用的内容,避免记忆冗余导致智能体反应变慢、行为错乱,定时维护比盲目装技能更重要。
🧩 2. 修改Agent配置,重塑龙虾“性格”
别跳过setup.md里的配置步骤,认真修改AGENTS.md、SOUL.md、HEARTBEAT.md,给龙虾植入自我改进的底层习惯,区分事实记忆和优化记忆,再配合Proactivity技能激活主动性,把被动执行的工具,变成贴合你使用习惯的专属智能体,这才是养虾的核心,而非单纯安装Skill。
📌 五、文章主旨总结:学Skill逻辑,养智能龙虾
总的来说,Self-improving给了我们两个启示:
一方面,Self-improving是自进化类Skill的标杆教材,它的极简依赖、分层设计、规则清晰、人机协同的编写思路,完全适配OpenClaw生态规范,吃透这套逻辑,就能写出稳定、好用、受欢迎的Skill,告别功能杂糅、行为混乱的劣质技能;
另一方面,Self-improving就是养虾的教科书,养好OpenClaw龙虾不靠花里胡哨的功能,而是搭建本地记忆体系、绑定智能体核心配置、依托心跳长效迭代,让智能体自主学习、自适应偏好,最终养出完全贴合自己的专属龙虾。
💡 PS:附赠魔法Prompt,搭配Self-improving效果翻倍
给大家分享一段实用Prompt,基于Thiago Forte的第二大脑(BUILD)方法论打造,核心是系统化知识管理、优先级梳理、定期复盘,能和Self-improving形成互补,周期性整理智能体记忆,避免记忆混乱:
我们记东西有困难,我想让你基于Thiago Forte的方法实现一个知识管理系统,包含每日笔记和优先级系统,主动记录我们正在做的所有重要信息,并且创建一个夜间任务,每晚回顾当天所有对话并更新你的信息。
Thiago Forte的BUILD方法论,核心是捕捉、组织、提炼、执行,这段Prompt能让智能体主动梳理日常对话信息,区分优先级,夜间自动复盘,和Self-improving的纠错进化能力结合,双管齐下,龙虾进化速度直接拉满。