先说结论。
OpenClaw 这东西不是“装上就能飞”的那种。
它更像是你自己给自己拼一套小系统:消息入口、任务路由、记忆、定时器、工具链,全部要自己调。
调顺了很猛,调不顺就像一锅粥。
我这 7 天最大的体感是:
问题基本都不是模型不聪明,而是“边界没切好”。
下面直接上坑。
第 1 个坑:角色混着用,回答会串味。
我一开始让一个 Agent 既看日报、又写方案、还要发消息。
结果很典型:它知道很多,但输出经常飘。
今天像产品,明天像运维,后天又开始讲宏观叙事。
后来我干了个很土但有效的事:
一个 Agent 只干一件事。
比如“技术专家”只做动态和资料整理,“个人助理”只处理行动项和提醒。
一拆开,稳定度立刻上来。
第 2 个坑:提示词越写越长,效果反而变差。
我以前喜欢把规则写一大坨,想着越全越保险。
实际情况是:越长越容易互相打架。
你以为是在“约束”,模型感受到的是“噪音”。
后面我改成三段式:
你是谁、你只做什么、你不能做什么。
每段尽量一句话说清。
效果比 200 行说明文强太多。
第 3 个坑:记忆不分层,历史会污染当前任务。
一开始我把很多东西都塞进长期记忆。
结果是新任务经常被旧上下文带偏。
比如明明在写技术稿,它突然拉出以前的管理语气。
后来我只保留两层:
长期记忆放稳定规则;
当天记忆放临时上下文。
并且定期清理“过期偏好”。
这个动作很像清缓存,做了之后顺很多。
第 4 个坑:自动化一开就想“全自动发布”。
这个最容易翻车。
你以为省事,实际上登录态、验证码、弹窗、平台策略随时让你卡住。
我现在的策略是半自动:
生成和填充自动,登录验证人工接管。
这样效率和稳定性都能接受。
第 5 个坑:输出格式不贴平台,读起来像复制粘贴。
这个很直观。
掘金编辑器对 markdown 风格不是不能用,但“看感”不一定好。
尤其是全篇标题符号、列表符号堆满的时候,会有明显机器味。
我后来统一成纯文本结构:
短段落 + 明确分段 + 固定节奏。
读感会自然很多。
第 6 个坑:没有失败兜底。
很多人把流程写成“理想路径”,但线上一定有异常。
比如网页元素找不到、接口偶发超时、定时任务撞登录失效。
没兜底就会整条链条断掉。
我现在每条自动流程都加一句:
失败就回传“卡在哪一步 + 需要人工做什么”。
别小看这句,能省掉大量来回排查。
第 7 个坑:指标只看“发没发”,不看“有没有用”。
这个很隐蔽。
看起来每天都发了,但质量可能在下滑。
我现在会盯三个东西:
可读性、重复率、人工改动量。
如果人工每次都要大改,那就说明流程没调好。
第 8 个坑:目录乱,后期根本不敢改。
一开始我把脚本、文档、示例、草稿混着放。
过几天就会变成“知道有这个文件,但不敢动”。
后来我把内容、脚本、规则分开目录,维护成本直接降下来。
第 9 个坑:想一步到位。
这基本是所有坑的根。
真正可用的系统都是一点点拧出来的。
先把一个场景跑顺,再复制到下一个场景。
别追求“今天全打通”。
最后给一个我现在在用的最小结构。
agents/ 放不同角色定义和边界。
content/ 放文章和输出产物。
scripts/ 放发布流程和自动化脚本。
memory/ 放当天记录和长期记忆。
你不一定非要照搬这个结构。
核心是职责、产物、流程、记忆分开,不要糊成一团。
如果你也在折腾 OpenClaw,别急着追求“最智能”。
先把边界切干净,把流程跑稳定。
这玩意儿一旦顺起来,是真的能省掉很多重复活。