我把 OpenClaw 当操作系统用了 7 天,踩过的 9 个坑和可复用方案

7 阅读1分钟

先说结论。

OpenClaw 这东西不是“装上就能飞”的那种。

它更像是你自己给自己拼一套小系统:消息入口、任务路由、记忆、定时器、工具链,全部要自己调。

调顺了很猛,调不顺就像一锅粥。

我这 7 天最大的体感是:

问题基本都不是模型不聪明,而是“边界没切好”。

下面直接上坑。

第 1 个坑:角色混着用,回答会串味。

我一开始让一个 Agent 既看日报、又写方案、还要发消息。

结果很典型:它知道很多,但输出经常飘。

今天像产品,明天像运维,后天又开始讲宏观叙事。

后来我干了个很土但有效的事:

一个 Agent 只干一件事。

比如“技术专家”只做动态和资料整理,“个人助理”只处理行动项和提醒。

一拆开,稳定度立刻上来。

第 2 个坑:提示词越写越长,效果反而变差。

我以前喜欢把规则写一大坨,想着越全越保险。

实际情况是:越长越容易互相打架。

你以为是在“约束”,模型感受到的是“噪音”。

后面我改成三段式:

你是谁、你只做什么、你不能做什么。

每段尽量一句话说清。

效果比 200 行说明文强太多。

第 3 个坑:记忆不分层,历史会污染当前任务。

一开始我把很多东西都塞进长期记忆。

结果是新任务经常被旧上下文带偏。

比如明明在写技术稿,它突然拉出以前的管理语气。

后来我只保留两层:

长期记忆放稳定规则;

当天记忆放临时上下文。

并且定期清理“过期偏好”。

这个动作很像清缓存,做了之后顺很多。

第 4 个坑:自动化一开就想“全自动发布”。

这个最容易翻车。

你以为省事,实际上登录态、验证码、弹窗、平台策略随时让你卡住。

我现在的策略是半自动:

生成和填充自动,登录验证人工接管。

这样效率和稳定性都能接受。

第 5 个坑:输出格式不贴平台,读起来像复制粘贴。

这个很直观。

掘金编辑器对 markdown 风格不是不能用,但“看感”不一定好。

尤其是全篇标题符号、列表符号堆满的时候,会有明显机器味。

我后来统一成纯文本结构:

短段落 + 明确分段 + 固定节奏。

读感会自然很多。

第 6 个坑:没有失败兜底。

很多人把流程写成“理想路径”,但线上一定有异常。

比如网页元素找不到、接口偶发超时、定时任务撞登录失效。

没兜底就会整条链条断掉。

我现在每条自动流程都加一句:

失败就回传“卡在哪一步 + 需要人工做什么”。

别小看这句,能省掉大量来回排查。

第 7 个坑:指标只看“发没发”,不看“有没有用”。

这个很隐蔽。

看起来每天都发了,但质量可能在下滑。

我现在会盯三个东西:

可读性、重复率、人工改动量。

如果人工每次都要大改,那就说明流程没调好。

第 8 个坑:目录乱,后期根本不敢改。

一开始我把脚本、文档、示例、草稿混着放。

过几天就会变成“知道有这个文件,但不敢动”。

后来我把内容、脚本、规则分开目录,维护成本直接降下来。

第 9 个坑:想一步到位。

这基本是所有坑的根。

真正可用的系统都是一点点拧出来的。

先把一个场景跑顺,再复制到下一个场景。

别追求“今天全打通”。

最后给一个我现在在用的最小结构。

agents/ 放不同角色定义和边界。

content/ 放文章和输出产物。

scripts/ 放发布流程和自动化脚本。

memory/ 放当天记录和长期记忆。

你不一定非要照搬这个结构。

核心是职责、产物、流程、记忆分开,不要糊成一团。

如果你也在折腾 OpenClaw,别急着追求“最智能”。

先把边界切干净,把流程跑稳定。

这玩意儿一旦顺起来,是真的能省掉很多重复活。