我把 OpenClaw 当操作系统用了 7 天，踩过的 9 个坑和可复用方案先说结论。 OpenClaw 这东西不是“装

先说结论。

OpenClaw 这东西不是“装上就能飞”的那种。

它更像是你自己给自己拼一套小系统：消息入口、任务路由、记忆、定时器、工具链，全部要自己调。

调顺了很猛，调不顺就像一锅粥。

我这 7 天最大的体感是：

问题基本都不是模型不聪明，而是“边界没切好”。

下面直接上坑。

第 1 个坑：角色混着用，回答会串味。

我一开始让一个 Agent 既看日报、又写方案、还要发消息。

结果很典型：它知道很多，但输出经常飘。

今天像产品，明天像运维，后天又开始讲宏观叙事。

后来我干了个很土但有效的事：

一个 Agent 只干一件事。

比如“技术专家”只做动态和资料整理，“个人助理”只处理行动项和提醒。

一拆开，稳定度立刻上来。

第 2 个坑：提示词越写越长，效果反而变差。

我以前喜欢把规则写一大坨，想着越全越保险。

实际情况是：越长越容易互相打架。

你以为是在“约束”，模型感受到的是“噪音”。

后面我改成三段式：

你是谁、你只做什么、你不能做什么。

每段尽量一句话说清。

效果比 200 行说明文强太多。

第 3 个坑：记忆不分层，历史会污染当前任务。

一开始我把很多东西都塞进长期记忆。

结果是新任务经常被旧上下文带偏。

比如明明在写技术稿，它突然拉出以前的管理语气。

后来我只保留两层：

长期记忆放稳定规则；

当天记忆放临时上下文。

并且定期清理“过期偏好”。

这个动作很像清缓存，做了之后顺很多。

第 4 个坑：自动化一开就想“全自动发布”。

这个最容易翻车。

你以为省事，实际上登录态、验证码、弹窗、平台策略随时让你卡住。

我现在的策略是半自动：

生成和填充自动，登录验证人工接管。

这样效率和稳定性都能接受。

第 5 个坑：输出格式不贴平台，读起来像复制粘贴。

这个很直观。

掘金编辑器对 markdown 风格不是不能用，但“看感”不一定好。

尤其是全篇标题符号、列表符号堆满的时候，会有明显机器味。

我后来统一成纯文本结构：

短段落 + 明确分段 + 固定节奏。

读感会自然很多。

第 6 个坑：没有失败兜底。

很多人把流程写成“理想路径”，但线上一定有异常。

比如网页元素找不到、接口偶发超时、定时任务撞登录失效。

没兜底就会整条链条断掉。

我现在每条自动流程都加一句：

失败就回传“卡在哪一步 + 需要人工做什么”。

别小看这句，能省掉大量来回排查。

第 7 个坑：指标只看“发没发”，不看“有没有用”。

这个很隐蔽。

看起来每天都发了，但质量可能在下滑。

我现在会盯三个东西：

可读性、重复率、人工改动量。

如果人工每次都要大改，那就说明流程没调好。

第 8 个坑：目录乱，后期根本不敢改。

一开始我把脚本、文档、示例、草稿混着放。

过几天就会变成“知道有这个文件，但不敢动”。

后来我把内容、脚本、规则分开目录，维护成本直接降下来。

第 9 个坑：想一步到位。

这基本是所有坑的根。

真正可用的系统都是一点点拧出来的。

先把一个场景跑顺，再复制到下一个场景。

别追求“今天全打通”。

最后给一个我现在在用的最小结构。

agents/ 放不同角色定义和边界。

content/ 放文章和输出产物。

scripts/ 放发布流程和自动化脚本。

memory/ 放当天记录和长期记忆。

你不一定非要照搬这个结构。

核心是职责、产物、流程、记忆分开，不要糊成一团。

如果你也在折腾 OpenClaw，别急着追求“最智能”。

先把边界切干净，把流程跑稳定。

这玩意儿一旦顺起来，是真的能省掉很多重复活。