OpenClaw 结合 mimo Token优化实战记录本文基于小米 MiMo Token Plan + OpenCla

本文基于小米 MiMo Token Plan + OpenClaw 实际使用经验整理。

1、模型选型：Token Plan 是基础

选择合适的计费方案是控制成本的第一步。

1.1、API Key vs Token Plan

方案	适用场景	优势
API Key（按量计费）	低频使用、测试	灵活，用多少付多少
Token Plan（订阅制）	高频使用、长期运行	单价更低，适合 Agent 场景

Agent 场景下 Token Plan 性价比远高于 API Key。因为 Agent 每次对话都需要加载系统提示、工作区文件、工具定义等，Token 消耗量大且频繁，订阅制能显著降低单次成本。

1.2、配置要点

Token Plan 的 baseUrl 和 apiKey 前缀与普通 API Key 不同：

baseUrl： https://token-plan-cn.xiaomimimo.com/v1
apiKey 前缀： tp-（不是 sk-）
必须删除 openclaw.json 中顶层的 auth 字段，否则鉴权会冲突

2、上下文管理：最大的 Token 黑洞

Agent 的每次对话都会注入大量上下文（系统提示、工作区文件、对话历史），这是 Token 消耗的主要来源。

2.1、子 Agent 策略

核心原则：脏活让子 agent 干，主会话保持干净。

定时任务（如每日早热点）→ spawn 子 agent 执行，主会话只保留摘要
复杂搜索/分析任务 → 子 agent 完成后返回精简结果
简单问答 → 直接在主会话处理，不绕弯子

主会话上下文每多一条工具调用记录，后续所有对话都要为这些"噪音"付费。子 agent 策略本质上是把脏上下文隔离在一次性会话里。

2.2、工作区文件精简

OpenClaw 启动时会注入多个工作区文件作为上下文，每个字都在消耗 Token：

文件	作用	优化建议
`SOUL.md`	人设定义	保持精简，避免长篇大论
`USER.md`	用户信息	只放必要字段
`AGENTS.md`	行为规则	越短越好，去掉废话
`HEARTBEAT.md`	定时任务	无任务时保持"当前无周期性检查任务"
`TOOLS.md`	工具说明	只记实际用到的配置

2.3、/new 定期清理

对话轮次越多，历史上下文越臃肿。定期使用 /new 或 /reset 重置会话，让 Agent 从干净状态重新开始。每次重置后 Agent 会重新读取工作区文件，只加载最新、必要的信息。

3、提示词工程：精准 = 省钱

模糊的指令会导致 Agent 反复试错、搜索无关内容，每次尝试都在烧 Token。

3.1、定时任务 Prompt 设计

以每日早热点为例，优化前后的差异：

优化前： 简单描述"搜AI新闻和股市"

Agent 需要自己决定搜什么、怎么组织、格式是什么
可能搜到无关内容，多轮搜索浪费 Token

优化后： 明确搜索关键词、输出格式、影响判断规则

搜索范围锁定，减少无效搜索
输出格式固定，减少 Agent "思考" 消耗
每条信息必须附带影响判断（📈利好 / 📉利空 / ⚠️关注）

3.2、代理配置避免重试

搜索工具不走系统代理会导致请求失败 → 重试 → 多倍 Token 消耗。

务必在 TOOLS.md 中明确记录代理配置：外网 curl 必须加 --proxy http://127.0.0.1:7897，国内网站直连。一次搜索失败的重试成本远高于配置代理的成本。

4、记忆系统：避免重复解释

每次对话都要重新解释背景信息是最浪费的 Token 用法。

4.1、文件即记忆

记忆类型	存储位置	何时加载
每日记录	`memory/YYYY-MM-DD.md`	启动时读今天+昨天
长期记忆	`MEMORY.md`	仅主会话加载
用户偏好	`USER.md` / `MEMORY.md`	每次启动

4.2、关键信息持久化

Agent 发现的重要配置（代理地址、飞书断连修复流程、输出格式偏好）应该立即写入对应文件，而不是"心里记住"。下次启动时直接读文件即可，不需要用户重复说明。

5、平台适配：避免格式返工

不同平台的格式支持不同，发错格式 → 用户要求重做 → 双倍 Token 消耗。

飞书： 支持 Markdown 表格、加粗、列表
Discord / WhatsApp： 不用表格，用列表替代
Discord 多链接： 用 <> 包裹防预览

6、故障处理：避免无效循环

6.1、飞书断连检测

WebSocket 断开后 Agent 发消息会失败，盲目重试会浪费大量 Token。

正确流程：

检测到发送失败 → curl 测试 open.feishu.cn 连通性
返回 000 → 网络未恢复，不重启（避免无效操作）
返回非 000 → 执行 openclaw gateway restart

6.2、搜索失败处理

搜索工具内置不走代理时，不要反复重试相同的搜索。先检查代理配置，手动用 curl --proxy 验证，确认通了再让工具执行。

7、小结

OpenClaw Token 优化是一个系统工程，核心思路是：

选对方案 — Token Plan 订阅制比 API Key 按量计费更经济
隔离上下文 — 子 Agent 策略把脏活隔离出去
精简输入 — 工作区文件越短越好，Prompt 越精准越好
持久记忆 — 写文件 > 重新解释，避免重复消耗
减少返工 — 平台适配、故障预判，一次做对

终极目标：让 Agent 每一个 Token 都花在"做事"上，而不是花在"理解该做什么"或"纠正错误"上。

OpenClaw 结合 mimo Token优化实战记录