本文基于小米 MiMo Token Plan + OpenClaw 实际使用经验整理。
1、模型选型:Token Plan 是基础
选择合适的计费方案是控制成本的第一步。
1.1、API Key vs Token Plan
| 方案 | 适用场景 | 优势 |
|---|---|---|
| API Key(按量计费) | 低频使用、测试 | 灵活,用多少付多少 |
| Token Plan(订阅制) | 高频使用、长期运行 | 单价更低,适合 Agent 场景 |
Agent 场景下 Token Plan 性价比远高于 API Key。因为 Agent 每次对话都需要加载系统提示、工作区文件、工具定义等,Token 消耗量大且频繁,订阅制能显著降低单次成本。
1.2、配置要点
Token Plan 的 baseUrl 和 apiKey 前缀与普通 API Key 不同:
- baseUrl:
https://token-plan-cn.xiaomimimo.com/v1 - apiKey 前缀:
tp-(不是sk-) - 必须删除
openclaw.json中顶层的auth字段,否则鉴权会冲突
2、上下文管理:最大的 Token 黑洞
Agent 的每次对话都会注入大量上下文(系统提示、工作区文件、对话历史),这是 Token 消耗的主要来源。
2.1、子 Agent 策略
核心原则:脏活让子 agent 干,主会话保持干净。
- 定时任务(如每日早热点)→ spawn 子 agent 执行,主会话只保留摘要
- 复杂搜索/分析任务 → 子 agent 完成后返回精简结果
- 简单问答 → 直接在主会话处理,不绕弯子
主会话上下文每多一条工具调用记录,后续所有对话都要为这些"噪音"付费。子 agent 策略本质上是把脏上下文隔离在一次性会话里。
2.2、工作区文件精简
OpenClaw 启动时会注入多个工作区文件作为上下文,每个字都在消耗 Token:
| 文件 | 作用 | 优化建议 |
|---|---|---|
SOUL.md | 人设定义 | 保持精简,避免长篇大论 |
USER.md | 用户信息 | 只放必要字段 |
AGENTS.md | 行为规则 | 越短越好,去掉废话 |
HEARTBEAT.md | 定时任务 | 无任务时保持"当前无周期性检查任务" |
TOOLS.md | 工具说明 | 只记实际用到的配置 |
2.3、/new 定期清理
对话轮次越多,历史上下文越臃肿。定期使用 /new 或 /reset 重置会话,让 Agent 从干净状态重新开始。每次重置后 Agent 会重新读取工作区文件,只加载最新、必要的信息。
3、提示词工程:精准 = 省钱
模糊的指令会导致 Agent 反复试错、搜索无关内容,每次尝试都在烧 Token。
3.1、定时任务 Prompt 设计
以每日早热点为例,优化前后的差异:
优化前: 简单描述"搜AI新闻和股市"
- Agent 需要自己决定搜什么、怎么组织、格式是什么
- 可能搜到无关内容,多轮搜索浪费 Token
优化后: 明确搜索关键词、输出格式、影响判断规则
- 搜索范围锁定,减少无效搜索
- 输出格式固定,减少 Agent "思考" 消耗
- 每条信息必须附带影响判断(📈利好 / 📉利空 / ⚠️关注)
3.2、代理配置避免重试
搜索工具不走系统代理会导致请求失败 → 重试 → 多倍 Token 消耗。
务必在 TOOLS.md 中明确记录代理配置:外网 curl 必须加 --proxy http://127.0.0.1:7897,国内网站直连。一次搜索失败的重试成本远高于配置代理的成本。
4、记忆系统:避免重复解释
每次对话都要重新解释背景信息是最浪费的 Token 用法。
4.1、文件即记忆
| 记忆类型 | 存储位置 | 何时加载 |
|---|---|---|
| 每日记录 | memory/YYYY-MM-DD.md | 启动时读今天+昨天 |
| 长期记忆 | MEMORY.md | 仅主会话加载 |
| 用户偏好 | USER.md / MEMORY.md | 每次启动 |
4.2、关键信息持久化
Agent 发现的重要配置(代理地址、飞书断连修复流程、输出格式偏好)应该立即写入对应文件,而不是"心里记住"。下次启动时直接读文件即可,不需要用户重复说明。
5、平台适配:避免格式返工
不同平台的格式支持不同,发错格式 → 用户要求重做 → 双倍 Token 消耗。
- 飞书: 支持 Markdown 表格、加粗、列表
- Discord / WhatsApp: 不用表格,用列表替代
- Discord 多链接: 用
<>包裹防预览
6、故障处理:避免无效循环
6.1、飞书断连检测
WebSocket 断开后 Agent 发消息会失败,盲目重试会浪费大量 Token。
正确流程:
- 检测到发送失败 →
curl测试open.feishu.cn连通性 - 返回
000→ 网络未恢复,不重启(避免无效操作) - 返回非
000→ 执行openclaw gateway restart
6.2、搜索失败处理
搜索工具内置不走代理时,不要反复重试相同的搜索。先检查代理配置,手动用 curl --proxy 验证,确认通了再让工具执行。
7、小结
OpenClaw Token 优化是一个系统工程,核心思路是:
- 选对方案 — Token Plan 订阅制比 API Key 按量计费更经济
- 隔离上下文 — 子 Agent 策略把脏活隔离出去
- 精简输入 — 工作区文件越短越好,Prompt 越精准越好
- 持久记忆 — 写文件 > 重新解释,避免重复消耗
- 减少返工 — 平台适配、故障预判,一次做对
终极目标:让 Agent 每一个 Token 都花在"做事"上,而不是花在"理解该做什么"或"纠正错误"上。