OpenClaw 结合 mimo Token优化实战记录

0 阅读4分钟

本文基于小米 MiMo Token Plan + OpenClaw 实际使用经验整理。

1、模型选型:Token Plan 是基础

选择合适的计费方案是控制成本的第一步。

1.1、API Key vs Token Plan

方案适用场景优势
API Key(按量计费)低频使用、测试灵活,用多少付多少
Token Plan(订阅制)高频使用、长期运行单价更低,适合 Agent 场景

Agent 场景下 Token Plan 性价比远高于 API Key。因为 Agent 每次对话都需要加载系统提示、工作区文件、工具定义等,Token 消耗量大且频繁,订阅制能显著降低单次成本。

1.2、配置要点

Token Plan 的 baseUrlapiKey 前缀与普通 API Key 不同:

  • baseUrl: https://token-plan-cn.xiaomimimo.com/v1
  • apiKey 前缀: tp-(不是 sk-
  • 必须删除 openclaw.json 中顶层的 auth 字段,否则鉴权会冲突

2、上下文管理:最大的 Token 黑洞

Agent 的每次对话都会注入大量上下文(系统提示、工作区文件、对话历史),这是 Token 消耗的主要来源。

2.1、子 Agent 策略

核心原则:脏活让子 agent 干,主会话保持干净。

  • 定时任务(如每日早热点)→ spawn 子 agent 执行,主会话只保留摘要
  • 复杂搜索/分析任务 → 子 agent 完成后返回精简结果
  • 简单问答 → 直接在主会话处理,不绕弯子

主会话上下文每多一条工具调用记录,后续所有对话都要为这些"噪音"付费。子 agent 策略本质上是把脏上下文隔离在一次性会话里。

2.2、工作区文件精简

OpenClaw 启动时会注入多个工作区文件作为上下文,每个字都在消耗 Token:

文件作用优化建议
SOUL.md人设定义保持精简,避免长篇大论
USER.md用户信息只放必要字段
AGENTS.md行为规则越短越好,去掉废话
HEARTBEAT.md定时任务无任务时保持"当前无周期性检查任务"
TOOLS.md工具说明只记实际用到的配置

2.3、/new 定期清理

对话轮次越多,历史上下文越臃肿。定期使用 /new/reset 重置会话,让 Agent 从干净状态重新开始。每次重置后 Agent 会重新读取工作区文件,只加载最新、必要的信息。

3、提示词工程:精准 = 省钱

模糊的指令会导致 Agent 反复试错、搜索无关内容,每次尝试都在烧 Token。

3.1、定时任务 Prompt 设计

以每日早热点为例,优化前后的差异:

优化前: 简单描述"搜AI新闻和股市"

  • Agent 需要自己决定搜什么、怎么组织、格式是什么
  • 可能搜到无关内容,多轮搜索浪费 Token

优化后: 明确搜索关键词、输出格式、影响判断规则

  • 搜索范围锁定,减少无效搜索
  • 输出格式固定,减少 Agent "思考" 消耗
  • 每条信息必须附带影响判断(📈利好 / 📉利空 / ⚠️关注)

3.2、代理配置避免重试

搜索工具不走系统代理会导致请求失败 → 重试 → 多倍 Token 消耗。

务必在 TOOLS.md 中明确记录代理配置:外网 curl 必须加 --proxy http://127.0.0.1:7897,国内网站直连。一次搜索失败的重试成本远高于配置代理的成本。

4、记忆系统:避免重复解释

每次对话都要重新解释背景信息是最浪费的 Token 用法。

4.1、文件即记忆

记忆类型存储位置何时加载
每日记录memory/YYYY-MM-DD.md启动时读今天+昨天
长期记忆MEMORY.md仅主会话加载
用户偏好USER.md / MEMORY.md每次启动

4.2、关键信息持久化

Agent 发现的重要配置(代理地址、飞书断连修复流程、输出格式偏好)应该立即写入对应文件,而不是"心里记住"。下次启动时直接读文件即可,不需要用户重复说明。

5、平台适配:避免格式返工

不同平台的格式支持不同,发错格式 → 用户要求重做 → 双倍 Token 消耗。

  • 飞书: 支持 Markdown 表格、加粗、列表
  • Discord / WhatsApp: 不用表格,用列表替代
  • Discord 多链接:<> 包裹防预览

6、故障处理:避免无效循环

6.1、飞书断连检测

WebSocket 断开后 Agent 发消息会失败,盲目重试会浪费大量 Token。

正确流程:

  1. 检测到发送失败 → curl 测试 open.feishu.cn 连通性
  2. 返回 000 → 网络未恢复,不重启(避免无效操作)
  3. 返回非 000 → 执行 openclaw gateway restart

6.2、搜索失败处理

搜索工具内置不走代理时,不要反复重试相同的搜索。先检查代理配置,手动用 curl --proxy 验证,确认通了再让工具执行。

7、小结

OpenClaw Token 优化是一个系统工程,核心思路是:

  1. 选对方案 — Token Plan 订阅制比 API Key 按量计费更经济
  2. 隔离上下文 — 子 Agent 策略把脏活隔离出去
  3. 精简输入 — 工作区文件越短越好,Prompt 越精准越好
  4. 持久记忆 — 写文件 > 重新解释,避免重复消耗
  5. 减少返工 — 平台适配、故障预判,一次做对

终极目标:让 Agent 每一个 Token 都花在"做事"上,而不是花在"理解该做什么"或"纠正错误"上。

8、参考