OpenClaw又双叒叕发版了,此次发布的2026.3.22-beta.1版本看起来“大换血”——大改插件体系、重构SDK 路径、重写消息机制、改变运行方式、收敛工具能力,以及重构浏览器体系与大模型策略。

这次更新让开发者在构建复杂AI应用时拥有了更强的能力,但同时也带来了新的挑战:当多个Agent并行运行、任务跨度数天时,如何精确掌握每个环节的算力消耗和状态变化?
根据我们小范围的调研,开发者反馈在使用OpenClaw运行复杂任务时,经常遇到这些困扰:任务跑到一半突然变慢,却无法区分是模型在深度思考还是出现了卡顿;月底收到API账单时发现金额远超预期,却无法追溯具体消耗;或者更糟糕的是,上下文被静默压缩导致Agent"忘记"了关键决策,影响任务连续性。
这种"黑盒"开发体验,正是新开源工具ClawProbe要解决的核心痛点。作为专为OpenClaw设计的实时监控工具,它让开发者在模型价格战激烈的当下,能够精确掌控每一分算力消耗。
clawprobe不改变你的Agent逻辑,不注入任何性能开销,只是静默地读取OpenClaw的本地状态文件,用差分算法实时计算出你想知道的一切。就像给Agent做strace,但输出的是人类可读的仪表盘。
本版本为内测版:github.com/seekcontext/ClawProbe,诚邀试用、提PR,或将建议反馈在OceanBase社区「问答」板块。
两分钟接入:比配置Prometheus还简单
别急着上Grafana仪表盘。对于大多数OpenClaw用户来说,部署完整的监控栈反而增加了复杂度。clawprobe的哲学是:监控工具本身不应该成为新的监控对象。
npm install -g clawprobe
clawprobe start # 启动后台文件监听器
clawprobe status # 立即查看Agent CT扫描报告
没有YAML配置,没有API Key管理,没有Docker容器。工具自动探测~/.openclaw目录,通过fs.watch()监听会话文件变化,内存占用不到30MB。Node.js 22+的native file system API保证了跨平台效率,macOS和Linux上延迟低于100ms。至于Windows用户,暂时只能在WSL2下完美运行。
核心功能:从status到top的完整工具链
clawprobe status:Agent的"CT扫描报告"
这不是简单的状态查询,而是一次完整的数据采集与分析。执行瞬间,工具会:
- 读取当前会话的
session.json获取元数据 - 解析
conversation.log计算Token流速 - 扫描
context/目录估算窗口占用 - 查询内置定价数据库(每日自动更新)计算成本
- 运行启发式规则检测异常
输出的是一张信息密度极高的诊断报告:
📊 Agent Status (active session)
──────────────────────────────────────────────────
Agent: main
Session: agent:main:workspace:direct:xxx ●
Model: moonshot/kimi-k2.5
Active: Today 16:41 Compacts: 2
Context: 87.3K / 200.0K tokens ███████░░░ 44%
Tokens: 72.4K in / 5.2K out
Today: $0.12 → clawprobe cost for full breakdown
🟡 Context window at 44% capacity
→ Consider starting a fresh session or manually compacting now
注意那个Compacts: 2——它告诉你上下文已经被压缩过两次,部分历史对话已丢失。如果你发现Agent行为异常,这通常是第一个线索。
clawprobe top:专为长程任务设计的htop
调试Claude 3.7的代理式任务时,你需要持续观察。top命令提供了2秒刷新频率的实时仪表盘,用ASCII字符画出现场感:
clawprobe top refreshing every 2s (q / Ctrl+C to quit) 03/18/2026 17:42:35
────────────────────────────────────────────────────────────────────────────────
Agent: main ● daemon running
Session: agent:main:workspace:direct:xxx ● active
Model: moonshot/kimi-k2.5
Active: Today 17:42 Compacts: 2
────────────────────────────────────────────────────────────────────────────────
Context ████████░░░░░░░░░░░░░░░░ 44% 87.3K / 200.0K tokens
Headroom 112.7K tokens remaining (56%)
────────────────────────────────────────────────────────────────────────────────
Session cost $0.52 Input 859.2K tok Output 29.8K tok
Today total $0.67 Cache read 712.0K tok
────────────────────────────────────────────────────────────────────────────────
Recent turns
Turn Time ΔInput ΔOutput Cost Note
27 17:42 22.0K 908 $0.0094 ← latest
26 17:19 990 630 $0.0026
25 17:19 20.4K 661 $0.0094
24 15:57 564 39 $0.0014
23 15:56 18.8K 231 $0.0076 ◆ compact
────────────────────────────────────────────────────────────────────────────────
🟡 Context window at 44% capacity
Costs are estimates based on public pricing.
关键洞察在Recent turns表格:第23轮发生了compact,第25轮输入暴增20.4K tokens。如果Agent此时行为异常,你就知道是压缩导致的上下文断裂。这种可重放的调试能力,在生产环境排错时价值千金。
clawprobe cost:API账单的"实时审计"
Claude 3.7的200K上下文窗口很强大,但输入成本1M tokens,输出1M tokens。一个不小心,单日费用就能突破$50。cost命令提供了多维度成本分析:
💰 Weekly Cost 2026-03-12 – 2026-03-18
──────────────────────────────────────────────────
Total: $0.67
Daily avg: $0.096
Month est: $2.87
2026-03-16 ████████████████ $0.16
2026-03-17 █░░░░░░░░░░░░░░░ $0.0088
2026-03-18 ███░░░░░░░░░░░░░ $0.03
Input: 1.0M tokens $0.65 (97%)
Output: 47.8K tokens $0.03 (3%)
内置定价数据库每日从官方API同步,覆盖OpenAI、Anthropic、Google、Moonshot、DeepSeek等30+模型。对于私有化部署的模型,支持在~/.clawprobe/models.json中自定义定价。我们还计划接入MCP(Model Context Protocol)的定价元数据标准,一旦协议成熟,将实现自动化的模型成本发现。
clawprobe context:揪出静默截断的元凶
这是最具技术深度的功能。OpenClaw在加载工具定义时,如果TOOLS.md超过bootstrapMaxChars限制,会静默截断。Agent看不到完整工具描述,可能导致调用失败,但它不会告诉你"我看不到"。
🔍 Context Window agent: main
──────────────────────────────────────────────────
Used: 87.3K / 200.0K tokens ███████░░░ 44%
Workspace overhead: ~4.2K tokens (7 injected files)
Conversation est: ~83.1K tokens
⚠ TOOLS.md: 31% truncated — model never sees this content
Increase bootstrapMaxChars in openclaw.json to fix this
Remaining: 112.7K tokens (56%)
clawprobe通过静态分析workspace/目录下的注入文件,精确计算截断比例。这个检测在Agent启动时运行一次,发现截断立即告警。上周我们刚帮一个用户定位了Claude 3.7连续调用失败的原因——他的TOOLS.md被截断了40%,模型根本看不到关键参数定义。
clawprobe compacts:审计上下文"遗忘"事件
每次compact都是一次信息丢失。这个功能让你看到Agent"失忆"的详细病历:
$ clawprobe compacts
📦 Compact Events last 5
──────────────────────────────────────────────────
#3 Today 16:22 [agent:main…] 3 messages
👤 "Can you add retry logic to the upload handler?"
🤖 "Done — added exponential backoff with 3 retries. The key change is in…"
→ Archive: clawprobe compacts --save 3
你可以用--save将关键对话归档到~/.clawprobe/archive/,供后续会话通过RAG召回。我们正在实验与mem0等向量记忆库集成,实现压缩事件的自动语义存档。
智能建议:规则引擎而非AI告警
suggest命令运行一组硬编码规则,避免LLM自省带来的额外成本:
- tools-truncation: 检测工具定义截断
- high-compact-freq: 30分钟内压缩超过2次
- context-headroom: 占用率>90%
- cost-spike: 今日费用>周均值2倍
- memory-bloat: MEMORY.md>10K tokens
规则文件在~/.clawprobe/rules.js中,支持热重载。你可以用JavaScript自定义业务规则,比如"当调用dangerous_tool超过5次时告警"。这比用PromQL简单,也比LLM判断可靠。
自我监控:Agent的"内省"能力
clawprobe最激进的特性是支持Agent自我监控。安装为Skill后,Agent可以读取自己的status --json输出:
{
"agent": "main",
"context_used": 87300,
"context_limit": 200000,
"today_cost": 0.67,
"compacts": 2,
"alerts": ["context-headroom"]
}
基于这些数据,Agent可以实现:
- 在成本>$5时主动请求用户确认
- 在上下文>80%时自动启动压缩
- 在工具截断时拒绝执行并报告
这是构建自我感知Agent的第一步。代码已开源在skills/clawprobe目录,欢迎PR改进决策逻辑。
性能与资源:比systemd服务更轻
clawprobe守护进程基于Node.js的fs.watch()和setInterval(),资源占用极低:
- CPU: <1% (仅文件变动时触发)
- Memory: ~28MB (缓存最近1000轮对话)
- Disk I/O: 仅读取OpenClaw日志,不写临时文件
- Network: 零流量(定价数据库更新除外)
对比方案:用Prometheus+Grafana监控OpenClaw,你需要:
- 修改OpenClaw源码注入metrics
- 部署node-exporter
- 配置Prometheus抓取规则
- 设计Grafana仪表盘
clawprobe用200行代码解决了这个问题。
开源与未来:社区驱动的路线图
项目采用MIT协议,GitHub地址:github.com/seekcontext/ClawProbe,欢迎大家试用、提PR,或将建议反馈在OceanBase社区「问答」板块。
v1.2.0版本将支持:
- 多会话监控: 同时追踪多个Agent实例
- WebSocket实时推送: 供自建仪表盘消费
- MCP协议集成: 从Model Context Protocol获取元数据
- 插件系统: 支持自定义指标采集
我们特别欢迎两类PR:
- 新增模型定价数据(特别是私有化部署模型)
- 优化差分算法,降低大文件解析CPU占用
最后的思考:透明度是Agent的"道德基础"
频繁更新的大模型正在将Agent能力推向新高度,但能力越强,失控风险越大。一个能自主调用工具、读写文件、消耗资源的Agent,如果缺乏透明度,本质上就是权限无限大的黑盒进程。clawprobe的出现,不仅是技术需求的满足,更是AI工程化的伦理要求——任何自主系统都必须可被观测、可被审计、可被约束。
现在,关闭那令人焦虑的OpenClaw终端,打开一个新的标签页:
npm install -g clawprobe
clawprobe start
clawprobe top
让你的小龙虾在玻璃缸里游泳,而不是在墨汁里挣扎。透明度,从这一行命令开始。
本周六(3.28)来中关村现场装机,并听取一线创业者现场揭开他们的运营逻辑和盈利模型(含金量极高!)
