OpenClaw 安全保险箱 ClawVault:让 AI Agent 能被看见、被限制、被审计

3 阅读3分钟

很多 AI Agent 项目在 Demo 阶段都很顺:模型接上了、工具调用通了、业务流程也能跑起来。

但一旦开始进入真实环境,问题就会变得非常具体:

  • 这次请求到底经过了哪些模型和接口?
  • 哪个 Agent 访问了敏感信息?
  • 有没有出现 Prompt Injection、危险命令或者敏感数据外泄?
  • token 成本有没有超出日预算?

最近看了一个开源项目 ClawVault,它在 README 里的定位其实很鲜明:这是一个 OpenClaw Security Vault,想做的是像“AI 安全保险箱”一样,把 agent 的关键调用、能力边界和安全策略收进统一入口里。

根据仓库 README,目前它明确给出的定位是:

  • Visual Monitoring:做 AI agent 和模型调用的可视化监控
  • Atomic Control:对 agent 能力和权限做更细粒度的控制
  • Generative Policies:通过自然语言生成和调整安全策略

相比一些只强调“可观测性”的工具,ClawVault 在仓库里写得比较明确的点,是它把“看见、检测、限制、记录”放在了一套链路里。

从 README 里能直接看到什么?

1. 它不是抽象概念,仓库里已经给了明确功能边界

README 里列出的能力包括:

  • 敏感数据检测
  • Prompt Injection 防御
  • 危险命令拦截
  • 自动脱敏
  • token 预算控制
  • 实时 Dashboard

也就是说,它关注的不只是“模型调用日志”,而是更偏运行时安全与治理。

2. 它给了清晰的接入思路

README 里的核心架构是:

  • Transparent Proxy Gateway:在 AI 工具与外部 API 之间做透明代理
  • Detection Engine:识别敏感数据、注入模式、危险命令
  • Guard / Sanitizer:执行 allow / block / sanitize
  • Audit + Monitor:记录审计信息和 token budget
  • Dashboard:提供 Web UI 查看配置和检测结果

这个思路的价值在于:它不是要求你把所有安全逻辑散落写进业务代码,而是尽量把监控、检测、控制收拢到统一层里。

3. 它确实给了可运行的命令和配置示例

README 里有直接可引用的 Quick Start:

pip install -e .
clawvault start
clawvault scan "password=MySecret key=sk-proj-abc123"
clawvault demo

配置示例也很具体:

proxy:
  port: 8765
  intercept_hosts: ["api.openai.com", "api.anthropic.com"]

guard:
  mode: "interactive"

monitor:
  daily_token_budget: 50000

这些信息比泛泛说“可观测”“可治理”更重要,因为它至少说明项目在仓库层面已经把代理、策略模式、预算控制这些入口摆出来了。

block-tui.png

block-web.png

我觉得这个项目值得关注的点

如果只看 README,目前最值得关注的不是“它什么都做了”,而是它把 AI 应用安全拆成了几块相对清晰的能力:

  • 看见什么发生了:监控 agent 和模型调用
  • 识别哪些行为有风险:敏感数据、注入、危险命令
  • 决定怎么处理:允许、拦截、脱敏
  • 限制成本边界:token budget 控制
  • 通过统一界面管理:Dashboard

对很多已经在做 AI 应用落地的团队来说,这种“控制层”思路会比单点 guardrail 更接近工程现实。

当前阶段也要实话实说

README 里也明确写了开发进展:

  • API Gateway Monitoring & Interception:已实现
  • File-side Monitoring:进行中
  • Agent-level Atomic Control:进行中
  • Generative Policy Orchestration:进行中

这一点反而让我觉得信息更可信。因为它没有把所有能力都写成“已经完全成熟”,而是把哪些已落地、哪些还在扩展写得比较清楚。

适合谁看

如果你正在做这些事情,可以重点看看:

  • AI Agent 调用外部 API,需要统一流量入口
  • 想给模型调用增加检测、拦截和脱敏
  • 想按天限制 token 预算
  • 想把安全策略和调用监控放在一个界面里管理

项目地址: github.com/tophant-ai/…

如果你已经在做生产环境 AI 应用,我觉得一个值得讨论的问题是: 你现在最缺的是日志可见性、风险检测能力,还是对 agent 行为的细粒度控制?