Programs Beat Prompts: Tap 让 AI 把界面操作编译成确定性程序

1 阅读1分钟

问题

AI agent 每次操作界面都要花 $0.10、等 2-5 秒。每次都重新"思考"同一个问题。

洞察

操作界面是一个解决了就不用再解决的问题。难的是理解页面(AI 擅长),简单的是重复执行(不需要 AI)。

Tap: 锻造一次,永久运行

forge_inspect → forge_verify → forge_save → tap.run
   AI 分析       AI 验证       AI 保存     $0 永久运行

协议

8 个 core 操作 + 17 个 built-in 操作。一个程序跑在 Chrome 扩展、Playwright、macOS 三个运行时上。

Unix 管道

tap github trending | tap tap/filter --field stars --gt 1000
tap watch github trending --every 5m

自动 TTY 检测,管道不需要任何 flag。

自愈

tap doctor
  ✔ github/trending     score=1.0  25 rows (180ms)
  ✘ douyin/hot           score=0.0  0 rows

安全:三层防御

  1. 沙箱 — Deno Worker,零权限
  2. 静态分析 — 7 个 CI 安全检查
  3. 数据隔离 — .gitignore 屏蔽秘密,无 git remote

v0.5.0

  • 202 个约束测试定义产品(safety + quality + principle)
  • tap doctor — 自愈健康检查
  • tap contribute — PR 流程贡献社区
  • tap watch — 监控变化,时间维度
  • Forge 捕获真实 API 流量用于精准策略
  • 106 个技能覆盖 50+ 网站

GitHub: github.com/LeonTing101…

本文通过 Tap 自身发布(juejin/publish tap)