一个真实场景
上周五晚上,我让 AI 帮我重构一段代码。前后改了 7 版,最后一版看起来"刚好能用",但我突然意识到一个问题——
我已经完全想不起来第一版长什么样、为什么改了。
AI 给我的代码,就像一个黑箱:我知道输入和输出,但中间发生了什么,我不知道。
问题的本质
这不是我一个人的困惑。
AI 编程工具越来越强大,但它们有一个共同特点:思考过程不可见。
目前主流的 AI 编程工具(Open Code、VS Code 插件,以及通过 MCP 协议连接的各种 AI 服务)都存在这个问题。
你问 AI 一个问题,它给你答案。但它为什么选这个方案?参考了哪些上下文?排除了哪些选项?
传统编程中,代码可以 Code Review——因为代码是确定的、可追溯的。
但 AI 编程,你的"同事"是 AI。它不写代码,它是"生成"代码。这个生成过程,对你是个黑箱。
一个具体例子
场景:你在做一个用户登录功能
AI 给你第一版代码
你问:能不能加个记住登录状态?
AI 给第二版
你问:session 还是 token?
AI 给第三版
...
7 轮对话后,你终于有了一个"能用"的登录功能。
**但一个月后,你需要修改这个功能。 **
你打开代码,看到了第三版的实现。但你不知道的是:
-
第一版其实是 Token 方案,被 AI 否决了(为什么?)
-
中间有一版测试失败了(什么原因?)
你面对的是一个"最终版本",但完全不知道它的演进过程。
AgentLog 的思路
我开始思考一个问题:能不能给 AI 编程过程装一个"黑匣子"?
这就是 AgentLog 最初的想法。
AgentLog 是一个 AI 编程辅助工具,核心功能是记录 AI 编程的全过程:
- 思考过程捕获:DeepSeek-R1 等推理模型的思考链完整保存
- 工具调用记录:AI 调用了哪些工具、传了什么参数、返回了什么结果
- Git Commit 绑定:每一次代码变更,绑定对应的 AI 会话
- Trace Handoff:在多个 AI 会话之间切换时,上下文可以无缝衔接
- 概要生成 & 周报:自动从会话数据生成工作汇报
支持的工具
- agentlog-auto(Open Code 插件)
专为 Open Code 开发的 AgentLog 插件,自动收集 Open Code 与 AI 的交互数据,存入本地 agentlog 后端。
- OpenClaw 插件(openclaw-agentlog Skill)
通过 OpenClaw Skill 机制,提供完整的全链路存证能力:
- 全链路 Hooks、Reasoning 捕获、Tool Call 完整记录
- Trace Handoff、Git Commit Binding
- 概要生成 & 周报
主要功能一览
| 功能 | 说明 |
|---|---|
| 全链路 Hooks | session_start、before_tool_call、after_tool_call、llm_output、agent_end |
| Reasoning 捕获 | DeepSeek-R1 等推理模型的思考链完整保存 |
| 工具调用记录 | 工具名、参数、返回值、调用时间 |
| Git Commit Binding | 代码变更自动绑定 AI 会话 |
| Trace Handoff | 会话切换时上下文无缝衔接 |
| 概要生成 & 周报 | 自动从会话数据生成工作汇报 |
实际效果
**PR Review 时间:从 1 小时缩短到 5 分钟 **
传统方式:打开 PR → 翻聊天记录 → 回忆上下文 → 猜 AI 为什么这样写 → 终于开始 Review
使用 AgentLog:打开侧边栏 → 找到 Trace → 直接看到 AI 的完整思考过程 → 开始 Review
适用人群
| 场景 | 为什么需要 |
|---|---|
| PR Review | 不再需要猜测 AI 为什么这样写 |
| 团队协作 | 新成员可以理解 AI 的决策上下文 |
| 合规审计 | AI 操作记录可追溯 |
| 个人复盘 | 找到 AI 编程的 pattern,下次更快 |
| 工作汇报 | 自动生成周报,无需手动整理 |
如何开始
- Open Code 用户:在 Open Code 市场搜索 "agentlog auto" 安装插件
- OpenClaw 用户:clawhub install agentlog
- GitHub:github.com/AgentLogLabs
写在最后
AI 编程工具越来越强大,但它们也变得越来越不透明。
我们花了大量时间让 AI 理解我们,但谁来理解 AI?
AgentLog 试图回答这个问题:记录 AI 的思考过程,让它变得可见、可追溯、可复用。
这不是为了"监控"AI,而是为了更好地与 AI 协作——就像传统代码的 Code Review 一样,只是现在 Review 的是 AI 的思考过程。
未来的 AI 编程,不是"AI 写代码、人类用代码",而是"人类和 AI 一起思考、一起决策"。AgentLog 正在让这个未来来得更快一些。
相关链接:
- GitHub:github.com/AgentLogLabs
- 文档:agentloglabs.github.io/docs/intro