AI 编程的"黑箱"问题:你的 AI 编程工具到底在想什么?

6 阅读4分钟

一个真实场景

上周五晚上,我让 AI 帮我重构一段代码。前后改了 7 版,最后一版看起来"刚好能用",但我突然意识到一个问题——

我已经完全想不起来第一版长什么样、为什么改了。

AI 给我的代码,就像一个黑箱:我知道输入和输出,但中间发生了什么,我不知道。

问题的本质

这不是我一个人的困惑。

AI 编程工具越来越强大,但它们有一个共同特点:思考过程不可见。

目前主流的 AI 编程工具(Open Code、VS Code 插件,以及通过 MCP 协议连接的各种 AI 服务)都存在这个问题。

你问 AI 一个问题,它给你答案。但它为什么选这个方案?参考了哪些上下文?排除了哪些选项?

传统编程中,代码可以 Code Review——因为代码是确定的、可追溯的。

但 AI 编程,你的"同事"是 AI。它不写代码,它是"生成"代码。这个生成过程,对你是个黑箱。

一个具体例子

场景:你在做一个用户登录功能

AI 给你第一版代码

你问:能不能加个记住登录状态?

AI 给第二版

你问:session 还是 token?

AI 给第三版
...

7 轮对话后,你终于有了一个"能用"的登录功能。

**但一个月后,你需要修改这个功能。 **

你打开代码,看到了第三版的实现。但你不知道的是:

  • 第一版其实是 Token 方案,被 AI 否决了(为什么?)

  • 中间有一版测试失败了(什么原因?)

你面对的是一个"最终版本",但完全不知道它的演进过程。

AgentLog 的思路

我开始思考一个问题:能不能给 AI 编程过程装一个"黑匣子"

这就是 AgentLog 最初的想法。

AgentLog 是一个 AI 编程辅助工具,核心功能是记录 AI 编程的全过程

  • 思考过程捕获:DeepSeek-R1 等推理模型的思考链完整保存
  • 工具调用记录:AI 调用了哪些工具、传了什么参数、返回了什么结果
  • Git Commit 绑定:每一次代码变更,绑定对应的 AI 会话
  • Trace Handoff:在多个 AI 会话之间切换时,上下文可以无缝衔接
  • 概要生成 & 周报:自动从会话数据生成工作汇报

支持的工具

  1. agentlog-auto(Open Code 插件)

专为 Open Code 开发的 AgentLog 插件,自动收集 Open Code 与 AI 的交互数据,存入本地 agentlog 后端。

  1. OpenClaw 插件(openclaw-agentlog Skill)

通过 OpenClaw Skill 机制,提供完整的全链路存证能力:

  • 全链路 Hooks、Reasoning 捕获、Tool Call 完整记录
  • Trace Handoff、Git Commit Binding
  • 概要生成 & 周报

主要功能一览

功能说明
全链路 Hookssession_start、before_tool_call、after_tool_call、llm_output、agent_end
Reasoning 捕获DeepSeek-R1 等推理模型的思考链完整保存
工具调用记录工具名、参数、返回值、调用时间
Git Commit Binding代码变更自动绑定 AI 会话
Trace Handoff会话切换时上下文无缝衔接
概要生成 & 周报自动从会话数据生成工作汇报

实际效果

**PR Review 时间:从 1 小时缩短到 5 分钟 **

传统方式:打开 PR → 翻聊天记录 → 回忆上下文 → 猜 AI 为什么这样写 → 终于开始 Review

使用 AgentLog:打开侧边栏 → 找到 Trace → 直接看到 AI 的完整思考过程 → 开始 Review

适用人群

场景为什么需要
PR Review不再需要猜测 AI 为什么这样写
团队协作新成员可以理解 AI 的决策上下文
合规审计AI 操作记录可追溯
个人复盘找到 AI 编程的 pattern,下次更快
工作汇报自动生成周报,无需手动整理

如何开始

  1. Open Code 用户:在 Open Code 市场搜索 "agentlog auto" 安装插件
  1. OpenClaw 用户:clawhub install agentlog
  1. GitHub:github.com/AgentLogLabs

写在最后

AI 编程工具越来越强大,但它们也变得越来越不透明。

我们花了大量时间让 AI 理解我们,但谁来理解 AI?

AgentLog 试图回答这个问题:记录 AI 的思考过程,让它变得可见、可追溯、可复用

这不是为了"监控"AI,而是为了更好地与 AI 协作——就像传统代码的 Code Review 一样,只是现在 Review 的是 AI 的思考过程。

未来的 AI 编程,不是"AI 写代码、人类用代码",而是"人类和 AI 一起思考、一起决策"。AgentLog 正在让这个未来来得更快一些。

相关链接:

  • GitHub:github.com/AgentLogLabs
  • 文档:agentloglabs.github.io/docs/intro