AI 编程的"黑箱"问题：你的 AI 编程工具到底在想什么？一个真实场景上周五晚上，我让 AI 帮我重构一段代码。前后

一个真实场景

上周五晚上，我让 AI 帮我重构一段代码。前后改了 7 版，最后一版看起来"刚好能用"，但我突然意识到一个问题——

我已经完全想不起来第一版长什么样、为什么改了。

AI 给我的代码，就像一个黑箱：我知道输入和输出，但中间发生了什么，我不知道。

问题的本质

这不是我一个人的困惑。

AI 编程工具越来越强大，但它们有一个共同特点：思考过程不可见。

目前主流的 AI 编程工具（Open Code、VS Code 插件，以及通过 MCP 协议连接的各种 AI 服务）都存在这个问题。

你问 AI 一个问题，它给你答案。但它为什么选这个方案？参考了哪些上下文？排除了哪些选项？

传统编程中，代码可以 Code Review——因为代码是确定的、可追溯的。

但 AI 编程，你的"同事"是 AI。它不写代码，它是"生成"代码。这个生成过程，对你是个黑箱。

一个具体例子

场景：你在做一个用户登录功能

AI 给你第一版代码

你问：能不能加个记住登录状态？

AI 给第二版

你问：session 还是 token？

AI 给第三版
...

7 轮对话后，你终于有了一个"能用"的登录功能。

**但一个月后，你需要修改这个功能。 **

你打开代码，看到了第三版的实现。但你不知道的是：

第一版其实是 Token 方案，被 AI 否决了（为什么？）
中间有一版测试失败了（什么原因？）

你面对的是一个"最终版本"，但完全不知道它的演进过程。

AgentLog 的思路

我开始思考一个问题：能不能给 AI 编程过程装一个"黑匣子"？

这就是 AgentLog 最初的想法。

AgentLog 是一个 AI 编程辅助工具，核心功能是记录 AI 编程的全过程：

思考过程捕获：DeepSeek-R1 等推理模型的思考链完整保存

工具调用记录：AI 调用了哪些工具、传了什么参数、返回了什么结果

Git Commit 绑定：每一次代码变更，绑定对应的 AI 会话

Trace Handoff：在多个 AI 会话之间切换时，上下文可以无缝衔接

概要生成 & 周报：自动从会话数据生成工作汇报

支持的工具

agentlog-auto（Open Code 插件）

专为 Open Code 开发的 AgentLog 插件，自动收集 Open Code 与 AI 的交互数据，存入本地 agentlog 后端。

OpenClaw 插件（openclaw-agentlog Skill）

通过 OpenClaw Skill 机制，提供完整的全链路存证能力：

全链路 Hooks、Reasoning 捕获、Tool Call 完整记录

Trace Handoff、Git Commit Binding

概要生成 & 周报

主要功能一览

功能	说明
全链路 Hooks	session_start、before_tool_call、after_tool_call、llm_output、agent_end
Reasoning 捕获	DeepSeek-R1 等推理模型的思考链完整保存
工具调用记录	工具名、参数、返回值、调用时间
Git Commit Binding	代码变更自动绑定 AI 会话
Trace Handoff	会话切换时上下文无缝衔接
概要生成 & 周报	自动从会话数据生成工作汇报

实际效果

**PR Review 时间：从 1 小时缩短到 5 分钟 **

传统方式：打开 PR → 翻聊天记录 → 回忆上下文 → 猜 AI 为什么这样写 → 终于开始 Review

使用 AgentLog：打开侧边栏 → 找到 Trace → 直接看到 AI 的完整思考过程 → 开始 Review

适用人群

场景	为什么需要
PR Review	不再需要猜测 AI 为什么这样写
团队协作	新成员可以理解 AI 的决策上下文
合规审计	AI 操作记录可追溯
个人复盘	找到 AI 编程的 pattern，下次更快
工作汇报	自动生成周报，无需手动整理

如何开始

Open Code 用户：在 Open Code 市场搜索 "agentlog auto" 安装插件

OpenClaw 用户：clawhub install agentlog

GitHub：github.com/AgentLogLabs

写在最后

AI 编程工具越来越强大，但它们也变得越来越不透明。

我们花了大量时间让 AI 理解我们，但谁来理解 AI？

AgentLog 试图回答这个问题：记录 AI 的思考过程，让它变得可见、可追溯、可复用。

这不是为了"监控"AI，而是为了更好地与 AI 协作——就像传统代码的 Code Review 一样，只是现在 Review 的是 AI 的思考过程。

未来的 AI 编程，不是"AI 写代码、人类用代码"，而是"人类和 AI 一起思考、一起决策"。AgentLog 正在让这个未来来得更快一些。

AI 编程的"黑箱"问题：你的 AI 编程工具到底在想什么？