每日一个开源项目（第120篇）：SkillLens - 微软出品，照亮 AI Agent 技能生命周期的“显微镜”

引言

"不仅要让 Agent 拥有技能，更要弄清楚技能是如何被模型‘吸收’的。"

这是"一天一个开源项目"系列的第120篇文章。今天我们要介绍的是微软推出的 SkillLens。

如果说前两天介绍的 SkillOpt 是一套提升 AI 技能的执行策略，那么 SkillLens 就是研究这些技能演化过程的“显微镜”。它提供了一个科学的分析框架，帮助研究者和开发者理解：一个由 AI 自己总结出来的技能，究竟是怎么影响另一个 AI 的执行效率的？

SkillLens 是微软研究院的一个开源框架，专门用于系统性地研究“模型生成的 Agent 技能”。它提供了一套完整的流水线（Pipeline），涵盖了从轨迹加载、技能提取到推理验证的各个环节。

该项目在 GitHub 上随同论文《From Raw Experience to Skill Consumption》发布，是目前 Agent 技能研究领域最权威的工具之一。

将来自不同基准测试（如复杂的 SWE-bench 调试记录或简单的 ALFWorld 游戏日志）的原始运行轨迹转换为统一的 JSON Schema，让后续的批量技能提取成为可能。

SkillLens 的核心技术之一是其并行提取方法。它会分析每一条成功或失败的轨迹，提取出独立的 Mode，最后通过分层合并算法生成高概括性的 skill_set.json。

通过简单的 skilllens infer 命令，开发者可以一键对比“有技能注入”和“无技能注入”情况下 Agent 的成功率差异。

SkillLens 将每一次实验都标准化为四个阶段：

这种严谨的科研流程对于那些希望在其产品中集成“自我进化”功能的开发者来说，具有极高的参考价值。

如果说 SkillOpt 告诉我们“怎么做”，那么 SkillLens 则是在解释“为什么”。作为微软 Agent 研究生态的重要组成部分，SkillLens 为我们揭示了 AI 从自身经验中学习并转化成可执行知识的深层机理。

对于追求卓越性能的 Agent 开发者而言，SkillLens 提供的实证评估方法是不可或缺的导航灯塔。

欢迎来我的个人主页找到更多有用的知识和有趣的产品