拆解 colleague-skill:把离职同事「蒸馏」成 Agent,这事靠谱吗?

0 阅读8分钟

拆解 colleague-skill:把离职同事「蒸馏」成 Agent,这事靠谱吗?

最近技术圈在聊一件好玩的事:把人「蒸馏」成 Agent。

思路非常直白:既然我们可以让 AI 扮演特定的虚拟角色,为什么不直接把某个同事、前辈或者资深专家封装进一个可复用的 Agent 里?

colleague-skill 就是这套思路的典型工程实现。它在 GitHub 上已经拿到大几千的 star,支持 Claude Code 和 OpenClaw 服务,并且自带了一套完整的语料采集脚本与提示词工程。

这篇文章就来拆一拆这个项目:它到底是怎么跑的、有什么值得我们抄的亮点,以及面对真实业务环境时,它哪里没那么神。

解决什么痛点

假设一个干了两三年的核心研发突然提了离职。哪个微服务接口有并发坑、跨部门的周会该找谁定时间、那个老旧系统的处理边界在哪——这些经验极少会落在内部 Wiki 里面,仅靠最后一周的交接会议根本当面说不清楚。

常规的代码和文档交接有章可循。团队层面最难传承的资产,始终是这些靠长期踩坑积累下来的隐性知识。

colleague-skill 尝试给出一个新解法:趁着这个人彻底离开前,把他的知识库和工作习惯一次性打包成一个 Skill。以后团队遇到不懂的历史包袱,可以直接去问他的 AI 分身。

这个切入点非常准。

具体该怎么用

它目前的形态是一组纯命令行的脚本工具链,深度绑定在开发者的本地终端环境里。

标准的工作流相对明确:

第一步是收集语料。飞书用户可以直接运行自带的 Python 脚本拉取历史对话数据;至于钉钉文档或零散的 PDF 会议记录,则需要手动建个本地文件夹统一归档。

第二步是初始设定。在终端录入定调角色的三个核心特征(唤醒代号、职位说明、性格底色)。

最后是模型处理。全盘投喂语料并跑通两套内置分析模版后,本地会产出一个独立结构化的 SKILL.md 文件。

配置生效体验最为顺手的是直接结合 Claude Code 这类终端 Agent。把产出的 Skill 文件扔进本地开发目录即可。当你看日志遇到一段毫无头绪的死锁异常栈卡住时,直接在终端敲类似这样的求助命令:

claude "加载大卫的 skill 帮我看一眼这个网关报错。按他平时的路子,排查这一段的高峰挂起往往要先看哪张表?"

接收到唤醒指令的模型会瞬间挂载几百条行为规则逻辑树,结合现场错误代码上下文,用类似大卫本尊挑剔却一针见血的特殊口吻,抛回一条查错建议。

技术架构怎么跑

项目把流程拆成了明确的三步。

第一步是信息采集(Intake)。

系统会预设三个问题来建立基础人物档案:唤醒代号、公司职责,以及性格标签。

性格标签库覆盖了 MBTI、职场行事作风,还收录了「字节范」「阿里味」这类具体的企业文化特征。这步的设定目的在于:职位圈定了他的能力边界,而文化标签约束了他干活的实际风格。

第二步是导入语料。

它支持的数据源非常全面:飞书群聊、钉钉文档、Slack 记录、本地邮件文件,甚至可以直接把 PDF 文档和聊天截图拖进去吃掉。

其中飞书的路径打磨得最为省心,自带专用的 Python 脚本通过 API 把历史消息抓下来。Slack 虽然也有接入方案,但免费版 API 强限制会被卡在 90 天前的时间线。钉钉部分则依赖浏览器端的人工抓取。

第三步是深度分析与生成。

语料进来后,进入两条并行的分析轨道:

  • work_analyzer.md 提取硬性工作能力。包括这名员工负责过的主力系统、高频工作流、处理线上故障的排查路径,甚至涵盖了代码风格习惯。
  • persona_analyzer.md 提炼软性行为模式。包括表达用词惯用句法、日常决策逻辑、跨层级沟通颗粒度差异,还有他本人的业务雷区。

汇集两路维度的分析,系统便能跑出 work_builder.mdpersona_builder.md 的结果输出,最终组合拼接成一个包揽 work.mdpersona.mdmeta.json 的完整 Skill 资源包。

核心亮点:Persona 的 5 层设计

只看 GitHub 上的 README,容易把它当成简单的套皮对话总结脚本。但翻开源码里的 prompts/persona_builder.md,这套项目真正的工程含金量全在对 Persona(人物画像)的细粒度拆解上:

  • Layer 0(最高优先级):把定性的性格与文化形容词,强制落地为核心行动守则。举例,「字节范」在这里直接体现为了实际动作指令:半夜被圈也回消息、群聊直奔主题、强调数据支撑。
  • Layer 1:基础静态身份数据(姓名、特定技术职位、MBTI 属性)。
  • Layer 2:表达风格细节映射(常用口头禅、emoji 偏好频率、在群聊与公文间的语气切换标准)。
  • Layer 3:思考决策逻辑框架(遇到新任务时他在意什么、什么因素能推动他推进落实、什么事项会被搁置、面对同行质疑的第一反应)。
  • Layer 4:人际网络沟通模式(对老板、平级、下属的真实术语沟通带离,以及高压挂盘时的应激表现)。
  • Layer 5:红线敏感边界与老手避坑雷区(绝对防备触碰的祖传烂代码与一套惯用推脱话术)。

这套设计打通了角色扮演类提示工程常踩的深坑:把泛化的形容词,强行转换为了机器可执行的规范动作指令。

普通的提示词经常这么写:“他是个较真的完美主义者。”但这太虚无缥缈,AI 其实搞不懂“完美主义者”在实际看别人的代码或写业务文档时到底该做什么动作。

colleague-skill 做了示范级别的参数转换:明确要求大模型将其抽象概念具象化为“项目联调前必定在本地走通三遍主干链,看别人的 PR 代码时死磕所有 TODO 标记”。这相当于给模型配发了一本清晰明了的操作手册。

局限性与适用场景建议

抛开“蒸馏”这层概念包装,这套脚本本质上也是一组重度依赖前端大长文本窗口的结构化提示词系统。这也决定了它在现实应用里有几道很难跨过的边界:

  1. 能复制做事风格,无法复用业务判断。 大模型能迅速抓住可见的工作流处理习惯,但那个资深主程靠线下试错积累起来、却从未落在文字纪要里的隐形业务直觉和拉扯抉择,脚本压根无从触达。
  2. 极度依赖文字沉淀底色质量。 倘若当事人的核心工作习惯就是线下口头面磕、极少长篇输出飞书技术文档,吐出来的模型基础规则就会显得极干瘪,甚至会触发语料过低报错阻塞。
  3. 后期的隐形维护成本高昂。 人走茶凉,一般正常带业务压力的研发组,很难有空跑出多余带宽长期刻意“饲养”跟进修正一个已离职的大牛本地数据分身。

如果将期望值从“完美续写并复刻前同事业务脑”主动下调为“带专业特定口吻记忆视角的日志知识检索引擎”,它的实用性在以下三个业务口子上立竿见影:

  • 新人入职的一线兜底助手(Onboarding): 给手忙脚乱的新接手同学快速过一遍那段连带隐秘关联的老项目前世今生,防抓瞎的效果十分明显。
  • 定向榨取「重度文字输出者」价值池: 针对那些酷爱发飞书深长复盘长文卷技术、或在 MR 里爱留上百行评审意见的高段位同事,靠跑脚本文本脱水出来的行事准度基本能达到以假乱真的有效程度。
  • 直接拿走核心的 Persona 工程框架: 即便你手头上不想留存任何前同事的 AI 残影,源码中把“企业文化”揉进机器可执行条件的逻辑树提示语套壳架构设计,完全可以抽离借用于各种私部的虚拟化角色类辅助场景设计里。