我以为我赚米,其实我是碳基蒸馏器

4 阅读3分钟

我以为我赚米,其实我是碳基蒸馏器

之前 Anthropic 指责国内模型厂商 DeepSeek 搞模型蒸馏的事挺热闹的。网上吵得不可开交,各路大神都在引经据典。

但今天咱们不当理中客,不聊什么行业道德。我只想从前几天的一段亲身经历出发,说说蒸馏,到底是怎么挥向我们普通人的。


离谱的外包需求

故事发生在前几天。

当时我在副业群里潜水,突然刷到一个“巨无敌香”的帖子。单价极其诱人,而要求更是简单粗暴到让人不敢相信:“只要会 AI coding 就行。”

我一看就笑了。这年头,AI coding 不就是“有手就行、能打字会聊天”的代名词吗?我屁颠屁颠去了,给对方展示了一个我纯靠“Vibe Coding”出的项目。

对方看了看,就直接甩给了我第一道测试题。打开那个需求文档一看,我的 CPU 直接烧了: 题目要求我做一个**“离线系统”,但是要求“多身份登录”**。

我当时满脑子问号,怎么着,是打算让几个人围着一台没插网线的电脑,建几个号玩赛博 Cosplay 吗?有这功夫,大家线下买两瓶啤酒搞俩烧烤坐一块儿把话说明白不行吗?

但这还不算完。更逆天、更变态的要求在后面:在这个离线系统里,他居然要求实现**“评论、点赞、收藏”**功能。

一个纯离线的系统,你给我整网络社交的活儿?我直呼好家伙,简直是“如离”——离谱的离。

“我白嫖你?一单 500 到 800”

我强迫症发作了,我把这些极其不符合逻辑的顾虑全都倒给了对方。

对方听完说可以换一个题目。然而换了几个题,或多或少都有这种诡异的逻辑漏洞。

我感觉自己的智商受到了侮辱。我忍不住了,直接开怼:

“哥们儿,你是不是拿 AI 批量生成需求,来白嫖我的人脑算力,帮你检验到底哪些场景才是人类真实的业务逻辑?”

屏幕那头沉默了几秒,然后回了一条:

“我白嫖你?一单是 500 到 800 块钱。”

谁家好人花大几百块钱去测个废话需求?钱给到位了,那他到底在图谋什么。

双重蒸馏

我突然想起文档里,还有另一个隐蔽的交付需求:需要提交 Claude 或 Codex 完成项目的 JSON 记录。

那一刻我全明白了:

  • 他根本不在乎这个离线系统给谁用;
  • 他不在乎多身份登录是不是在搞 Cosplay;
  • 他真正想要的,根本不是一个“用 AI 做出来的项目”。

他想要的是一条用于蒸馏的 JSON 记录。

一条 JSON 记录,双重蒸馏啊:

  1. **第一重,蒸馏的是我。**是一个有真实开发经验的人类,在面对荒谬需求时的业务拆解逻辑;
  2. **第二重,蒸馏的是 Claude、Codex 这种顶尖 AI 模型。**是它们在接收到人类引导后,输出的深层推理链(CoT)、高阶的代码生成能力,以及底层的工具调用。

一切的交互过程,完完整整地打包,存成一个巨大的 JSON 文件交给他。

拿人脑逻辑打窝,去钓出顶尖大模型的 CoT,最后把我和模型的交互做一条蒸馏数据,拿回去喂给某家笨了吧唧的模型当十全大补汤。

而我,还会沾沾自喜,觉得自己赚到了。