有人问GLM-5:你是谁? 它回答:我是Claude,由Anthropic开发。
不是段子。不是P图。是真实的模型输出。
我第一次刷到这截图,还以为是P的。反复确认了三遍。
就在智谱股价两天涨近60%之后。就在他们刚宣布"GLM-5是开源最强"之后。
模型自己说了:我不是GLM,我是Claude。
但越想越不对劲。
全网都在吹GLM-5多猛。编程碾压、推理碾压,评测全是绿的。我也试了,确实能打。
但有件事一直卡在我脑子里,不吐不快。
怎么发现的
2月6号,OpenRouter上突然出现了一个神秘模型,叫Pony Alpha。
没人认领。免费使用。200K上下文。
一上线就炸了——编程能力碾压一众开源模型,直逼Claude Opus 4.5。
全球AI社区开始"猜爹大赛"。
有人猜是Grok。有人猜是DeepSeek。有人猜是某个实验室的秘密项目。
怎么验证的?有人改了OpenRouter的系统提示,直接问它:你是什么模型?
它说:我是GLM。
好,那就是智谱的。
但换一种问法呢?让它写个网页,网页里有个"关于"页面,介绍一下自己。
这次它写的是:我是Claude,由Anthropic开发。
同一个模型。两种回答。
2月11号,智谱官方认领了Pony Alpha——它就是GLM-5。"Pony"是马年彩蛋。
但没人解释,为什么它觉得自己是Claude。
网上炸了
这事一传开,评论区直接炸了。
有人说:"问它是谁,它说是GLM。让它做网页介绍自己,它写Claude。这叫什么?精神分裂。"
有人更损:"白天是GLM,晚上是Claude。打工人都没这么能演。"
还有开发者去翻了vLLM框架的代码提交,发现GLM-5的实现逻辑被直接映射到了DeepSeek-V3的组件上——稀疏注意力、多Token预测,全是DeepSeek的技术。
架构借DeepSeek的,输出像Claude的。那GLM-5自己的东西是什么?
这个问题没人回答。
也有人觉得没必要上纲上线。"好用就行,管它学谁的。"
确实,Pony Alpha上线第一天就处理了400多亿tokens,20多万次请求。价格只有Claude的十分之一。
便宜、能打、开源。你还要什么?
但也有人反驳:"便宜是因为没算研发成本。研发成本在Anthropic那边呢。"
这话说得挺狠的。
不只是名字的问题
如果只是名字搞混了,那就是个bug,改改就行。
但事情没那么简单。我顺着这条线往下查了查。
有人做了更多测试——GLM-5的输出风格跟Claude高度相似。
逻辑结构、细节丰富度、甚至敏感话题的拒绝方式,都像。
中科院和北大联合发了一篇论文,专门量化各家模型的"蒸馏程度"。
结论?
除了Claude、豆包、Gemini,大部分开源和闭源模型的蒸馏程度都过高。
什么是蒸馏?简单说,就是用一个强模型的输出来训练另一个模型。
像不像抄作业?答案写得一模一样,但你跟老师说这是"独立完成"的。
这篇论文让我想了很久。
它的意思是——你把市面上的主流模型排一排,真正"干净"的就那么几个。Claude、豆包、Gemini。
剩下的?或多或少,都从别家那儿"借"了东西。
这不是个别现象。这是行业常态。
但没人公开讨论。因为一讨论,大家就都不体面了。
不是第一个
GLM-5不是第一个搞混身份的。
DeepSeek V3当初也一样——有人问它是谁,它说自己是ChatGPT,还坚持说自己是GPT-4。
OpenAI当时直接指控DeepSeek"蒸馏"了自家模型,还修改了使用条款,加入了"反竞争蒸馏"条款。
Anthropic、Mistral、xAI全都跟进了。
整个行业都在防同一件事:别拿我的模型输出去训练你的模型。
但防得住吗?
你用Claude API生成100万条数据,拿去训练自己的模型,谁知道?
说句难听的——这就是AI行业最大的公开秘密。每个人都在蒸馏,只是没人承认。
你想想这个逻辑——A蒸馏B,C也蒸馏B,D还是蒸馏B。最后市面上一堆模型,底层思维全来自同一个源头。
这不叫百花齐放。这叫集体复制。
我有时候想——把所有模型的外壳扒掉,底下到底有几种真正不同的"思维方式"?
可能比你以为的少得多。
你觉得你在十个模型里挑最好的。但其中七个的"大脑",可能都来自同一个地方。
蒸馏最狠的地方在哪?不是某个模型变差了。是整个行业的多样性没了。
所有模型越来越像。像同一个东西。
那竞争还有什么意义?
这才是你该担心的
好,有人会说:管它抄不抄呢,好用就行。
短期看,确实没毛病。
但我在意的是另一件事——蒸馏来的能力,边界在哪?
Claude能做的事,GLM-5大概也能做。但Claude做不到的事呢?GLM-5能自己突破吗?
还是说它的天花板,就是Claude的天花板?
如果是这样,那"开源最强"的意思就变成了——开源里最像Claude的。
这不叫创新。这叫高仿。
还有个事我一直在想——安全。
Claude有自己的安全训练。哪些事能做,哪些不能做,Anthropic花了很大功夫一点点调出来的。
能力可以蒸馏。但安全边界能完整蒸馏过来吗?我不确定。
如果能力搬过来了,安全约束只搬了一半——那比一个弱模型更让人担心。
再说一个更实际的问题——
一个模型连自己是谁都搞不清楚,你敢信它写的代码?
你让它帮你写一个支付接口。它写出来了,逻辑看着没问题。
但你选GLM-5的理由是什么?开源、便宜、不想依赖Anthropic?
如果它骨子里就是个Claude的影子,那你并没有摆脱依赖。你只是用了一个更差的版本。
再想远一点——模型脑子里混着别家的"思维模式"。它说的话,你还能信吗?
它说"这段代码是安全的"。这个判断来自哪里?
来自GLM-5自己?还是来自它蒸馏过来的、它自己都不知道的Claude?
你以为你在用GLM-5。但GLM-5自己都不确定它是GLM-5。
这不是在扯哲学。这是实打实的信任问题。
想想看
智谱的GLM-5,7450亿参数的MoE模型。
"自主研发"。"国产替代"。"开源最强"。
股价两天涨近60%。投资者在为"自主创新"买单。
然后模型自己说:我是Claude。
我说说我的看法。
我不反对蒸馏。站在前人肩上做东西,没什么丢人的。
开源社区本来就是这么运转的。
但你不能一边蒸馏,一边喊自主研发。这两件事不能同时成立。
投资者花真金白银,买的是"自主创新"的故事。如果故事的底层是别人的模型输出,那他们买的到底是什么?
我真正在意的不是抄没抄。是诚不诚实。
蒸馏了就说蒸馏了,大大方方的,没人看不起。
怕的是嘴上喊自主,底下用别人的。
再往大了说一句。
蒸馏可以是过渡手段。先学别人的,再慢慢建自己的,这条路没问题。
但如果把蒸馏当成了核心能力,那就是在别人的地基上盖楼。地基一动,楼就塌。
今天能用Claude API生成训练数据。明天API被掐了呢?
芯片已经被卡过一轮了。API这道门,随时可能关。
到那时候,"自主"模型连训练数据的源头都断了。拿什么迭代?
我不是说GLM-5一定是套壳。蒸馏和套壳是两回事。
但当一个模型连自己是谁都搞不清,我们是不是该多问一句:
它还有什么是混乱的?
最后说一句
我是 Evan,每天追全球 AI 动态,用说人话的方式写出来。
如果上面的内容对你有帮助,真诚地希望你能点个关注。
这对我真的很重要。
对了,我有个AI交流群。
进群能干嘛?
• 我每天整理一份AI日报,你不用自己到处翻
• 新东西出了我会第一时间丢群里,大家一起聊
• 没广告,就图个信息互通
想进?点公众号主页 ==> 菜单栏「加群」