问GLM-5你是谁它说我是Claude有人问GLM-5：你是谁？它回答：我是Claude，由Anthropic开发。

有人问GLM-5：你是谁？它回答：我是Claude，由Anthropic开发。

不是段子。不是P图。是真实的模型输出。

我第一次刷到这截图，还以为是P的。反复确认了三遍。

就在智谱股价两天涨近60%之后。就在他们刚宣布"GLM-5是开源最强"之后。

模型自己说了：我不是GLM，我是Claude。

但越想越不对劲。

全网都在吹GLM-5多猛。编程碾压、推理碾压，评测全是绿的。我也试了，确实能打。

但有件事一直卡在我脑子里，不吐不快。

怎么发现的

Pony Alpha

2月6号，OpenRouter上突然出现了一个神秘模型，叫Pony Alpha。

没人认领。免费使用。200K上下文。

一上线就炸了——编程能力碾压一众开源模型，直逼Claude Opus 4.5。

全球AI社区开始"猜爹大赛"。

有人猜是Grok。有人猜是DeepSeek。有人猜是某个实验室的秘密项目。

怎么验证的？有人改了OpenRouter的系统提示，直接问它：你是什么模型？

它说：我是GLM。

好，那就是智谱的。

但换一种问法呢？让它写个网页，网页里有个"关于"页面，介绍一下自己。

这次它写的是：我是Claude，由Anthropic开发。

同一个模型。两种回答。

身份测试

2月11号，智谱官方认领了Pony Alpha——它就是GLM-5。"Pony"是马年彩蛋。

但没人解释，为什么它觉得自己是Claude。

网上炸了

这事一传开，评论区直接炸了。

有人说："问它是谁，它说是GLM。让它做网页介绍自己，它写Claude。这叫什么？精神分裂。"

有人更损："白天是GLM，晚上是Claude。打工人都没这么能演。"

还有开发者去翻了vLLM框架的代码提交，发现GLM-5的实现逻辑被直接映射到了DeepSeek-V3的组件上——稀疏注意力、多Token预测，全是DeepSeek的技术。

架构借DeepSeek的，输出像Claude的。那GLM-5自己的东西是什么？

这个问题没人回答。

也有人觉得没必要上纲上线。"好用就行，管它学谁的。"

确实，Pony Alpha上线第一天就处理了400多亿tokens，20多万次请求。价格只有Claude的十分之一。

便宜、能打、开源。你还要什么？

但也有人反驳："便宜是因为没算研发成本。研发成本在Anthropic那边呢。"

这话说得挺狠的。

不只是名字的问题

蒸馏研究

如果只是名字搞混了，那就是个bug，改改就行。

但事情没那么简单。我顺着这条线往下查了查。

有人做了更多测试——GLM-5的输出风格跟Claude高度相似。

逻辑结构、细节丰富度、甚至敏感话题的拒绝方式，都像。

中科院和北大联合发了一篇论文，专门量化各家模型的"蒸馏程度"。

结论？

除了Claude、豆包、Gemini，大部分开源和闭源模型的蒸馏程度都过高。

什么是蒸馏？简单说，就是用一个强模型的输出来训练另一个模型。

像不像抄作业？答案写得一模一样，但你跟老师说这是"独立完成"的。

这篇论文让我想了很久。

它的意思是——你把市面上的主流模型排一排，真正"干净"的就那么几个。Claude、豆包、Gemini。

剩下的？或多或少，都从别家那儿"借"了东西。

这不是个别现象。这是行业常态。

但没人公开讨论。因为一讨论，大家就都不体面了。

不是第一个

蒸馏争议

GLM-5不是第一个搞混身份的。

DeepSeek V3当初也一样——有人问它是谁，它说自己是ChatGPT，还坚持说自己是GPT-4。

OpenAI当时直接指控DeepSeek"蒸馏"了自家模型，还修改了使用条款，加入了"反竞争蒸馏"条款。

Anthropic、Mistral、xAI全都跟进了。

整个行业都在防同一件事：别拿我的模型输出去训练你的模型。

但防得住吗？

你用Claude API生成100万条数据，拿去训练自己的模型，谁知道？

说句难听的——这就是AI行业最大的公开秘密。每个人都在蒸馏，只是没人承认。

你想想这个逻辑——A蒸馏B，C也蒸馏B，D还是蒸馏B。最后市面上一堆模型，底层思维全来自同一个源头。

这不叫百花齐放。这叫集体复制。

行业同质化

我有时候想——把所有模型的外壳扒掉，底下到底有几种真正不同的"思维方式"？

可能比你以为的少得多。

你觉得你在十个模型里挑最好的。但其中七个的"大脑"，可能都来自同一个地方。

蒸馏最狠的地方在哪？不是某个模型变差了。是整个行业的多样性没了。

所有模型越来越像。像同一个东西。

那竞争还有什么意义？

这才是你该担心的

信任问题

好，有人会说：管它抄不抄呢，好用就行。

短期看，确实没毛病。

但我在意的是另一件事——蒸馏来的能力，边界在哪？

Claude能做的事，GLM-5大概也能做。但Claude做不到的事呢？GLM-5能自己突破吗？

还是说它的天花板，就是Claude的天花板？

如果是这样，那"开源最强"的意思就变成了——开源里最像Claude的。

这不叫创新。这叫高仿。

还有个事我一直在想——安全。

Claude有自己的安全训练。哪些事能做，哪些不能做，Anthropic花了很大功夫一点点调出来的。

能力可以蒸馏。但安全边界能完整蒸馏过来吗？我不确定。

如果能力搬过来了，安全约束只搬了一半——那比一个弱模型更让人担心。

再说一个更实际的问题——

一个模型连自己是谁都搞不清楚，你敢信它写的代码？

你让它帮你写一个支付接口。它写出来了，逻辑看着没问题。

但你选GLM-5的理由是什么？开源、便宜、不想依赖Anthropic？

如果它骨子里就是个Claude的影子，那你并没有摆脱依赖。你只是用了一个更差的版本。

再想远一点——模型脑子里混着别家的"思维模式"。它说的话，你还能信吗？

它说"这段代码是安全的"。这个判断来自哪里？

来自GLM-5自己？还是来自它蒸馏过来的、它自己都不知道的Claude？

你以为你在用GLM-5。但GLM-5自己都不确定它是GLM-5。

这不是在扯哲学。这是实打实的信任问题。

想想看

智谱的GLM-5，7450亿参数的MoE模型。

"自主研发"。"国产替代"。"开源最强"。

股价两天涨近60%。投资者在为"自主创新"买单。

然后模型自己说：我是Claude。

我说说我的看法。

我不反对蒸馏。站在前人肩上做东西，没什么丢人的。

开源社区本来就是这么运转的。

但你不能一边蒸馏，一边喊自主研发。这两件事不能同时成立。

投资者花真金白银，买的是"自主创新"的故事。如果故事的底层是别人的模型输出，那他们买的到底是什么？

我真正在意的不是抄没抄。是诚不诚实。

蒸馏了就说蒸馏了，大大方方的，没人看不起。

怕的是嘴上喊自主，底下用别人的。

再往大了说一句。

蒸馏可以是过渡手段。先学别人的，再慢慢建自己的，这条路没问题。

但如果把蒸馏当成了核心能力，那就是在别人的地基上盖楼。地基一动，楼就塌。

今天能用Claude API生成训练数据。明天API被掐了呢？

芯片已经被卡过一轮了。API这道门，随时可能关。

到那时候，"自主"模型连训练数据的源头都断了。拿什么迭代？

我不是说GLM-5一定是套壳。蒸馏和套壳是两回事。

但当一个模型连自己是谁都搞不清，我们是不是该多问一句：

它还有什么是混乱的？

最后说一句

我是 Evan，每天追全球 AI 动态，用说人话的方式写出来。

如果上面的内容对你有帮助，真诚地希望你能点个关注。

这对我真的很重要。

对了，我有个AI交流群。

进群能干嘛？

• 我每天整理一份AI日报，你不用自己到处翻

• 新东西出了我会第一时间丢群里，大家一起聊

• 没广告，就图个信息互通

想进？点公众号主页 ==> 菜单栏「加群」

问GLM-5你是谁 它说我是Claude