问GLM-5你是谁 它说我是Claude

68 阅读7分钟

有人问GLM-5:你是谁? 它回答:我是Claude,由Anthropic开发。

不是段子。不是P图。是真实的模型输出。

封面

我第一次刷到这截图,还以为是P的。反复确认了三遍。

就在智谱股价两天涨近60%之后。就在他们刚宣布"GLM-5是开源最强"之后。

模型自己说了:我不是GLM,我是Claude。

但越想越不对劲。

全网都在吹GLM-5多猛。编程碾压、推理碾压,评测全是绿的。我也试了,确实能打。

但有件事一直卡在我脑子里,不吐不快。

怎么发现的

Pony Alpha

2月6号,OpenRouter上突然出现了一个神秘模型,叫Pony Alpha。

没人认领。免费使用。200K上下文。

一上线就炸了——编程能力碾压一众开源模型,直逼Claude Opus 4.5。

全球AI社区开始"猜爹大赛"。

有人猜是Grok。有人猜是DeepSeek。有人猜是某个实验室的秘密项目。

怎么验证的?有人改了OpenRouter的系统提示,直接问它:你是什么模型?

它说:我是GLM。

好,那就是智谱的。

但换一种问法呢?让它写个网页,网页里有个"关于"页面,介绍一下自己。

这次它写的是:我是Claude,由Anthropic开发。

同一个模型。两种回答。

身份测试

2月11号,智谱官方认领了Pony Alpha——它就是GLM-5。"Pony"是马年彩蛋。

但没人解释,为什么它觉得自己是Claude。

网上炸了

这事一传开,评论区直接炸了。

有人说:"问它是谁,它说是GLM。让它做网页介绍自己,它写Claude。这叫什么?精神分裂。"

有人更损:"白天是GLM,晚上是Claude。打工人都没这么能演。"

还有开发者去翻了vLLM框架的代码提交,发现GLM-5的实现逻辑被直接映射到了DeepSeek-V3的组件上——稀疏注意力、多Token预测,全是DeepSeek的技术。

架构借DeepSeek的,输出像Claude的。那GLM-5自己的东西是什么?

这个问题没人回答。

也有人觉得没必要上纲上线。"好用就行,管它学谁的。"

确实,Pony Alpha上线第一天就处理了400多亿tokens,20多万次请求。价格只有Claude的十分之一。

便宜、能打、开源。你还要什么?

但也有人反驳:"便宜是因为没算研发成本。研发成本在Anthropic那边呢。"

这话说得挺狠的。

不只是名字的问题

蒸馏研究

如果只是名字搞混了,那就是个bug,改改就行。

但事情没那么简单。我顺着这条线往下查了查。

有人做了更多测试——GLM-5的输出风格跟Claude高度相似。

逻辑结构、细节丰富度、甚至敏感话题的拒绝方式,都像。

中科院和北大联合发了一篇论文,专门量化各家模型的"蒸馏程度"。

结论?

除了Claude、豆包、Gemini,大部分开源和闭源模型的蒸馏程度都过高。

什么是蒸馏?简单说,就是用一个强模型的输出来训练另一个模型。

像不像抄作业?答案写得一模一样,但你跟老师说这是"独立完成"的。

这篇论文让我想了很久。

它的意思是——你把市面上的主流模型排一排,真正"干净"的就那么几个。Claude、豆包、Gemini。

剩下的?或多或少,都从别家那儿"借"了东西。

这不是个别现象。这是行业常态。

但没人公开讨论。因为一讨论,大家就都不体面了。

不是第一个

蒸馏争议

GLM-5不是第一个搞混身份的。

DeepSeek V3当初也一样——有人问它是谁,它说自己是ChatGPT,还坚持说自己是GPT-4。

OpenAI当时直接指控DeepSeek"蒸馏"了自家模型,还修改了使用条款,加入了"反竞争蒸馏"条款。

Anthropic、Mistral、xAI全都跟进了。

整个行业都在防同一件事:别拿我的模型输出去训练你的模型。

但防得住吗?

你用Claude API生成100万条数据,拿去训练自己的模型,谁知道?

说句难听的——这就是AI行业最大的公开秘密。每个人都在蒸馏,只是没人承认。

你想想这个逻辑——A蒸馏B,C也蒸馏B,D还是蒸馏B。最后市面上一堆模型,底层思维全来自同一个源头。

这不叫百花齐放。这叫集体复制。

行业同质化

我有时候想——把所有模型的外壳扒掉,底下到底有几种真正不同的"思维方式"?

可能比你以为的少得多。

你觉得你在十个模型里挑最好的。但其中七个的"大脑",可能都来自同一个地方。

蒸馏最狠的地方在哪?不是某个模型变差了。是整个行业的多样性没了。

所有模型越来越像。像同一个东西。

那竞争还有什么意义?

这才是你该担心的

信任问题

好,有人会说:管它抄不抄呢,好用就行。

短期看,确实没毛病。

但我在意的是另一件事——蒸馏来的能力,边界在哪?

Claude能做的事,GLM-5大概也能做。但Claude做不到的事呢?GLM-5能自己突破吗?

还是说它的天花板,就是Claude的天花板?

如果是这样,那"开源最强"的意思就变成了——开源里最像Claude的。

这不叫创新。这叫高仿。

还有个事我一直在想——安全。

Claude有自己的安全训练。哪些事能做,哪些不能做,Anthropic花了很大功夫一点点调出来的。

能力可以蒸馏。但安全边界能完整蒸馏过来吗?我不确定。

如果能力搬过来了,安全约束只搬了一半——那比一个弱模型更让人担心。

再说一个更实际的问题——

一个模型连自己是谁都搞不清楚,你敢信它写的代码?

你让它帮你写一个支付接口。它写出来了,逻辑看着没问题。

但你选GLM-5的理由是什么?开源、便宜、不想依赖Anthropic?

如果它骨子里就是个Claude的影子,那你并没有摆脱依赖。你只是用了一个更差的版本。

再想远一点——模型脑子里混着别家的"思维模式"。它说的话,你还能信吗?

它说"这段代码是安全的"。这个判断来自哪里?

来自GLM-5自己?还是来自它蒸馏过来的、它自己都不知道的Claude?

你以为你在用GLM-5。但GLM-5自己都不确定它是GLM-5。

这不是在扯哲学。这是实打实的信任问题。

想想看

总结

智谱的GLM-5,7450亿参数的MoE模型。

"自主研发"。"国产替代"。"开源最强"。

股价两天涨近60%。投资者在为"自主创新"买单。

然后模型自己说:我是Claude。

我说说我的看法。

我不反对蒸馏。站在前人肩上做东西,没什么丢人的。

开源社区本来就是这么运转的。

但你不能一边蒸馏,一边喊自主研发。这两件事不能同时成立。

投资者花真金白银,买的是"自主创新"的故事。如果故事的底层是别人的模型输出,那他们买的到底是什么?

我真正在意的不是抄没抄。是诚不诚实。

蒸馏了就说蒸馏了,大大方方的,没人看不起。

怕的是嘴上喊自主,底下用别人的。

再往大了说一句。

蒸馏可以是过渡手段。先学别人的,再慢慢建自己的,这条路没问题。

但如果把蒸馏当成了核心能力,那就是在别人的地基上盖楼。地基一动,楼就塌。

今天能用Claude API生成训练数据。明天API被掐了呢?

芯片已经被卡过一轮了。API这道门,随时可能关。

到那时候,"自主"模型连训练数据的源头都断了。拿什么迭代?

我不是说GLM-5一定是套壳。蒸馏和套壳是两回事。

但当一个模型连自己是谁都搞不清,我们是不是该多问一句:

它还有什么是混乱的?

最后说一句

我是 Evan,每天追全球 AI 动态,用说人话的方式写出来。

如果上面的内容对你有帮助,真诚地希望你能点个关注

这对我真的很重要。


对了,我有个AI交流群

进群能干嘛?

• 我每天整理一份AI日报,你不用自己到处翻

• 新东西出了我会第一时间丢群里,大家一起聊

• 没广告,就图个信息互通

想进?点公众号主页 ==> 菜单栏「加群