Qwen 的人走了
48小时内发生了什么
3月2日夜间,阿里发布 Qwen3.5 小尺寸系列——0.8B / 2B / 4B / 9B 四个版本。支持视觉理解,推理模式可切换,本地跑只需 7GB 内存,benchmark 吊打同量级甚至更大的模型。社区一片叫好,马斯克在 X 上发了条评论:令人印象深刻的智能水平。林俊旸(Junyang Lin)在下面回了感谢。
3月3日下午,林俊旸正式提交辞职。
3月4日凌晨,那条推文发出来了。
截至北京时间凌晨4点,5000+ 点赞,700+ 评论。多数是道谢,夹着惋惜,也有几条按捺不住的愤怒。
不止一个人
林俊旸不是唯一离开的。
- 郁博文(Binyuan Hui),后训练负责人,同日正式离职
- 惠彬原,Qwen Code 负责人,1999年生,1月就已经走了,去了 Meta
- Kaixin Li,Qwen3.5 / Qwen VL / Qwen Coder 核心贡献者,随后也发了告别帖
这几个不是挂名 contributor。他们是那种北京时间凌晨6点还在 debug、协作上线模型的人。
贡献者 Chen Cheng 第一时间回了林俊旸:"leaving wasn't your choice"。她说昨晚还跟他一起发布 Qwen3.5,想不出没有他的 Qwen 会是什么样。
拼出来的图
各方信息大致指向同一个方向。
架构被拆了。 通义实验室计划把 Qwen 从"垂直整合"体系——预训练、后训练、多模态统一管理——拆成各自独立的水平分工团队。林俊旸的管理范围被缩小。
这和他一直以来的判断相反。他不止一次说过,预训练、后训练、Infra 应该往更紧密的方向走,而不是切开。
考核逻辑对不上。 有人批评阿里云拿 DAU 这类消费级应用的指标来卡基础模型团队。做 foundation model 研究的人,被按照做 App 的方式管,自然对不上。
接替方式有问题。 据知情人士透露,新管理层是绕过林俊旸直接介入团队的,等于架空。接任后训练工作的是前 DeepMind 研究员周浩,社区对他能否接住 Qwen 的方向,态度保守。
社区的反应
讨论几乎一边倒。
Nathan Lambert 称之为 "legendary run"。Unsloth AI、MiniMax、ollama 都发了感谢。有人说 Qwen 一直是前沿实验室和外部开发者社区之间少见的通路,现在这条通路可能要断了。
也有更直接的。有人说希望他们出去创业,然后被阿里用20亿美元收回来——长个教训。
他们去哪
目前没有确认消息。
这批人的能力不需要再说什么。林俊旸计算语言学和 AI 交叉背景出身,2025年以32岁成为阿里最年轻的 P10,靠的是实际产出,不是年限。出去不管是自己干、加入其他实验室,还是继续做开源,都不会就此沉寂。
最后
MiniMax 创始人闫俊杰在一次访谈里说过一段话,放在这里很合适:
我觉得中国人工智能产业过去一两年一直有个巨大的误区:就是认为用户越多,模型能力提升越快。这个逻辑非常错。你看 ChatGPT 的 DAU 是 Claude 的 50 倍到 100 倍,但它的模型并没有好 50 倍,二者其实差不多。这就反映,智能水平的提升,其实没那么依赖要有很多用户。
用 DAU 考核基础模型团队,就像是拿错了尺子。更大的问题是,这把尺子在阿里内部并不孤立——阿里内部有高管对除夕亮相的 Qwen-3.5 直接评价为"半成品",春节期间千问 App 又拉着元宝打了一场补贴大战,烧了百亿,结果和豆包的差距没缩多少。
两家头部公司,在 AI 时代用的还是互联网时代的打法:拿补贴换 DAU,再拿 DAU 压团队。用老旧的互联网思维推广 AI 时代的产品,结果可想而知。