从开源旗手到闭源玩家:Meta为何背叛了自己的口号

4 阅读14分钟

2026年4月9日,Meta发布了Muse Spark。这是Meta超级智能实验室(MSL)成立9个月以来的首个成果,也是Llama 4惨败之后,扎克伯格花了140多亿美元重组团队、彻底换血后的第一份成果。

最引人注目的是策略转向。那个曾经高喊"开源对抗闭源"的Meta,这次给Muse Spark直接贴上了"闭源"标签,API只向少数指定合作伙伴开放预览。

这让我想起2024年李彦宏的那番话。当时他说开源是智商税,"当你理性去想,大模型能带来什么价值、以什么成本带来价值时,就会发现永远应该选择闭源模型。闭源模型一定比开源更强大,推理成本更低。"

那时候开源生态正火,社区热情高涨,不少人拿"开源胜利"来调侃李彦宏"判断失误"。但现在看来,扎克伯格和李彦宏站到了同一边。

资本市场反应很直接。消息发布当天,Meta股价盘中一度涨超10%,最终收盘涨超6%,总市值站稳1.55万亿美元。

翻车后的重建

要理解Muse Spark的意义,得先知道它是在什么废墟上建起来的。

去年春天,Llama 4发布后遭遇严重信誉危机。社区质疑声不断,随后有爆料直指Meta在基准测试中动了手脚——拿针对特定任务微调的"特供版"去刷榜,公开给普通用户的版本完全是另一回事。

图灵奖得主、Meta前首席科学家Yann LeCun离职后也承认,Llama 4的测试结果"确实被修饰了一点"。

这件事对Meta AI品牌的伤害是致命的。扎克伯格"对所有相关人员失去了信心",直接架空了整个生成式AI团队,大批人马离开。

这意味着过去那条从模型架构到研发流程、从开源路线到组织文化的路,可能都走不通了。

扎克伯格选择了最狠的方案:全部推翻,在废墟上重建。

2025年夏天,Meta以143亿美元拿下数据标注巨头Scale AI 49%的无投票权股份。更关键的是,不到30岁的华裔创始人Alexandr Wang被直接请进Meta,出任首席AI官,统管新组建的Meta超级智能实验室(MSL)。

这个年轻人MIT辍学、19岁创立Scale AI、26岁跻身亿万富豪。扎克伯格对他的评价是:"同辈创业者中最杰出的一位,深刻理解超级智能的历史重要性"。

Alexandr Wang上任后的第一把火就是烧向旧体系。从OpenAI、谷歌DeepMind、Anthropic等竞争对手那里,以天价薪酬挖来一整支"复仇者联盟"。

MSL首批11人名单里,7位核心研究员是华人背景:浙大校友毕树超(GPT-4o语音模式与o4-mini共同创建者)、清华校友赵晟佳(ChatGPT到o3的核心成员)、中科大校友于佳慧(前OpenAI感知团队负责人),再加上思维链提出者Jason Wei、扩散模型核心人物宋飏等顶尖高手。

这支"亿元天团"的目标只有一个:从零开始,重写Meta的AI命运。

策略上也彻底转向。扎克伯格不求名声了,只求拿出一款真正能打、能收回成本的产品。反正2026年光AI相关的资本支出就要烧掉1150亿到1350亿美元,这次必须确保每一分钱都砸在刀刃上。

Muse Spark的表现

砸了这么多钱、挖了这么多大牛,Muse Spark到底怎么样?

Meta这次表现得很老实,不再像Llama 4时代那样大肆鼓吹"遥遥领先",反而在官方博客里坦率列出了优缺点分明的成绩单。这种态度反倒让人觉得,这回可能真的有点东西。

长板:医疗和视觉多模态

在极高难度的医学开放式问答评测HealthBench Hard中,Muse Spark拿到42.8分,GPT-5.4只有40.1分,Gemini 3.1 Pro更是只有20.6分,被拉开两到三倍的差距。

凭什么这么强?Meta拉着超过1000名专业医生合作整理训练数据,等于给模型配了个庞大的顶级专家顾问团做特训。别人家AI还在看百度百科,Muse Spark已经把协和专家的会诊记录背下来了。

在科研论文图表深度理解测试(CharXiv Reasoning)中,Muse Spark以86.4分力压GPT-5.4的82.8和Gemini 3.1 Pro的80.2,排名第一。随便甩给它一张复杂的医学影像或科学图表,它都能像资深研究员一样分析得明明白白。

应用场景也很具体。官方案例显示,对着食物拍张照片,Muse Spark就能分析出每种食物的卡路里。吃炸鸡前拍一下,从开心地吃变成心惊胆战地吃。

短板:纯文本推理和编程

但在纯文本推理和编程任务上,Muse Spark明显落后。

在"人类最后考试"(Humanity's Last Exam)中,Muse Spark得分42.8,低于Gemini 3.1 Pro的45.4和GPT-5.4的43.9。在GPQA Diamond博士级推理测试中,Muse Spark的89.5分也低于Gemini 3.1 Pro的94.3和GPT-5.4的92.8。

编程能力差距更明显。在LiveCodeBench Pro竞争性编程测试中,Muse Spark的80.0分远低于GPT-5.4的87.5和Gemini 3.1 Pro的82.9。在SWE-Bench Verified软件工程测试中,Muse Spark的77.4分也低于Gemini 3.1 Pro的80.6和Opus 4.6的80.8。

Meta自己也承认,Muse Spark在"需要多步骤复杂推理的数学问题"和"长上下文理解"上存在不足。

这种"偏科"特征很明显:视觉和医疗多模态是强项,纯文本推理和编程是弱项。对于Meta来说,这可能不是坏事——至少找到了差异化定位,而不是在所有领域硬碰硬。

闭源

从开源到闭源,Meta的转变不是技术选择,而是商业现实。

开源战略的困境在于:模型能力越强,开源的成本越高,商业回报越难保障。Llama系列虽然获得了社区口碑,但在商业化上并没有给Meta带来直接收益。相反,竞争对手可以基于Llama开发产品,与Meta形成竞争。

闭源模式的好处是可控。通过API和合作伙伴体系,Meta可以控制模型的使用场景、定价策略和商业化节奏。这次Muse Spark只向少数指定合作伙伴开放预览,说明Meta在学习OpenAI的打法:先建立生态,再逐步放开。

扎克伯格的账算得很清楚。每年上千亿美元的AI投入,必须看到回报。开源能带来名声,但闭源才能带来收入和利润。当AI竞争进入下半场,烧钱换规模的阶段过去,盈利能力成为核心指标,闭源是更理性的选择。

这也验证了李彦宏2024年的判断。当时他说开源是"智商税",被很多人嘲笑。但从商业逻辑看,他的观点有一定道理:当模型能力成为核心竞争力时,企业没有动力把最核心的资产免费开源。开源更适合基础设施层(如操作系统、数据库),而在应用层,闭源才是常态。

当然,开源并没有死。Meta表示未来可能会开源其他模型,Muse Spark只是MSL的第一个产品。但战略重心已经转移:从"开源优先"变成"闭源赚钱优先,开源看情况"。

竞争格局

Muse Spark的入局,让大模型市场的竞争更加复杂。

OpenAI的GPT-5.4依然是综合能力的标杆,但优势在缩小。Google的Gemini 3.1 Pro在推理和编程上保持领先,但医疗和视觉理解被Muse Spark超越。Anthropic的Claude Opus 4.6在代码生成上仍有优势,但市场份额受到挤压。

Meta的优势在于:第一,有社交平台的流量入口(Facebook、Instagram、WhatsApp),可以快速将AI能力触达数十亿用户;第二,有VR/AR硬件(Quest系列),可以为多模态AI提供落地场景;第三,有钱,每年上千亿美元的资本支出不是小数目。

劣势也很明显:在AI领域的技术积累和组织能力,与OpenAI、Google相比仍有差距。Muse Spark的"偏科"说明,Meta在某些核心技术上还需要时间追赶。

更值得关注的是Alexandr Wang的用人策略。MSL首批核心团队中华人背景占多数,这批人来自OpenAI、Google等顶尖机构,带着最前沿的技术经验和方法论加入Meta。这种"挖角+重组"的模式,是否会成为其他大公司AI转型的标准打法?

另外,Muse Spark在医疗领域的突出表现,说明垂直场景的深度优化比通用能力更重要。Meta拉着1000多名医生整理训练数据的做法,成本高、周期长,但一旦建立壁垒,竞争对手很难复制。这种"重投入+垂直深耕"的模式,可能会成为下一阶段AI竞争的主流。

开源运动的尴尬处境

Meta的转向,让开源运动陷入尴尬。

过去几年,开源社区把Llama视为对抗OpenAI、Google闭源帝国的希望。Meta也乐于扮演这个角色,既获得了社区好感,又间接削弱了竞争对手。但现在,当Meta自己也需要靠AI赚钱时,开源就成了负担。

这不是Meta一家的困境。Google的Gemma、阿里的通义千问,虽然名义上开源,但实际上都是阉割版或延迟版,真正的核心模型仍掌握在手中。所谓的"开源",更多是市场营销手段,而非真正的技术共享。

对于依赖开源模型做应用的创业公司来说,这是个危险信号。如果开源模型的能力始终落后于闭源版本,或者开源协议越来越严格,他们的商业模式就会受到威胁。一些公司已经开始转向多模型策略,不再把鸡蛋放在一个篮子里。

对于开发者社区来说,需要重新评估开源模型的价值。如果开源只是大厂的技术施舍,随时可能收回,那么基于开源构建的长期项目就存在风险。也许,真正可持续的开源,需要独立的非营利组织来维护,而不是依赖商业公司的善意。

烧钱游戏的终点

Muse Spark的背后,是Meta每年1150亿到1350亿美元的AI资本支出。这个数字是什么概念?相当于特斯拉的市值,或者越南一年的GDP。

这种级别的烧钱,不可能永远持续。扎克伯格显然也意识到了这一点,所以Muse Spark必须是能赚钱的产品,而不是另一个技术展示。

但问题在于,AI的商业模式还不清晰。OpenAI靠订阅和API实现了数十亿美元收入,但仍未盈利。Google和微软把AI集成到搜索和办公软件中,主要是防御性布局,防止用户流失。Meta的AI变现路径更模糊:社交平台上的AI功能免费,VR/AR硬件销量有限,API业务刚刚起步。

如果未来几年AI无法证明其商业回报,资本的热情就会降温。2025年到2026年,已经有投资者对科技巨头的AI支出表示担忧。Muse Spark的表现,将在很大程度上影响市场对Meta AI战略的信心。

从另一个角度看,Alexandr Wang的加入和MSL的组建,也是Meta在为"后烧钱时代"做准备。Scale AI的核心业务是数据标注,这是AI训练的基础设施。Meta通过投资Scale AI,既锁定了优质数据供应,又获得了Alexandr Wang的管理能力。这种"投资+挖人"的组合拳,说明Meta在思考更长期的布局。

技术路线的分化

Muse Spark的"偏科",反映了当前大模型技术路线的分化。

OpenAI和Google追求通用能力,试图用一个模型解决所有问题。这种做法的好处是品牌集中,用户只需要记住一个产品。但代价是研发资源分散,在某些垂直领域难以做到极致。

Meta选择了差异化路线:先在一个垂直领域(医疗+视觉)建立优势,再逐步扩展。这种做法的好处是可以快速建立壁垒,在特定场景下击败通用模型。但代价是品牌认知分散,用户需要为不同场景选择不同产品。

Anthropic则专注于代码和推理能力,试图成为开发者的首选工具。这种做法的好处是用户群体明确,付费意愿强。但代价是市场规模有限,难以像消费级产品那样快速扩张。

三种路线各有优劣,短期内难分胜负。但从Muse Spark的表现来看,垂直深耕策略在特定场景下确实有效。如果Meta能在医疗、教育、法律等多个垂直领域复制这种模式,就有可能建立起与OpenAI不同的生态位。

更深层的问题是:大模型的终极形态是什么?是一个无所不能的超级模型,还是多个专精模型的组合?目前的趋势似乎是后者。即使是OpenAI,也在推出针对不同场景的优化版本(如GPT-4o for vision)。Muse Spark的"偏科",可能只是这种趋势的早期表现。

人才战争

MSL的组建,标志着AI人才战争进入新阶段。

以前,人才流动主要是在大厂之间跳槽,或者从学术界进入工业界。但现在,出现了"整建制挖角"的模式——Alexandr Wang不仅自己加入Meta,还带来了一整套人脉网络,从竞争对手那里成批挖人。

这种做法的成本极高。据报道,MSL核心成员的年薪包都在数百万美元级别,顶尖人才甚至超过千万。但对于Meta来说,这是值得的。因为AI竞争的核心是人才,而顶尖人才的数量是有限的。通过高价锁定这批人,Meta不仅增强了自己,也削弱了竞争对手。

更值得关注的是华人研究员在MSL中的高比例。这7位核心成员来自浙大、清华、中科大等国内顶尖高校,在OpenAI、Google等机构积累了丰富经验。他们的加入,说明中国培养的高端AI人才在全球具有竞争力,但也反映出国内在留住顶尖人才方面存在挑战。

对于其他AI公司来说,Meta的做法提高了人才竞争的成本。以前,几百万美元年薪包就能吸引顶尖人才,现在可能需要上千万。这对于资金实力较弱的创业公司来说,是个坏消息。他们可能需要通过股权激励、研究自由度等非金钱手段来吸引人才,或者专注于特定细分领域,避免与巨头正面竞争。

结语

Muse Spark的发布,是Meta AI战略的分水岭。从开源到闭源,从追求社区口碑到追求商业回报,从Llama的翻车到MSL的重生,扎克伯格用140多亿美元和9个月时间,完成了一次破釜沉舟的转型。

这也说明,没有永恒的正确答案。开源还是闭源、通用还是垂直、烧钱还是盈利,都需要根据阶段和环境来调整。李彦宏2024年关于"闭源更优"的判断,当时被嘲讽,现在被扎克伯格用行动验证——至少在商业变现阶段,闭源确实更可持续。

但Muse Spark只是开始。它能否真正为Meta带来收入和利润,能否在垂直领域建立持久壁垒,能否在与OpenAI、Google的竞争中不落下风,还需要时间检验。