从开源旗手到闭源玩家：Meta为何背叛了自己的口号2026年4月9日，Meta发布了Muse Spark。这是Meta超

2026年4月9日，Meta发布了Muse Spark。这是Meta超级智能实验室（MSL）成立9个月以来的首个成果，也是Llama 4惨败之后，扎克伯格花了140多亿美元重组团队、彻底换血后的第一份成果。

最引人注目的是策略转向。那个曾经高喊"开源对抗闭源"的Meta，这次给Muse Spark直接贴上了"闭源"标签，API只向少数指定合作伙伴开放预览。

这让我想起2024年李彦宏的那番话。当时他说开源是智商税，"当你理性去想，大模型能带来什么价值、以什么成本带来价值时，就会发现永远应该选择闭源模型。闭源模型一定比开源更强大，推理成本更低。"

那时候开源生态正火，社区热情高涨，不少人拿"开源胜利"来调侃李彦宏"判断失误"。但现在看来，扎克伯格和李彦宏站到了同一边。

资本市场反应很直接。消息发布当天，Meta股价盘中一度涨超10%，最终收盘涨超6%，总市值站稳1.55万亿美元。

翻车后的重建

要理解Muse Spark的意义，得先知道它是在什么废墟上建起来的。

去年春天，Llama 4发布后遭遇严重信誉危机。社区质疑声不断，随后有爆料直指Meta在基准测试中动了手脚——拿针对特定任务微调的"特供版"去刷榜，公开给普通用户的版本完全是另一回事。

图灵奖得主、Meta前首席科学家Yann LeCun离职后也承认，Llama 4的测试结果"确实被修饰了一点"。

这件事对Meta AI品牌的伤害是致命的。扎克伯格"对所有相关人员失去了信心"，直接架空了整个生成式AI团队，大批人马离开。

这意味着过去那条从模型架构到研发流程、从开源路线到组织文化的路，可能都走不通了。

扎克伯格选择了最狠的方案：全部推翻，在废墟上重建。

2025年夏天，Meta以143亿美元拿下数据标注巨头Scale AI 49%的无投票权股份。更关键的是，不到30岁的华裔创始人Alexandr Wang被直接请进Meta，出任首席AI官，统管新组建的Meta超级智能实验室（MSL）。

这个年轻人MIT辍学、19岁创立Scale AI、26岁跻身亿万富豪。扎克伯格对他的评价是："同辈创业者中最杰出的一位，深刻理解超级智能的历史重要性"。

Alexandr Wang上任后的第一把火就是烧向旧体系。从OpenAI、谷歌DeepMind、Anthropic等竞争对手那里，以天价薪酬挖来一整支"复仇者联盟"。

MSL首批11人名单里，7位核心研究员是华人背景：浙大校友毕树超（GPT-4o语音模式与o4-mini共同创建者）、清华校友赵晟佳（ChatGPT到o3的核心成员）、中科大校友于佳慧（前OpenAI感知团队负责人），再加上思维链提出者Jason Wei、扩散模型核心人物宋飏等顶尖高手。

这支"亿元天团"的目标只有一个：从零开始，重写Meta的AI命运。

策略上也彻底转向。扎克伯格不求名声了，只求拿出一款真正能打、能收回成本的产品。反正2026年光AI相关的资本支出就要烧掉1150亿到1350亿美元，这次必须确保每一分钱都砸在刀刃上。

Muse Spark的表现

砸了这么多钱、挖了这么多大牛，Muse Spark到底怎么样？

Meta这次表现得很老实，不再像Llama 4时代那样大肆鼓吹"遥遥领先"，反而在官方博客里坦率列出了优缺点分明的成绩单。这种态度反倒让人觉得，这回可能真的有点东西。

长板：医疗和视觉多模态

在极高难度的医学开放式问答评测HealthBench Hard中，Muse Spark拿到42.8分，GPT-5.4只有40.1分，Gemini 3.1 Pro更是只有20.6分，被拉开两到三倍的差距。

凭什么这么强？Meta拉着超过1000名专业医生合作整理训练数据，等于给模型配了个庞大的顶级专家顾问团做特训。别人家AI还在看百度百科，Muse Spark已经把协和专家的会诊记录背下来了。

在科研论文图表深度理解测试（CharXiv Reasoning）中，Muse Spark以86.4分力压GPT-5.4的82.8和Gemini 3.1 Pro的80.2，排名第一。随便甩给它一张复杂的医学影像或科学图表，它都能像资深研究员一样分析得明明白白。

应用场景也很具体。官方案例显示，对着食物拍张照片，Muse Spark就能分析出每种食物的卡路里。吃炸鸡前拍一下，从开心地吃变成心惊胆战地吃。

短板：纯文本推理和编程

但在纯文本推理和编程任务上，Muse Spark明显落后。

在"人类最后考试"（Humanity's Last Exam）中，Muse Spark得分42.8，低于Gemini 3.1 Pro的45.4和GPT-5.4的43.9。在GPQA Diamond博士级推理测试中，Muse Spark的89.5分也低于Gemini 3.1 Pro的94.3和GPT-5.4的92.8。

编程能力差距更明显。在LiveCodeBench Pro竞争性编程测试中，Muse Spark的80.0分远低于GPT-5.4的87.5和Gemini 3.1 Pro的82.9。在SWE-Bench Verified软件工程测试中，Muse Spark的77.4分也低于Gemini 3.1 Pro的80.6和Opus 4.6的80.8。

Meta自己也承认，Muse Spark在"需要多步骤复杂推理的数学问题"和"长上下文理解"上存在不足。

这种"偏科"特征很明显：视觉和医疗多模态是强项，纯文本推理和编程是弱项。对于Meta来说，这可能不是坏事——至少找到了差异化定位，而不是在所有领域硬碰硬。

闭源

从开源到闭源，Meta的转变不是技术选择，而是商业现实。

开源战略的困境在于：模型能力越强，开源的成本越高，商业回报越难保障。Llama系列虽然获得了社区口碑，但在商业化上并没有给Meta带来直接收益。相反，竞争对手可以基于Llama开发产品，与Meta形成竞争。

闭源模式的好处是可控。通过API和合作伙伴体系，Meta可以控制模型的使用场景、定价策略和商业化节奏。这次Muse Spark只向少数指定合作伙伴开放预览，说明Meta在学习OpenAI的打法：先建立生态，再逐步放开。

扎克伯格的账算得很清楚。每年上千亿美元的AI投入，必须看到回报。开源能带来名声，但闭源才能带来收入和利润。当AI竞争进入下半场，烧钱换规模的阶段过去，盈利能力成为核心指标，闭源是更理性的选择。

这也验证了李彦宏2024年的判断。当时他说开源是"智商税"，被很多人嘲笑。但从商业逻辑看，他的观点有一定道理：当模型能力成为核心竞争力时，企业没有动力把最核心的资产免费开源。开源更适合基础设施层（如操作系统、数据库），而在应用层，闭源才是常态。

当然，开源并没有死。Meta表示未来可能会开源其他模型，Muse Spark只是MSL的第一个产品。但战略重心已经转移：从"开源优先"变成"闭源赚钱优先，开源看情况"。

竞争格局

Muse Spark的入局，让大模型市场的竞争更加复杂。

OpenAI的GPT-5.4依然是综合能力的标杆，但优势在缩小。Google的Gemini 3.1 Pro在推理和编程上保持领先，但医疗和视觉理解被Muse Spark超越。Anthropic的Claude Opus 4.6在代码生成上仍有优势，但市场份额受到挤压。

Meta的优势在于：第一，有社交平台的流量入口（Facebook、Instagram、WhatsApp），可以快速将AI能力触达数十亿用户；第二，有VR/AR硬件（Quest系列），可以为多模态AI提供落地场景；第三，有钱，每年上千亿美元的资本支出不是小数目。

劣势也很明显：在AI领域的技术积累和组织能力，与OpenAI、Google相比仍有差距。Muse Spark的"偏科"说明，Meta在某些核心技术上还需要时间追赶。

更值得关注的是Alexandr Wang的用人策略。MSL首批核心团队中华人背景占多数，这批人来自OpenAI、Google等顶尖机构，带着最前沿的技术经验和方法论加入Meta。这种"挖角+重组"的模式，是否会成为其他大公司AI转型的标准打法？

另外，Muse Spark在医疗领域的突出表现，说明垂直场景的深度优化比通用能力更重要。Meta拉着1000多名医生整理训练数据的做法，成本高、周期长，但一旦建立壁垒，竞争对手很难复制。这种"重投入+垂直深耕"的模式，可能会成为下一阶段AI竞争的主流。

开源运动的尴尬处境

Meta的转向，让开源运动陷入尴尬。

过去几年，开源社区把Llama视为对抗OpenAI、Google闭源帝国的希望。Meta也乐于扮演这个角色，既获得了社区好感，又间接削弱了竞争对手。但现在，当Meta自己也需要靠AI赚钱时，开源就成了负担。

这不是Meta一家的困境。Google的Gemma、阿里的通义千问，虽然名义上开源，但实际上都是阉割版或延迟版，真正的核心模型仍掌握在手中。所谓的"开源"，更多是市场营销手段，而非真正的技术共享。

对于依赖开源模型做应用的创业公司来说，这是个危险信号。如果开源模型的能力始终落后于闭源版本，或者开源协议越来越严格，他们的商业模式就会受到威胁。一些公司已经开始转向多模型策略，不再把鸡蛋放在一个篮子里。

对于开发者社区来说，需要重新评估开源模型的价值。如果开源只是大厂的技术施舍，随时可能收回，那么基于开源构建的长期项目就存在风险。也许，真正可持续的开源，需要独立的非营利组织来维护，而不是依赖商业公司的善意。

烧钱游戏的终点

Muse Spark的背后，是Meta每年1150亿到1350亿美元的AI资本支出。这个数字是什么概念？相当于特斯拉的市值，或者越南一年的GDP。

这种级别的烧钱，不可能永远持续。扎克伯格显然也意识到了这一点，所以Muse Spark必须是能赚钱的产品，而不是另一个技术展示。

但问题在于，AI的商业模式还不清晰。OpenAI靠订阅和API实现了数十亿美元收入，但仍未盈利。Google和微软把AI集成到搜索和办公软件中，主要是防御性布局，防止用户流失。Meta的AI变现路径更模糊：社交平台上的AI功能免费，VR/AR硬件销量有限，API业务刚刚起步。

如果未来几年AI无法证明其商业回报，资本的热情就会降温。2025年到2026年，已经有投资者对科技巨头的AI支出表示担忧。Muse Spark的表现，将在很大程度上影响市场对Meta AI战略的信心。

从另一个角度看，Alexandr Wang的加入和MSL的组建，也是Meta在为"后烧钱时代"做准备。Scale AI的核心业务是数据标注，这是AI训练的基础设施。Meta通过投资Scale AI，既锁定了优质数据供应，又获得了Alexandr Wang的管理能力。这种"投资+挖人"的组合拳，说明Meta在思考更长期的布局。

技术路线的分化

Muse Spark的"偏科"，反映了当前大模型技术路线的分化。

OpenAI和Google追求通用能力，试图用一个模型解决所有问题。这种做法的好处是品牌集中，用户只需要记住一个产品。但代价是研发资源分散，在某些垂直领域难以做到极致。

Meta选择了差异化路线：先在一个垂直领域（医疗+视觉）建立优势，再逐步扩展。这种做法的好处是可以快速建立壁垒，在特定场景下击败通用模型。但代价是品牌认知分散，用户需要为不同场景选择不同产品。

Anthropic则专注于代码和推理能力，试图成为开发者的首选工具。这种做法的好处是用户群体明确，付费意愿强。但代价是市场规模有限，难以像消费级产品那样快速扩张。

三种路线各有优劣，短期内难分胜负。但从Muse Spark的表现来看，垂直深耕策略在特定场景下确实有效。如果Meta能在医疗、教育、法律等多个垂直领域复制这种模式，就有可能建立起与OpenAI不同的生态位。

更深层的问题是：大模型的终极形态是什么？是一个无所不能的超级模型，还是多个专精模型的组合？目前的趋势似乎是后者。即使是OpenAI，也在推出针对不同场景的优化版本（如GPT-4o for vision）。Muse Spark的"偏科"，可能只是这种趋势的早期表现。

人才战争

MSL的组建，标志着AI人才战争进入新阶段。

以前，人才流动主要是在大厂之间跳槽，或者从学术界进入工业界。但现在，出现了"整建制挖角"的模式——Alexandr Wang不仅自己加入Meta，还带来了一整套人脉网络，从竞争对手那里成批挖人。

这种做法的成本极高。据报道，MSL核心成员的年薪包都在数百万美元级别，顶尖人才甚至超过千万。但对于Meta来说，这是值得的。因为AI竞争的核心是人才，而顶尖人才的数量是有限的。通过高价锁定这批人，Meta不仅增强了自己，也削弱了竞争对手。

更值得关注的是华人研究员在MSL中的高比例。这7位核心成员来自浙大、清华、中科大等国内顶尖高校，在OpenAI、Google等机构积累了丰富经验。他们的加入，说明中国培养的高端AI人才在全球具有竞争力，但也反映出国内在留住顶尖人才方面存在挑战。

对于其他AI公司来说，Meta的做法提高了人才竞争的成本。以前，几百万美元年薪包就能吸引顶尖人才，现在可能需要上千万。这对于资金实力较弱的创业公司来说，是个坏消息。他们可能需要通过股权激励、研究自由度等非金钱手段来吸引人才，或者专注于特定细分领域，避免与巨头正面竞争。

结语

Muse Spark的发布，是Meta AI战略的分水岭。从开源到闭源，从追求社区口碑到追求商业回报，从Llama的翻车到MSL的重生，扎克伯格用140多亿美元和9个月时间，完成了一次破釜沉舟的转型。

这也说明，没有永恒的正确答案。开源还是闭源、通用还是垂直、烧钱还是盈利，都需要根据阶段和环境来调整。李彦宏2024年关于"闭源更优"的判断，当时被嘲讽，现在被扎克伯格用行动验证——至少在商业变现阶段，闭源确实更可持续。

但Muse Spark只是开始。它能否真正为Meta带来收入和利润，能否在垂直领域建立持久壁垒，能否在与OpenAI、Google的竞争中不落下风，还需要时间检验。