deepseek

283 阅读3分钟

【新智元导读】 Meta 员工在 TeamBlind 爆料,点燃了一把火。自诩开源先锋的 Meta,直接被 DeepSeek 这家中国公司整得无地自容。不仅工程师争分夺秒复现模型,年薪超过 DeepSeek 训练成本的高管们,心底也有点虚。

今天,Meta 员工在匿名社区 TeamBlind 上的一个帖子,在业内被传疯了。

DeepSeek,真实地给了美国人亿点点「震撼」。

DeepSeek R1 是世界上首个与 OpenAI o1 比肩的 AI 模型,而且与 o1 不同, R1 还是开源模型「Open Source Model」,比 OpenAI 还 Open!

更有人曝料,DeepSeek 还只是个「副项目」,主业根本不是搞大模型!

这不,OpenAI 还没慌呢,Meta 先慌了!

毕竟 Meta 一直自诩开源先锋,但 DeepSeek 这种程度的开源,直接把它们拍在沙滩上。

更可怕的是,DeepSeek 的成本也太太太低了,这么比起来,Meta 拿着超高预算的团队,就显得很尴尬。

那些一个人拿的薪资,就超过整个 DeepSeek V3 训练成本(仅 550 万美元)的高管,尤其如坐针毡。

根据内部 Meta 内部人士爆料,DeepSeek 去年的 V3,已经给他们压力了。

现在,Meta 的工程师正在抓紧一切时间,争分夺秒地分析 DeepSeek,试图复制其中一切可能的技术。

以前,是全世界追着美国的大模型拿着放大镜研究,现在情况竟倒转了过来,美国人也开始逆向工程了。今夕是何夕?

中国大模型的狂飙猛进,真的让我们感到了魔幻现实主义的味道。

Meta 工程师吓疯了

TeamBlind 上的帖子,全文曝料如下:

一切源于 DeepSeek V3 的出现,它在基准测试中已经让 Llama 4 相形见绌。更让人难堪的是,一家「仅用 550 万美元训练预算的中国公司」就做到了这一点。

工程师们正在争分夺秒地分析 DeepSeek,试图复制其中的一切可能技术。这绝非夸张。

管理层正为如何证明 GenAI 研发部门的巨额投入而发愁。当部门里一个高管的薪资就超过训练整个 DeepSeek V3 的成本,而且这样的高管还有数十位,他们该如何向高层交代?

DeepSeek R1 的出现让情况更加严峻。具体细节属于机密,不便透露,不过很快就会公开了。

这本该是一个以工程为导向的精简部门,但因为太多人想要分一杯羹,人为膨胀招聘规模,最终导致人人都付出了代价。

在成本上,「一个高管 = DeepSeek V3」,这对给高管们开出天价年薪的硅谷大厂们,实在是啪啪打脸。

更是有网友被震惊到:「DeepSeek R1 在 OpenAI、Meta、Grok 以及谷歌的屁股下点了一把火,就像 Open AI 在第一次推出 ChatGPT 时那样震撼。如果去掉人力瓶颈,达到 o1 级性能真的不需要花太多钱!!」

有网友认为,在这次 AI 浪潮中,Meta 的确落后了。

但也有网友为 Meta 解释,毕竟 Meta 已经开始行动了,虽然在 GenAI 领域的确「人浮于事」。