DeepSeek 开始融资,又打了一手新牌

0 阅读3分钟

大家好,我是董章鱼。

今天一起床,就看到一条消息:DeepSeek 正在寻求首次外部融资,估值不低于 100 亿美元,计划筹集至少 3 亿美元。

那个曾经坚决不融资的 DeepSeek,终于松口了。

而松口的原因,从一些资料上看也能看出一些端倪——

希望彻底脱离英伟达生态,全面转向华为昇腾芯片。

从不融资到主动开口

DeepSeek 背后是对冲基金幻方量化,这家母公司一直是 DeepSeek 最大的资金来源。

在全年春节 DeepSeek-R1 爆火之后,国内顶级风投和科技巨头排着队送钱,基本上都被梁文锋拒了。

据说他希望保持 DeepSeek 的独立性,不被商业压力绑架。

但现实是:上一次发布的新模型还是 2025 年初的 R1,距今已经过去了一年半。

据斯坦福大学 2026 年度 AI 指数报告,美国顶级模型与中国最强竞品的性能差距仅剩 2.7 个百分点。

差距越小,每一步追赶的边际成本越高。

OpenAI 刚以 3000 亿美元估值完成 400 亿美元融资,相比之下,3 亿美元不算天文数字,但对 DeepSeek 来说是一个转变。

这笔钱的用途很明确:更多算力,更高薪酬留住核心研究者,以及为 V4 的大规模部署铺路。

DeepSeek 模型参数量演进

V4 的赌注:华为昇腾

V4 是 DeepSeek 的下一代旗舰模型,采用 MoE 架构,总参数约 1 万亿(有说1.2万亿),每个 token 仅激活约 370 亿参数,推理成本与 V3 持平。

上下文窗口扩展到 100 万 token,并且首次支持原生多模态。

但 V4 最大的变量不在模型本身,而在底层硬件。

我查到了一些资料——

V4 将全面运行在华为昇腾芯片上,DeepSeek 的工程师花了大量时间将核心代码从英伟达 CUDA 迁移到华为 CANN 架构。

DeepSeek 刻意没有给英伟达和 AMD 提前提供 V4 做优化适配,而是将早期访问权限独家给了国产芯片厂商。

如果 V4 在昇腾芯片上跑出有竞争力的性能,它将成为全球第一个不依赖英伟达的前沿 AI 模型。

非常值得期待这一手新牌,希望可以打好!

另外,还看到一些消息说,DeepSeek 近日还在内蒙古乌兰察布发布了服务器运维工程师和交付经理的招聘岗位。

这是该公司首次公开招聘算力基础设施相关的驻场人员,种种迹象表明 V4 正在为大规模部署做最后准备。

这件事的意义其实不止于一家公司的融资和一个模型的发布。

往大了说,它可能还意味着国产 AI 芯片生态正在从"可用"走向"可依赖",而这个转变一旦被验证,整个行业的格局也许还会跟着变化。

消息刚出,让子弹飞一会。

不过很期待那个“完全依赖国产芯片的全球顶级模型”的出现。