DeepSeek V4今天正式发布了。
但比起那些跑分数据,真正值得你停下来想一想的是这件事:这是全球第一个完全脱离英伟达CUDA生态的前沿大模型。
训练、推理,全部跑在华为昇腾芯片上。
这意味着什么?我一条一条拆给你。
先快速过一遍:V4到底升级了什么
用最简单的话说:
更大 —— 总参数从V3的6850亿翻到1.6万亿(V4-Pro),但每次推理只激活490亿参数,用的是MoE(混合专家)架构。你可以理解为,V4是一个"1000个专家组成的团队,每个问题只派最合适的几个人去答"。
更省 —— 处理同样长度的文本,V4的计算量只有V3的27%,内存占用只有V3的10%。翻译成人话:同样的活,V4用不到三分之一的电费就能干完。
更长 —— 支持100万token的上下文窗口,而且不是"假长"——大海捞针测试准确率97%。能真正"记住"你扔给它的全部内容。
更便宜 —— V4-Flash输入每百万token只要0.14美元,大约1块钱人民币。V4-Pro输出3.48美元,是GPT-5.4的四分之一,Claude Opus的七分之一。
还有两个版本 —— V4-Pro(1.6万亿参数,旗舰级)和V4-Flash(2840亿参数,日常够用),全部MIT开源。
以上这些你可能在别的地方已经看到了。下面才是今天真正该聊的。
华为昇腾首发:这件事为什么这么大
过去十年,全世界训练大模型就一条路:英伟达GPU + CUDA。
CUDA不只是一个软件工具,它是整个AI产业的"操作系统级基础设施"。所有主流的深度学习框架(PyTorch、TensorFlow)都是围绕CUDA写的,全球90%以上的AI研究员只会用CUDA。
这就形成了一个巨大的"锁定效应"——不是英伟达的芯片多好,是你用了CUDA之后就离不开英伟达了。就像你用了苹果全家桶之后很难换安卓一样,但比这个锁得更死。
DeepSeek V4做的事情,是把整个训练和推理框架从CUDA迁移到了华为的CANN(昇腾计算架构)。
这不是"在华为芯片上跑跑demo"的级别。这是1.6万亿参数、正儿八经的前沿模型,从头到尾在昇腾910C上训练出来的。
这等于告诉全世界:没有英伟达,也能训出顶级模型。
黄仁勋为什么说这是"灾难"
英伟达CEO黄仁勋在V4发布前就公开评论,称中国AI芯片的独立化如果成功,对美国来说是"a bad result"(一个糟糕的结果)。
他的担心不是多余的。
英伟达的商业模式建立在两个支柱上:硬件溢价 + 生态锁定。
硬件溢价好理解——一块H100卖2.5万美元,毛利率75%。生态锁定更重要——因为全球都用CUDA,所以不管AMD、英特尔还是华为做出什么芯片,开发者都不想迁移过来,因为迁移成本太高。
DeepSeek V4的意义在于,它是第一个用行动证明"迁移可以成功"的案例。
当全球第一个万亿参数级开源模型跑在华为芯片上时,英伟达的护城河就不再是"不可逾越"的了。它变成了"可以被绕过的"。
对全球芯片格局的四个影响
1. 华为昇腾从"能用"变成"能打"
在V4之前,华为昇腾芯片的定位更像是"国产替代"——能跑,但性能有差距,生态不完善,大家是"不得不用"。
V4改变了叙事。如果DeepSeek能在昇腾上训出和GPT-5.3、Claude Opus同级别的模型,那昇腾就不是"替代品",而是"正经选项"。
更关键的是,华为的昇腾950系列(预计2026下半年量产)将带来进一步的性能提升,届时V4-Pro的API价格还会继续下降。
2. 英伟达的CUDA护城河出现裂缝
CUDA的锁定效应是这样的:开发者习惯了CUDA → 框架都围绕CUDA写 → 新芯片没人适配 → 开发者更离不开CUDA。
DeepSeek V4打破了这个循环的第一步。当一个顶级模型在非CUDA生态上跑通了,其他中国AI公司(阿里、腾讯、百度、字节)就有了跟进的勇气和参考路径。
短期内英伟达不会受太大影响——全球大部分AI训练还是在NVIDIA GPU上。但长期看,一旦"非CUDA可行"成为共识,英伟达的定价权和市场垄断就会松动。
3. 国产芯片产业链集体受益
V4跑在昇腾上,不只是华为一家的事。它证明了整个中国AI芯片产业链的可行性:
- 中芯国际(SMIC):昇腾910C用的是SMIC的7nm工艺,V4的成功间接验证了SMIC的产能和良率
- 寒武纪、海光等:华为做了CUDA→CANN的迁移路径,其他国产芯片厂商可以参考复制
- 整机厂商:搭载昇腾的AI服务器订单会因为V4的背书而增长
V4不是一个模型发布,它是整个国产AI算力生态的一次"成人礼"。
4. 全球AI算力版图开始分裂
此前,全球AI算力是一个统一市场——不管你在美国、中国还是欧洲,都用英伟达的芯片和CUDA。
V4之后,我们看到的是两个生态开始并行:NVIDIA + CUDA 和 华为昇腾 + CANN。
这不一定是坏事。竞争会压低芯片价格,加速技术迭代。但对于做全球化AI产品的公司来说,需要开始考虑"双生态适配"的问题了。
对普通人意味着什么
说了这么多芯片和生态,普通人该关心什么?
第一,AI使用成本会进一步下降。 V4的API价格已经是GPT的四分之一到七分之一,而且还会降。芯片竞争越激烈,你用AI的价格就越低。
第二,中国AI应用会加速爆发。 之前制约中国AI创业者的一个隐性瓶颈是算力成本——因为芯片被卡脖子,国内训练成本居高不下。V4+昇腾的组合如果成熟,算力成本会大幅下降,更多AI应用会涌现。
第三,你手里的英伟达股票可能需要重新评估。 这不是说英伟达要崩,短期不会。但如果你的投资逻辑建立在"英伟达垄断地位不可动摇"上,V4给了市场一个新的变量。
我的判断
DeepSeek V4的发布时间选得很精准——它选在中美科技关系最紧张的节点,用一个实际跑通的万亿参数模型告诉市场:中国AI不需要英伟达也能站在前沿。
这是一句地缘政治层面的宣言,只不过它用技术论文和开源代码来表达。
但也要冷静看到几点:
- V4是预览版,性能数据大部分来自自测,独立第三方评测还需要时间验证
- 昇腾生态还不成熟,CANN的开发者工具链和社区远不如CUDA丰富,V4-Pro的API容量也因为算力限制而非常有限
- 多模态缺席——V4只支持文本,图像和视频生成能力推迟到了下一个版本
所以,V4更像是一个"信号弹"而不是"终局"。它证明了路径可行,但要走到真正替代英伟达,还有很远的路。
不过,路已经被蹚出来了。而这,就足以改变游戏。