DeepSeek V4首发华为昇腾：这不只是一个模型发布，这是一次脱钩宣言DeepSeek V4今天发布，1.6万亿参数

DeepSeek V4今天正式发布了。

但比起那些跑分数据，真正值得你停下来想一想的是这件事：这是全球第一个完全脱离英伟达CUDA生态的前沿大模型。

训练、推理，全部跑在华为昇腾芯片上。

这意味着什么？我一条一条拆给你。

先快速过一遍：V4到底升级了什么

用最简单的话说：

更大 —— 总参数从V3的6850亿翻到1.6万亿（V4-Pro），但每次推理只激活490亿参数，用的是MoE（混合专家）架构。你可以理解为，V4是一个"1000个专家组成的团队，每个问题只派最合适的几个人去答"。

更省 —— 处理同样长度的文本，V4的计算量只有V3的27%，内存占用只有V3的10%。翻译成人话：同样的活，V4用不到三分之一的电费就能干完。

更长 —— 支持100万token的上下文窗口，而且不是"假长"——大海捞针测试准确率97%。能真正"记住"你扔给它的全部内容。

更便宜 —— V4-Flash输入每百万token只要0.14美元，大约1块钱人民币。V4-Pro输出3.48美元，是GPT-5.4的四分之一，Claude Opus的七分之一。

还有两个版本 —— V4-Pro（1.6万亿参数，旗舰级）和V4-Flash（2840亿参数，日常够用），全部MIT开源。

以上这些你可能在别的地方已经看到了。下面才是今天真正该聊的。

华为昇腾首发：这件事为什么这么大

过去十年，全世界训练大模型就一条路：英伟达GPU + CUDA。

CUDA不只是一个软件工具，它是整个AI产业的"操作系统级基础设施"。所有主流的深度学习框架（PyTorch、TensorFlow）都是围绕CUDA写的，全球90%以上的AI研究员只会用CUDA。

这就形成了一个巨大的"锁定效应"——不是英伟达的芯片多好，是你用了CUDA之后就离不开英伟达了。就像你用了苹果全家桶之后很难换安卓一样，但比这个锁得更死。

DeepSeek V4做的事情，是把整个训练和推理框架从CUDA迁移到了华为的CANN（昇腾计算架构）。

这不是"在华为芯片上跑跑demo"的级别。这是1.6万亿参数、正儿八经的前沿模型，从头到尾在昇腾910C上训练出来的。

这等于告诉全世界：没有英伟达，也能训出顶级模型。

黄仁勋为什么说这是"灾难"

英伟达CEO黄仁勋在V4发布前就公开评论，称中国AI芯片的独立化如果成功，对美国来说是"a bad result"（一个糟糕的结果）。

他的担心不是多余的。

英伟达的商业模式建立在两个支柱上：硬件溢价 + 生态锁定。

硬件溢价好理解——一块H100卖2.5万美元，毛利率75%。生态锁定更重要——因为全球都用CUDA，所以不管AMD、英特尔还是华为做出什么芯片，开发者都不想迁移过来，因为迁移成本太高。

DeepSeek V4的意义在于，它是第一个用行动证明"迁移可以成功"的案例。

当全球第一个万亿参数级开源模型跑在华为芯片上时，英伟达的护城河就不再是"不可逾越"的了。它变成了"可以被绕过的"。

对全球芯片格局的四个影响

1. 华为昇腾从"能用"变成"能打"

在V4之前，华为昇腾芯片的定位更像是"国产替代"——能跑，但性能有差距，生态不完善，大家是"不得不用"。

V4改变了叙事。如果DeepSeek能在昇腾上训出和GPT-5.3、Claude Opus同级别的模型，那昇腾就不是"替代品"，而是"正经选项"。

更关键的是，华为的昇腾950系列（预计2026下半年量产）将带来进一步的性能提升，届时V4-Pro的API价格还会继续下降。

2. 英伟达的CUDA护城河出现裂缝

CUDA的锁定效应是这样的：开发者习惯了CUDA → 框架都围绕CUDA写 → 新芯片没人适配 → 开发者更离不开CUDA。

DeepSeek V4打破了这个循环的第一步。当一个顶级模型在非CUDA生态上跑通了，其他中国AI公司（阿里、腾讯、百度、字节）就有了跟进的勇气和参考路径。

短期内英伟达不会受太大影响——全球大部分AI训练还是在NVIDIA GPU上。但长期看，一旦"非CUDA可行"成为共识，英伟达的定价权和市场垄断就会松动。

3. 国产芯片产业链集体受益

V4跑在昇腾上，不只是华为一家的事。它证明了整个中国AI芯片产业链的可行性：

中芯国际（SMIC）：昇腾910C用的是SMIC的7nm工艺，V4的成功间接验证了SMIC的产能和良率
寒武纪、海光等：华为做了CUDA→CANN的迁移路径，其他国产芯片厂商可以参考复制
整机厂商：搭载昇腾的AI服务器订单会因为V4的背书而增长

V4不是一个模型发布，它是整个国产AI算力生态的一次"成人礼"。

4. 全球AI算力版图开始分裂

此前，全球AI算力是一个统一市场——不管你在美国、中国还是欧洲，都用英伟达的芯片和CUDA。

V4之后，我们看到的是两个生态开始并行：NVIDIA + CUDA 和 华为昇腾 + CANN。

这不一定是坏事。竞争会压低芯片价格，加速技术迭代。但对于做全球化AI产品的公司来说，需要开始考虑"双生态适配"的问题了。

对普通人意味着什么

说了这么多芯片和生态，普通人该关心什么？

第一，AI使用成本会进一步下降。 V4的API价格已经是GPT的四分之一到七分之一，而且还会降。芯片竞争越激烈，你用AI的价格就越低。

第二，中国AI应用会加速爆发。 之前制约中国AI创业者的一个隐性瓶颈是算力成本——因为芯片被卡脖子，国内训练成本居高不下。V4+昇腾的组合如果成熟，算力成本会大幅下降，更多AI应用会涌现。

第三，你手里的英伟达股票可能需要重新评估。 这不是说英伟达要崩，短期不会。但如果你的投资逻辑建立在"英伟达垄断地位不可动摇"上，V4给了市场一个新的变量。

我的判断

DeepSeek V4的发布时间选得很精准——它选在中美科技关系最紧张的节点，用一个实际跑通的万亿参数模型告诉市场：中国AI不需要英伟达也能站在前沿。

这是一句地缘政治层面的宣言，只不过它用技术论文和开源代码来表达。

但也要冷静看到几点：

V4是预览版，性能数据大部分来自自测，独立第三方评测还需要时间验证
昇腾生态还不成熟，CANN的开发者工具链和社区远不如CUDA丰富，V4-Pro的API容量也因为算力限制而非常有限
多模态缺席——V4只支持文本，图像和视频生成能力推迟到了下一个版本

所以，V4更像是一个"信号弹"而不是"终局"。它证明了路径可行，但要走到真正替代英伟达，还有很远的路。

不过，路已经被蹚出来了。而这，就足以改变游戏。