2026年春天,中国AI圈的开发者们发现了一个令人意外的“福利”:英伟达NIM平台免费开放了智谱GLM-5、MiniMax M2.1、DeepSeek V3等国产顶级模型的调用权限,开发者只需注册即可获得每分钟40次的免费API调用额度。NIM平台还同步推出了对阿里Qwen3.5 VLM的免费GPU加速支持。
这看似慷慨的“免费午餐”,背后却是英伟达在中国市场的防守战。一边是免费敞开中国模型的大门,试图用生态粘性锁定开发者;另一边,DeepSeek V4的发布却一再延期,中国AI正经历一场艰难而紧迫的“去CUDA化”长征。
-
“去CUDA化”的压力测试:DeepSeek V4的延期代价
据多家媒体报道,原计划于2026年初发布的DeepSeek V4一再延后,如今预计将在4月下旬正式亮相。这款参数规模达万亿级、支持百万token上下文的多模态模型,首次放弃了对英伟达芯片的依赖,全力适配华为昇腾。
但这条路远比想象中复杂。从CUDA全面转向华为CANN框架,意味着DeepSeek的工程师必须从头适配芯片底层架构。超大规模集群中,华为昇腾与英伟达在芯片间互联带宽、全连通能力上仍存在物理层差距,CANN框架在算子覆盖、自动并行、内核融合等方面的成熟度仍需追赶。这解释了V4一再延期的真正原因——不是产品节奏问题,而是中国顶尖算法团队与国产芯片体系深度磨合的“必然代价”。
经过数月攻坚,进展已经显现:DeepSeek V4在昇腾950PR上的推理速度较初期版本提升35倍,第三方评测显示,昇腾950PR单卡推理性能达到英伟达特供版H20芯片的2.87倍,CANN框架已实现超95%的CUDA代码兼容。这一突破也让市场沸腾——华为算力概念股恒为科技连续涨停,A股算力板块掀涨停潮。甚至有分析认为,DeepSeek V4的发布标志着国产AI芯片正从“可用”迈向“好用”。
值得注意的是,在2026年2月,中国AI模型的周调用量首次超越美国,全球前五模型中中国占据四席。同日,英伟达股价暴跌5.5%,市值蒸发近2600亿美元。英伟达正在中国市场失去定价权和生态主导权——这恰恰印证了黄仁勋的警告:如果DeepSeek V4在华为芯片上完成首发,美国将在全球AI竞争中落入劣势。
-
英伟达的防守术:免费模型、生态锁定与两难困境
英伟达的防御策略远比表面复杂。一方面,通过NIM平台免费开放中国模型的调用权限,鼓励开发者在英伟达生态内“零成本”体验顶尖模型;另一方面,自身也在强化大模型布局,宣布未来5年将累计投入260亿美元自研开源大模型。
但英伟达面临的根本困境在于:即使其在2026年1月获得了向中国出口H200芯片的许可——前提是25%的支付返给美国政府——其在中国市场的份额却仍在萎缩。IDC数据显示,2025年中国AI加速卡市场总出货量约400万张,英伟达虽仍以220万张、55%份额居首,但相较此前近95%的统治地位已大幅下滑。国产厂商合计出货165万张,市场份额首次突破四成。其中华为昇腾独占国产出货量近五成,以81.2万张拿下20%的整体市场份额。
市场研究机构Bernstein Research的预测更为严峻:2026年英伟达在中国AI芯片市场的份额可能萎缩至8%。这一数字虽然可能偏于激进,但从趋势上看,英伟达将不得不面对失去中国市场的现实。当英伟达在中国AI市场的阵地从95%萎缩至8%,黄仁勋的“免费午餐”和“战略警告”,都将变得意义有限。
-
华为的战略觉醒:从芯片替代到系统创新
英伟达在中国市场留下的巨大空白,正被以华为昇腾为代表的国产力量全面承接。华为计划2026年生产约60万颗昇腾910C芯片,加上昇腾950PR等其他型号,总产能目标达160万颗。字节跳动、阿里巴巴等头部互联网企业已被报道计划大规模采购昇腾950PR芯片。科大讯飞等有远见的企业早在数年前就已开始迁移,明知迁移成本极高,董事长刘庆峰直言“这一步非走不可”。
更关键的是,中国移动2026—2027年人工智能超节点设备集中采购项目近日开标,总额约20.6亿元,明确指定全部采用华为CANN生态方案。超节点技术通过内存统一编址实现计算资源的高效协同,本质上是在制程受限条件下“以系统架构提升集群利用率”的关键对策。此前在中国移动2025年AI推理服务器集采中,CANN生态设备金额占比已达70%。
华为CANN开源生态的成熟度也在飞速提升。目前60多家客户和伙伴已基于CANN自主打造420多个高性能算子,支持Triton、TileLang等多元编程语言。这在CUDAA生态称霸二十年的背景下,正成为中国AI关键的“第二选择”。
-
黄仁勋的“两面逻辑”:商业考量与国家利益
黄仁勋的真实立场格外值得玩味。他在2026年4月的一次专访中明确反对将中国推向技术对立面,称“人为割裂出两套AI生态系统的行为极其愚蠢”“中国拥有极为庞大的运算能力,只要完成自有运算资源的整合,完全可以满足自身AI发展的全部需求”。
但实践层面,受美国出口管制约束和国家法律限制,NVIDIA只能在中国市场部署落后两代的芯片。可见,即使像黄仁勋这样的华人企业家个人对美国政策有所保留,其所在企业的战略也必须服从美国国家利益和法律框架,而不是因“华人”身份而在华有特殊倾斜。
-
走出“技术冷战”:中美AI竞争的终局展望
从更广阔的时间尺度看,未来的AI竞争焦点已从“单一模型参数竞赛”转向“Deep模型与系统工程的深度融合”。New York Times专栏作家Sebastian Mallaby在2026年4月实地考察中国后的结论一针见血:“AI竞赛赢家并非由领跑模型的性能决定,而是取决于技术的实际部署能力。当谈到将模型能力融入经济和军事时,DeepSeek与华为的协同将让中国展现出惊人的爆发力”。《南华早报》引述美国国会报告指出,中国开源模型与制造业优势形成“双重循环”的反馈体系,有望挑战美国AI领导地位。
当中国智造从“制造螺丝钉”转向“设计AI芯片生态”,从“追赶指标”转向“定义行业架构”——DeepSeek与华为的这场“长征”,正书写着AI竞争格局转折的关键一章。而这一章的结局,不是谁的技术更强,而是谁的系统生态能更快、更稳、更便宜地赋能全球产业。
最终,回到一个根本问题:在一个必须分化的世界,技术的发展真的可以选择“商业逻辑”与“国家战略”之间的界限吗?英伟达的决策,是商业还是国家?DeepSeek的决策,是主动还是无奈?这两个问题的答案,恰恰构成了未来十年全球科技力量的深层张力。