DeepSeek V4开源:国产AI的反击

0 阅读9分钟

1.6T参数,1M上下文,Codeforces 3206分——这不是升级,是宣战。

01

4月24日,让全球AI圈苦等15个月的DeepSeek V4,终于来了。

没有预热直播,没有高管站台,没有冗长的路线图宣讲。

DeepSeek用最硬核的方式,扔出了改写行业规则的王炸:

全系原生标配100万token上下文窗口,1.6T万亿参数旗舰模型免费商用,推理成本较海外顶级闭源模型最高下探99%。

更戏剧性的是,DeepSeek特意选在OpenAI发布GPT-5.5的同一天亮剑。

开源vs闭源,诸神之战。


02

双版本策略:Pro和Flash

这次DeepSeek一口气放出两个版本:

版本

总参数

激活参数

定位

V4-Pro

1.6T

49B

旗舰版,性能比肩闭源顶流

V4-Flash

284B

13B

经济版,极致性价比

两个版本都支持100万token上下文,都开源,都免费可商用。

V4-Pro的目标是"比肩顶级闭源模型",V4-Flash的目标是"让更多人用得上"。


03

最震撼的一项:编程能力

V4-Pro在Codeforces竞赛中拿到3206分。

这个数字意味着什么?

GPT-5.4的Codeforces评分是3168。

开源模型第一次在编程赛道追平闭源旗舰。

DeepSeek内部已经把V4-Pro作为公司主力编程工具,工程师实测反馈:优于Anthropic Sonnet 4.5,交付质量接近Claude Opus 4.6非思考模式。

LiveCodeBench Pass@1拿到93.5,同样是对比组最高。


04

技术突破:如何做到省算力?

1M上下文听起来很夸张,但DeepSeek用了一个巧妙的办法控制成本。

DSA稀疏注意力机制

简单说,就是在token维度做压缩,再用稀疏注意力处理。

效果是:处理100万token长文,V4-Pro的推理FLOPs仅为V3的27%,KV缓存仅为V3的10%。

V4-Flash更极致:推理FLOPs是V3的10%,KV缓存是V3的7%。

这就是"用更少的算力,做更多的事"。


05

价格对比:贵和便宜的差距

模型

输入价格

输出价格

相对V4-Pro倍数

DeepSeek V4-Flash

$0.14

$0.28

0.08×

DeepSeek V4-Pro

$1.74

$3.48

Kimi K2.6

$1.40

$5.60

1.6×

GPT-5.5

$5.00

$30.00

8.6×

Claude Opus 4.7

$15.00

$75.00

21.6×

一组数据看懂差距:用Claude Opus写100万字,够你用V4-Pro写2100万字。


06

国产算力的突破

V4首次明确披露已适配华为昇腾芯片。

这不是简单的适配,而是"去CUDA化"的关键一步。

华为昇腾超节点全系列产品已支持DeepSeek V4系列模型,实现V4-Pro 20ms和V4-Flash 10ms低时延推理。寒武纪、海光信息等8大国产芯片也实现了Day 0级原生适配。

在当前的地缘政治背景下,这意味着DeepSeek不依赖英伟达GPU也能跑起来。

对中国AI行业来说,这是从"卡脖子"到"自主可控"的实质性突破。


07

开源vs闭源:2026年的分水岭

维度

DeepSeek V4

GPT-5.5

Claude Opus 4.7

模型权重

完全开放

不可用

不可用

本地部署

支持

不支持

不支持

私有化微调

完全支持

仅API

仅API

数据隐私

完全可控

依赖平台

依赖平台

多模态

暂不支持

全面支持

有限支持

一句话:如果你的场景是文本推理+编程+中文能力+极致性价比,V4已经是2026年的最优解。


08

内部调研:91%认为可替代闭源

DeepSeek对85名天天使用V4的工程师和研究员做了调研:

  • 52%认为能替代闭源模型

  • 39%认为差不多能替代

  • 合计91%认为V4已达到闭源模型水平

这不是自卖自夸,是真实用户的反馈。


09

15个月磨一剑

在V4发布之前,DeepSeek一度被圈内外质疑"掉队了"。

过去15个月,整个大模型行业陷入了"月月发版、季度迭代"的内卷怪圈,而DeepSeek三次推迟V4发布,甚至传出核心研究员流失的传闻。

但DeepSeek的回应,只有发布稿结尾那句引自《荀子》的话:

"不诱于誉,不恐于诽,率道而行,端然正己。"

翻开58页的技术报告就会明白:这15个月,DeepSeek没参与行业的无效内卷,而是干成了一件事——

把国内大模型从"堆参数、追热点"的粗放模式,拉向"论文预研-技术验证-工程落地"的体系化创新路径。


最后

DeepSeek V4不只是一个"更好的模型",它是三个信号叠加的产物:

第一,开源正在追平闭源。 

Codeforces 3206分、LiveCodeBench 93.5分——这些硬数据说明,开源模型已经不是"够用"的替代品,而是"可选"的竞争者。

第二,算力效率正在取代算力规模。 

V4用27%的算力做到了V3做不到的事。当别人还在卖更大的GPU时,DeepSeek在用更聪明的算法做更多的事。

第三,中国AI有了自己的"根"。 

昇腾适配意味着V4不依赖任何美国芯片就能跑起来。在地缘政治的背景下,这个意义远超技术本身。

这不是结束,这是开始。


关于作者

作者:近 20 年技术生涯,待过大厂也创过业。 懂大厂的规范与困境,也懂创业公司的敏捷与无奈。 懂技术也懂商业,实践用技术重构传统业务。公众号「AI 提效随笔」主理人。

欢迎转发,转载请注明出处。


📌 觉得有用?欢迎:

点赞 - 让更多人看到

转发 - 分享给需要的同事/朋友

关注 - 不错过后续更多精彩内容分享