朋友们,DeepSeek-R2终于有靠谱的消息了!
有关注资本市场的朋友肯定知道顶级投行摩根士丹利(下文简称大摩)。
没错,就是大摩爆料了DeepSeek R2的相关信息。
大摩的爆料啊!
想来信息源应该是相对靠谱的,我也是等了一周才敢发,也一直没见DeepSeek官方出来澄清。
据大摩爆料,即将推出的DeepSeek R2,有着惊人的1.2万亿参数+97%成本降幅+100%国产算力支撑,直接让人闭嘴呀这是!
好啦,没有对比就没有进步,咱们直接来看看具体的参数对比吧。
大摩的研报说了什么
DeepSeek R1 vs R2 核心参数对比表
说人话就是:
-
参数量翻倍增长,但计算消耗大幅降低,自然而然,成本大幅降低至:输入成本 0.07 美元 / 百万 Token,输出 0.27 美元 / 百万 Token,仅为 GPT-4 的 2.7%。
-
R2 全程基于华为昇腾 910B 芯片集群训练,算力利用率高达 82%,性能接近英伟达 A100 集群的 91%。摆脱芯片进口!
-
多模态支持更强,视觉能力也比之前更上一个台阶。
医疗场景中,其胸部 X 光片多病种识别准确率达 98.1%,超越放射科主任医师专家组平均水平的 96.3%(北京协和医院双盲测试结果)。工业质检领域,基于自适应特征融合算法,误检率压至千万分之 7.2(隆基股份产线实测数据)。
结合 DeepSeek“2小1大”的迭代节奏(每两个月小版本更新,半年大版本升级):
以通用模型V1为例,V1是在2023年11月发布,V2的发布时间则是2024年5月,而V3的发布时间则到了2024年12月。
2024年底发布R1,前不久,DeepSeek也发布了一个没改版本号但改得不小的强化版 ——DeepSeek R1-0528。
按这个节奏,2025 年 6-7 月的大版本更迭时间点,很有可能真的是R2要来了。
你可赶紧的吧,大招酝酿好了就放出来,这都已经一个多月没看到DeepSeek的影子了。
写在最后
此时此刻,特别期待R2的发布,如果真是如大摩爆料的这般牛X的话!
毕竟,这样的R2不仅仅是深度求索公司的技术突破,更是中国 AI 自主化的里程碑。
最关键的是,它用 1.2 万亿参数证明:国产算力+架构创新=世界级大模型。
哪怕我们的高端芯片仍然在追赶英伟达,但只要在奋力奔跑,在不断缩短差距,随着华为昇腾910C芯片量产,国产 AI产业链正加速成熟,未来改写全球AI服务定价规则,有什么不可能嘛?
当然,R2仍面临MoE架构长尾任务波动、昇腾生态成熟度等挑战,但这丝毫掩盖不了其光芒。
毕竟,我们都见证了:DeepSeek R1的出现,让中国AI第一次站在了与西方巨头平等对话的舞台。
期待,DeepSeek R2亦如是。
AI大模型资料下载方式