超越了闭源模型的开源大模型?这是来自东方的“神秘力量”。2024 年 12 月 26 日,DeepSeek 发布了其最新开源的 AI 大模型 DeepSeek-V3,依赖高性能低成本的优势,不断冲击着行业内的传统巨头。现在,“薅羊毛”的机会来了,限时免费两周,进入 console.d.run/ ,即可体验到这个在全球市场中崭露头角的大模型黑马!
国外的 AI 基准测试和分析机构 Artificial Analysis 评价 DeepSeek-V3“超越了迄今为止所有开源模型” 。DeepSeek-V3 之所以能够脱颖而出,主要得益于其卓越的速度和效率,它每秒可以处理 60 个 tokens,比前一代产品快了三倍,与现在主流大模型的信息处理速度齐肩。然而,DeepSeek-V3 不仅仅是一个速度快的模型,它还是一个多点开花的强大工具,能够处理编程、文本、数学等各种复杂任务,堪称是数字领域的多面手。
DeepSeek-V3 以前身 DeepSeek-V2 经过验证的框架为基础,采用了多头潜在注意力机制(MLA)和领先的 DeepSeekMoE 架构,这些为 DeepSeek-V3 带来了更加经济高效的训练和推理过程。该模型还实现了多 token 预测,增强了同时预测多个 token 的能力,这不仅加快了模型的推理速度,还可以使模型变得更加智能。
值得注意的是,DeepSeek-V3 是开源社区首个成功采用 FP8 混合精度框架的 MoE 大模型,具备更快的计算速度和更低的内存占用,同时还保证了数值的稳定性。据悉,DeepSeek-V3 拥有 6710 亿参数规模,尽管规模巨大、复杂度高,但训练过程异常稳定,整个周期内没有出现无法挽回的损失峰值或回滚。
By Paul Gauthier, last updated December 26, 2024.
而 DeepSeek-V3 所展现的能力,也令众人眼前一亮。根据 Aider 多语言编程测评结果,DeepSeek-V3-Base 的编程跑分仅次于 OpenAI o1-2024-12-17 (high) ,超越了 claude-3.5-sonnet-20241022、Gemini-Exp-1206、o1-mini-2024-09-12、gemini-2.0-flash-exp 等主流大模型以及其前身 DeepSeek Chat V2.5。相比 V2.5,其编程性能大幅增长到了 48.4%,提升了近 31%。
来源:深度求索(DeepSeek)
而且,众所周知,数学一直是大模型的“短板”所在,它们在处理复杂的数学问题时常常显得力不从心,无法像人类一样准确地进行逻辑推理和计算。然而,DeepSeek-V3 却在这一领域取得了显著的突破。之前,DeepSeek-V3 已与其他几种模型进行了基准测试,包括 LLaMA-3.1-405B 和 GPT-4o-0513,结果超乎想象。DeepSeek-V3 在数学问题解决上表现出了极强的能力,它在 MATH 500 的基准测试中达到了 90.2% 的准确率 ,另外在 AIME 这样的高级数学竞赛上也有接近 40% 的准确率 ,远远超过了主流的闭源大模型。此外,基准测试的结果显示,DeepSeek-V3 在语言能力理解和代码任务上也处于领先水平。
在这个新版本的发布中,DeepSeek 也延续了“AI 界拼多多”的作风,相比于昂贵的闭源大模型,DeepSeek-V3 的性价比才是最大亮点,成为了那些希望以低成本体验大模型的人的首选解决方案。这一切都得益于其更高效的训练过程及更低的训练成本。
DeepSeek-V3 模型仅在 2048 个 GPU 上训练了 2 个月,耗资 557 万美元。OpenAI 的创始成员 Andrej Karpathy 表示,DeepSeek-V3 理论上需要接近 16000 个 GPU 的集群进行训练。之前,Llama 3 405B 使用了 3080 万个 GPU 小时,这个数字大约是 DeepSeek-V3 的 11 倍,而 DeepSeek V3 的训练成本也与 GPT-4 的 7800 万美元形成鲜明对比。这意味着前沿的大模型训练并不需要动辄万卡的算力集群,为更高效、更经济的 AI 开发打开大门。
来源:lmarena.ai/
自从推出以来,DeepSeek-V3 在人工智能领域掀起了轩然大波,影响力不亚于《黑神话:悟空》对于游戏圈的冲击。聊天机器人竞技场(Chatbot Arena)在 2024 年 12 月 29 日的数据显示,仅仅发布三天的 DeepSeek-V3 就攀升到了全模型榜单的第七位,在开源模型中排名第一,也是前十名中唯一的开源国产模型。而且,随着越来越多开发者的使用,它的未来还有更广阔的创新蓝图。
划重点!!想要零成本体验这个干翻硅谷的国产大模型,现在就是最佳时机!直接进入 console.d.run/ ,即可体验。如此难得的白嫖机会,怎么能够错过呢!