**国信证券-电子行业AI+系列专题报告(六):DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求******

71 阅读1分钟

DeepSeek自2023年7月成立后发展迅猛,成为开源大模型领域的佼佼者。2024年12月发布的DeepSeek-V3性能对标海外领军闭源模型,训练成本却仅557.6万美元,远低于同类。2025年1月的DeepSeek-R1在数学、代码等任务上性能比肩OpenAI-o1正式版,其人工智能助手在140个市场的移动应用下载榜名列前茅,还获微软、英伟达等大厂及华为云支持。

技术层面,DeepSeek通过MLA和DeepSeekMoE技术,实现高效推理与低成本训练,利用DualPipe算法和混合精度训练优化计算与通信。在强化学习架构上不断创新,分阶段演进提升性能。

随着AI应用爆发,模型数量、参数及数据量增长推动算力需求激增。全球AI大模型数量截至24年7月约1328个,竞争激烈且向多模态转变。这促使定制化芯片ASIC需求上升,云服务商资本开支增加,预计2026年全球AI服务器出货量达237万台,2023-2026年CAGR为26%。

以下为报告节选内容:

免费完整版报告可至天罡智算官网(tiangangaitp.com/club/knowle…

图片18.png

图片19.png

图片20.png

图片21.png

图片22.png