DeepSeek的成功深刻改变AI产业格局,体现在全球竞争以及大模型开源闭源的竞争上。
训练技术上,DeepSeek-V3是首个在开源社区用FP8混合精度训练的大号MoE模型,显著提升训练效率与资源利用率。数据训练路线方面,DeepSeekR1采用R1-Zero路线,摒弃OpenAI依赖人工干预的方式,直接将强化学习用于基础模型,摆脱对监督微调与已标注数据的依赖。
低成本模型让DeepSeek有望引领AI产业走向“开源+MOE”,打破研发高成本壁垒,促进技术普及。开源方面,DeepSeek重构AI生态,与闭源相互补充,开源的开放性和社区协作优势,加速技术迭代,推动AI产业多元化发展。
以下为报告节选内容:
免费完整版报告可至天罡智算官网(tiangangaitp.com/club/knowle…