DeepSeek认知之旅

74 阅读1分钟

DeepSeek《认知之旅》记录了DeepSeek V3/R1相关的8篇核心论文,以及最新的原生可训练稀疏注意力机制NSA论文中描述的关键要点,以时间顺序按脑图的形式整理到白板文件中,供大家学习使用。

其中每篇论文的脑图都记录了对应的研究背景、核心贡献、研究方法、评估结果以及一些非常重要的讨论和洞见,用全局视角从这份文件中或可窥得DeepSeek获得如此巨大成功的一些小线索。

2025-02-24开源周项目FlashMLA相关信息已更新,FlashMLA成就:GPU带宽利用接近理论极限,算力利用效率翻倍。

需要知晓后续进展的关注文档变更即可。

白板链接:kcnrgc2yrax7.feishu.cn/docx/AJo5dV…