深挖算法效能,突破算力桎梏的技术路径

3 阅读1分钟

DeepSeek V4与R2发布时程仍未公布

中国AI独角兽DeepSeek对其下一代模型V4和R2的发布时间守口如瓶。尽管外界普遍猜测其可能在即将到来的农历新年期间发布,但该公司拒绝对具体日期置评。

相反,该公司正以其研究成果发声。最近几周,DeepSeek发表了多篇技术论文,概述了绕过当前硬件限制的新方法。由于某些限制措施制约了获取先进GPU的途径,其最新研究聚焦于算法效率。

本周二,该公司介绍了“Engram”——一种旨在解决GPU高带宽内存短缺的条件记忆技术,这是扩展AI规模的关键瓶颈。此前,一篇由CEO梁文锋合著的论文提出了“流形约束超连接”(mHC)框架,该框架旨在以更具成本效益的方式训练大规模系统。

分析师认为,这些创新是在地缘政治逆风中保持发展势头的战略举措。“某中心只是想证明,AI基础设施的创新将推动效率提升,”一位驻北京的信息系统架构师张瑞望表示。

尽管V3和R1模型后继者的发布日期仍是个谜,但该公司确认其核心团队保持完整。一篇关于R1模型的更新论文指出,最初的18位核心科学家全部仍在公司任职,这与中国业内的高流动率形成了鲜明对比。