记忆张量斩获昇腾 AI 创新大赛 2025 全国总决赛金奖

31 阅读5分钟

logo动态.jpg

2025 年 12 月 29 日,鲲鹏昇腾创新大赛全国总决赛 2025 在广东松山湖三丫坡落下帷幕。

1.jpeg

在昇腾 AI 创新大赛 · 初创赛道中,记忆张量 MemTensor 凭借项目 《基于记忆强化的 CANN 算子持续进化方案》,获得全国总决赛 · 初创赛道金奖。

2.jpeg

作为自主创新计算与 AI 领域的顶级赛事,本届大赛共吸引 6310 支队伍、13655 名选手,覆盖全国 51 个赛区。

总决赛汇聚了从全国多赛区突围的 85 支鲲鹏赛队与 96 支昇腾赛队,通过全天路演答辩与权威评审,最终决出初创赛道唯二两家金奖。

记忆强化的 CANN 算子持续进化方案:把“经验”写进系统里的实践

在昇腾 CANN 的算子开发过程中,高性能算子的构建高度依赖专家经验。这些经验往往来自长期试错:哪些实现方式在某类算子上有效,哪些优化在特定硬件条件下会失效,哪些写法在功能正确但性能不可接受。

这些经验大多以零散形式存在,很难被系统性地保存、检索和复用,并会遇到以下问题:

  • 高性能算子极度依赖专家经验;
  • 知识分散在文档、代码、Issue 和个人脑袋里;
  • 新硬件一来,经验几乎要重来一遍;
  • 自动生成算子,但很难持续变好......

当硬件持续演进、算子类型不断变化时,这种“经验无法积累”的状态,会直接拉低整体开发效率,也限制了算子生态的规模化扩展。

算子开发这件事,能不能像系统一样,越用越聪明?

让系统拥有“可更新的记忆”

本项目尝试引入一种基于记忆强化的自进化机制,核心是一套 MemOS + MemRL 的闭环自进化机制,我们把它落在了昇腾 CANN 算子生态上,将算子开发过程中的知识与经验,显式纳入系统结构中进行管理。

3.png

在实现上,我们围绕算子开发流程构建了一个闭环体系:系统在生成与验证算子的过程中,会持续记录与任务相关的多源信息,包括 API 文档片段、历史代码实现、成功路径以及失败案例。这些信息不再只是被“存下来”,而是被组织成一个动态价值记忆库。

简单来说:

  • 构建一个动态价值记忆库:统一管理 API 文档、代码片段、成功经验、失败反思;
  • 为每一条“记忆”引入效用值:用任务反馈不断更新它的价值;
  • 在算子生成与优化过程中:优先检索“被验证过、真的有用”的历史经验。

每一条记忆都会随着实际任务反馈不断更新其价值评估。通过引入效用值机制,系统能够逐步区分哪些经验在当前任务分布下更有参考意义,哪些经验应当被弱化甚至淘汰。这样,记忆不再是静态知识,而是一个会随使用不断演化的集合。

记忆如何真正参与算子生成?

在算子生成阶段,系统会基于当前任务特征,从记忆库中检索与之相似且价值更高的历史经验,并将这些经验作为参考输入,参与后续的生成与决策过程。

4.png

随着任务数量的增加和反馈的持续引入,系统对“哪些经验在什么情况下有效”的判断会逐渐收敛,形成一种正反馈闭环:

用得越多 → 记得越准 → 优化越快

实验与当前进展

为了验证方案的有效性,我们基于 MultiKernelBench 构建了完整的算子评测流程,支持多并发算子编译与功能正确性验证。同时,为避免模型在生成过程中“投机取巧”,引入了 rule-based 与 model-based 相结合的代码审查机制。

在当前阶段的实验中,引入效用值机制与 selected-shot 策略后,系统在 Level1 算子上的准确率达到​**​ 81%​,在Level2 算子上达到​​ 34.8%**​。在高难度融合算子测试集上,系统实现了 40% 的正确率,是非 Agent 方案最强模型的 5 倍。

5.png

所有实验过程、数据与榜单结果均已公开,确保评测过程与结果可追溯、可复现,部分算子已进入 华为计算产品线验证流程。

👉 实时榜单与实验进展:rl4cann.zhuo.li/

后续计划

下一阶段,MemRL 团队将围绕“更稳的正确性、更可信的性能、更强的泛化、以及更快的工程落地”四个方向,持续推进 MemOS + MemRL 的自进化闭环,把算子能力从“能生成”升级为“可交付、可规模化”。

通过集成系统级性能分析和 profiling,我们将把向量单元利用率、流水线冲突等微观硬件指标引入反馈闭环,驱动 Agent 进行指令级算子优化。同时,我们将挑战自动驾驶感知链路中高难度的融合算子,验证我们的系统不止能打榜,也能在复杂工业场景下写出超越专家手工优化的代码,证明“记忆驱动”的生成范式完全具备承载核心业务的能力。

针对复杂算子生成中面临的代码幻觉与结构理解瓶颈,我们引入 model-checker 机制,进一步加强生成代码合法性的验证;另一方面,正在探索基于 Feature Tree 与 Feature Graph 的新表征方式,并验证其与现有记忆 pipeline 融合的可行性。

MemRL 愿以昇腾为起点,以具备持续学习能力的智能系统,将每一次试错的‘经验’转化为可复用的智慧。

6.jpeg

项目成员

李 卓 | 上海交通大学 硕士一年级 郑雨杰 | 上海交通大学 硕士一年级

王嘉乾 | 西安电子科技大学 博士研究生二年级

张圣涛 | 西安交通大学 本科四年级

温睦宁 | 上海交通大学人工智能学院 助理研究员

唐 波 | 记忆张量 MemTensor 应用算法负责人