记忆张量斩获昇腾 AI 创新大赛 2025 全国总决赛金奖在昇腾 AI 创新大赛 · 初创赛道中，记忆张量 MemTen

logo动态.jpg

2025 年 12 月 29 日，鲲鹏昇腾创新大赛全国总决赛 2025 在广东松山湖三丫坡落下帷幕。

在昇腾 AI 创新大赛 · 初创赛道中，记忆张量 MemTensor 凭借项目《基于记忆强化的 CANN 算子持续进化方案》，获得全国总决赛 · 初创赛道金奖。

作为自主创新计算与 AI 领域的顶级赛事，本届大赛共吸引 6310 支队伍、13655 名选手，覆盖全国 51 个赛区。

总决赛汇聚了从全国多赛区突围的 85 支鲲鹏赛队与 96 支昇腾赛队，通过全天路演答辩与权威评审，最终决出初创赛道唯二两家金奖。

记忆强化的 CANN 算子持续进化方案：把“经验”写进系统里的实践

在昇腾 CANN 的算子开发过程中，高性能算子的构建高度依赖专家经验。这些经验往往来自长期试错：哪些实现方式在某类算子上有效，哪些优化在特定硬件条件下会失效，哪些写法在功能正确但性能不可接受。

这些经验大多以零散形式存在，很难被系统性地保存、检索和复用，并会遇到以下问题：

高性能算子极度依赖专家经验；
知识分散在文档、代码、Issue 和个人脑袋里；
新硬件一来，经验几乎要重来一遍；
自动生成算子，但很难持续变好......

当硬件持续演进、算子类型不断变化时，这种“经验无法积累”的状态，会直接拉低整体开发效率，也限制了算子生态的规模化扩展。

算子开发这件事，能不能像系统一样，越用越聪明？

让系统拥有“可更新的记忆”

本项目尝试引入一种基于记忆强化的自进化机制，核心是一套 MemOS + MemRL 的闭环自进化机制，我们把它落在了昇腾 CANN 算子生态上，将算子开发过程中的知识与经验，显式纳入系统结构中进行管理。

在实现上，我们围绕算子开发流程构建了一个闭环体系：系统在生成与验证算子的过程中，会持续记录与任务相关的多源信息，包括 API 文档片段、历史代码实现、成功路径以及失败案例。这些信息不再只是被“存下来”，而是被组织成一个动态价值记忆库。

简单来说：

构建一个动态价值记忆库：统一管理 API 文档、代码片段、成功经验、失败反思；
为每一条“记忆”引入效用值：用任务反馈不断更新它的价值；
在算子生成与优化过程中：优先检索“被验证过、真的有用”的历史经验。

每一条记忆都会随着实际任务反馈不断更新其价值评估。通过引入效用值机制，系统能够逐步区分哪些经验在当前任务分布下更有参考意义，哪些经验应当被弱化甚至淘汰。这样，记忆不再是静态知识，而是一个会随使用不断演化的集合。

记忆如何真正参与算子生成？

在算子生成阶段，系统会基于当前任务特征，从记忆库中检索与之相似且价值更高的历史经验，并将这些经验作为参考输入，参与后续的生成与决策过程。

随着任务数量的增加和反馈的持续引入，系统对“哪些经验在什么情况下有效”的判断会逐渐收敛，形成一种正反馈闭环：

用得越多 → 记得越准 → 优化越快

实验与当前进展

为了验证方案的有效性，我们基于 MultiKernelBench 构建了完整的算子评测流程，支持多并发算子编译与功能正确性验证。同时，为避免模型在生成过程中“投机取巧”，引入了 rule-based 与 model-based 相结合的代码审查机制。

在当前阶段的实验中，引入效用值机制与 selected-shot 策略后，系统在 Level1 算子上的准确率达到** 81%，在Level2 算子上达到 34.8%**。在高难度融合算子测试集上，系统实现了 40% 的正确率，是非 Agent 方案最强模型的 5 倍。

所有实验过程、数据与榜单结果均已公开，确保评测过程与结果可追溯、可复现，部分算子已进入华为计算产品线验证流程。

👉 实时榜单与实验进展：rl4cann.zhuo.li/

后续计划

下一阶段，MemRL 团队将围绕“更稳的正确性、更可信的性能、更强的泛化、以及更快的工程落地”四个方向，持续推进 MemOS + MemRL 的自进化闭环，把算子能力从“能生成”升级为“可交付、可规模化”。

通过集成系统级性能分析和 profiling，我们将把向量单元利用率、流水线冲突等微观硬件指标引入反馈闭环，驱动 Agent 进行指令级算子优化。同时，我们将挑战自动驾驶感知链路中高难度的融合算子，验证我们的系统不止能打榜，也能在复杂工业场景下写出超越专家手工优化的代码，证明“记忆驱动”的生成范式完全具备承载核心业务的能力。

针对复杂算子生成中面临的代码幻觉与结构理解瓶颈，我们引入 model-checker 机制，进一步加强生成代码合法性的验证；另一方面，正在探索基于 Feature Tree 与 Feature Graph 的新表征方式，并验证其与现有记忆 pipeline 融合的可行性。

MemRL 愿以昇腾为起点，以具备持续学习能力的智能系统，将每一次试错的‘经验’转化为可复用的智慧。

项目成员

李卓｜上海交通大学硕士一年级郑雨杰｜上海交通大学硕士一年级

王嘉乾｜西安电子科技大学博士研究生二年级

张圣涛｜西安交通大学本科四年级

温睦宁｜上海交通大学人工智能学院助理研究员

唐波｜记忆张量 MemTensor 应用算法负责人