2025 年 12 月 29 日,鲲鹏昇腾创新大赛全国总决赛 2025 在广东松山湖三丫坡落下帷幕。
在昇腾 AI 创新大赛 · 初创赛道中,记忆张量 MemTensor 凭借项目 《基于记忆强化的 CANN 算子持续进化方案》,获得全国总决赛 · 初创赛道金奖。
作为自主创新计算与 AI 领域的顶级赛事,本届大赛共吸引 6310 支队伍、13655 名选手,覆盖全国 51 个赛区。
总决赛汇聚了从全国多赛区突围的 85 支鲲鹏赛队与 96 支昇腾赛队,通过全天路演答辩与权威评审,最终决出初创赛道唯二两家金奖。
记忆强化的 CANN 算子持续进化方案:把“经验”写进系统里的实践
在昇腾 CANN 的算子开发过程中,高性能算子的构建高度依赖专家经验。这些经验往往来自长期试错:哪些实现方式在某类算子上有效,哪些优化在特定硬件条件下会失效,哪些写法在功能正确但性能不可接受。
这些经验大多以零散形式存在,很难被系统性地保存、检索和复用,并会遇到以下问题:
- 高性能算子极度依赖专家经验;
- 知识分散在文档、代码、Issue 和个人脑袋里;
- 新硬件一来,经验几乎要重来一遍;
- 自动生成算子,但很难持续变好......
当硬件持续演进、算子类型不断变化时,这种“经验无法积累”的状态,会直接拉低整体开发效率,也限制了算子生态的规模化扩展。
算子开发这件事,能不能像系统一样,越用越聪明?
让系统拥有“可更新的记忆”
本项目尝试引入一种基于记忆强化的自进化机制,核心是一套 MemOS + MemRL 的闭环自进化机制,我们把它落在了昇腾 CANN 算子生态上,将算子开发过程中的知识与经验,显式纳入系统结构中进行管理。
在实现上,我们围绕算子开发流程构建了一个闭环体系:系统在生成与验证算子的过程中,会持续记录与任务相关的多源信息,包括 API 文档片段、历史代码实现、成功路径以及失败案例。这些信息不再只是被“存下来”,而是被组织成一个动态价值记忆库。
简单来说:
- 构建一个动态价值记忆库:统一管理 API 文档、代码片段、成功经验、失败反思;
- 为每一条“记忆”引入效用值:用任务反馈不断更新它的价值;
- 在算子生成与优化过程中:优先检索“被验证过、真的有用”的历史经验。
每一条记忆都会随着实际任务反馈不断更新其价值评估。通过引入效用值机制,系统能够逐步区分哪些经验在当前任务分布下更有参考意义,哪些经验应当被弱化甚至淘汰。这样,记忆不再是静态知识,而是一个会随使用不断演化的集合。
记忆如何真正参与算子生成?
在算子生成阶段,系统会基于当前任务特征,从记忆库中检索与之相似且价值更高的历史经验,并将这些经验作为参考输入,参与后续的生成与决策过程。
随着任务数量的增加和反馈的持续引入,系统对“哪些经验在什么情况下有效”的判断会逐渐收敛,形成一种正反馈闭环:
用得越多 → 记得越准 → 优化越快
实验与当前进展
为了验证方案的有效性,我们基于 MultiKernelBench 构建了完整的算子评测流程,支持多并发算子编译与功能正确性验证。同时,为避免模型在生成过程中“投机取巧”,引入了 rule-based 与 model-based 相结合的代码审查机制。
在当前阶段的实验中,引入效用值机制与 selected-shot 策略后,系统在 Level1 算子上的准确率达到** 81%,在Level2 算子上达到 34.8%**。在高难度融合算子测试集上,系统实现了 40% 的正确率,是非 Agent 方案最强模型的 5 倍。
所有实验过程、数据与榜单结果均已公开,确保评测过程与结果可追溯、可复现,部分算子已进入 华为计算产品线验证流程。
👉 实时榜单与实验进展:rl4cann.zhuo.li/
后续计划
下一阶段,MemRL 团队将围绕“更稳的正确性、更可信的性能、更强的泛化、以及更快的工程落地”四个方向,持续推进 MemOS + MemRL 的自进化闭环,把算子能力从“能生成”升级为“可交付、可规模化”。
通过集成系统级性能分析和 profiling,我们将把向量单元利用率、流水线冲突等微观硬件指标引入反馈闭环,驱动 Agent 进行指令级算子优化。同时,我们将挑战自动驾驶感知链路中高难度的融合算子,验证我们的系统不止能打榜,也能在复杂工业场景下写出超越专家手工优化的代码,证明“记忆驱动”的生成范式完全具备承载核心业务的能力。
针对复杂算子生成中面临的代码幻觉与结构理解瓶颈,我们引入 model-checker 机制,进一步加强生成代码合法性的验证;另一方面,正在探索基于 Feature Tree 与 Feature Graph 的新表征方式,并验证其与现有记忆 pipeline 融合的可行性。
MemRL 愿以昇腾为起点,以具备持续学习能力的智能系统,将每一次试错的‘经验’转化为可复用的智慧。
项目成员
李 卓 | 上海交通大学 硕士一年级 郑雨杰 | 上海交通大学 硕士一年级
王嘉乾 | 西安电子科技大学 博士研究生二年级
张圣涛 | 西安交通大学 本科四年级
温睦宁 | 上海交通大学人工智能学院 助理研究员
唐 波 | 记忆张量 MemTensor 应用算法负责人