MantaKV 如何突破 AI 推理性能瓶颈? | 龙蜥大讲堂

0 阅读1分钟

「龙蜥大讲堂」4 月精彩预告来了,点击下方海报抢先了解。欢迎扫描海报二维码提前进群,立即预约锁定这场 AI 推理场景技术分享!

MantaKV:基于 CXL 共享内存的 KVCache 创新管理方案介绍

直播时间: 2026 年 04 月 01 日 (周三)16:00-17:00

直播内容:

本次直播将深入剖析 AI 推理场景的核心需求与性能优化痛点,重点提出基于龙蜥操作系统面向 CXL 的 KVCache 管理解决方案;聚焦于 PD 分离架构下的 KVCache 复用场景,详细介绍 MantaKV 的创新机制,并展示其相较于传统 RDMA 方案所取得的显著性能提升。

适合人群:

AI 推理软件研发工程师。

讲师介绍:

Yihong Lian,浪潮信息系统软件架构师,研究领域为软件工程、分布式系统架构和设计。作为 MantaKV 的核心研发者,目前从事基于 CXL 共享内存加速 AI 推理的基础设施建设。

小龙温馨提醒:往期龙蜥大讲堂视频回放已上线至龙蜥官网,欢迎观看,有任何疑问欢迎随时咨询龙蜥助手—小龙(微信:openanolis_assis)。