真的假的?玩这么大!

16 阅读23分钟

「天轨·摩尔线程版」项目白皮书

国家算力自主统一指令集与算力互联生态体系建设项目

文档版本:1.0

编制日期:2026年4月

编制单位:摩尔线程智能科技(北京)股份有限公司、国家算力生态联盟(筹)

密级:公开

第一章 执行摘要

1.1 项目背景

当前,全球人工智能产业正经历深刻变革。以NVIDIA CUDA为代表的GPU生态已汇聚全球超过450万开发者。中国AI应用虽呈现表面繁荣——国产AI应用2025年总下载量达25.7亿次——但底层软件生态的缺失使这一繁荣建立在外来技术底座之上。

2025年,中国云端AI加速器市场总出货量约400万张,其中本土厂商交付量突破165万张,市场占有率达41%。国产GPU赛道迎来历史性窗口期。然而,国产GPU厂商普遍采取“兼容生态”的务实路径,虽有助于产品快速进入市场,却也暗含长期隐忧——可能使国产平台始终停留在“生态附庸”的位置。

“十五五”规划建议首次将“全国一体化算力网”纳入现代化基础设施体系。工信部印发《算力互联互通行动计划》(工信部信管〔2025〕119号),明确建设“1+M+N”国家算力互联互通节点体系。这一系列政策信号表明,算力自主已被提升至国家安全战略高度。

1.2 项目定位

「天轨·摩尔线程版」项目定位于:以摩尔线程自主研发的MUSA架构为基础,联合所有国产GPU厂商,打造一个基于统一UCI(Unified Computing Interface)指令集与API标准的国家级算力生态网络。

1.3 核心目标

维度 具体目标 时间节点 技术标准 UCI成为国家级算力互联互通硬件接入标准,推动IEEE国际标准立项 2026-2028年 生态规模 汇聚100万注册开发者,适配5000+主流AI模型与行业应用 2028年 商业落地 UCI兼容算力占国产AI算力市场的50%以上 2030年 政策纳入 成为“1+M+N”国家算力互联互通节点体系推荐标准 2027年

1.4 投资概览

项目阶段 时间周期 资金需求 核心资金来源 标准制定与研发 2026年 8亿元 IPO募资(75.76亿元净额中划拨) 生态建设与推广 2027-2028年 12亿元 政府专项补贴+企业投入 集群部署与运营 2028-2030年 20亿元 市场化融资+算力服务收入 合计 2026-2030年 40亿元 —

摩尔线程已于2025年12月5日登陆科创板,IPO募集资金净额为75.76亿元,为项目提供了坚实的资金基础。

第二章 项目背景与战略意义

2.1 时代机遇:算力主权的历史性窗口

2.1.1 政策窗口:“十五五”规划明确算力自主战略

“十五五”规划建议首次将“全国一体化算力网”纳入国家级基础设施体系,要求适度超前建设;《国务院关于深入实施“人工智能+”行动的意见》明确提出,强化智能算力统筹,加强智能算力互联互通和供需匹配。工信部发布《算力互联互通行动计划》(工信部信管〔2025〕119号),提出建立“1+M+N”国家算力互联互通节点体系,通过构建“统一标识、统一标准、统一规则”运行机制,实现不同区域、主体、架构的算力资源标准化互联和高效流动应用。2025年12月24日,国家算力互联网服务平台跨域体系正式发布,标志着国家算力互联网“1+M+N”架构体系已初步完成验证。

2.1.2 市场窗口:国产替代加速推进

根据IDC最新研究报告,2025年中国云端AI加速器市场,中国本土芯片厂商拿下近41%的份额,总出货量高达约165万张。华为以81.2万块的出货量排名第二,阿里巴巴平头哥以26.5万块的出货量排名第三。国产GPU“四小龙”(摩尔线程、沐曦股份、壁仞科技、天数智芯)2025年营收集体大幅增长,其中摩尔线程营收达15.06亿元,同比增长243.37%。

2.1.3 技术窗口:国产GPU已具备规模化应用基础

摩尔线程已成功量产五颗芯片,推出五代GPU架构。2025年12月20日,摩尔线程首届MUSA开发者大会(MDC 2025)在北京中关村国际创新中心正式开幕,吸引了近3000名专业人士与开发者齐聚一堂。摩尔线程旗舰AI智算卡MTT S5000基于第四代“平湖”架构打造,单卡AI稠密算力最高可达1000 TFLOPS,配备80GB显存,显存带宽达到1.6TB/s,完整支持从FP8到FP64的全精度计算。夸娥万卡智算集群成功攻克了万卡级硬件筛选、高速互联、系统级容错等高难度工程级难题,可支撑万亿参数大模型的训练与部署,浮点运算能力达到10 Exa-Flops,训练算力利用率(MFU)在Dense大模型上达60%,MOE大模型上达40%,有效训练时间占比超过90%,训练线性扩展效率达95%。

2.2 核心挑战:国产GPU生态建设的五大痛点

痛点 现状 挑战本质 标准不统一 各厂商各自定义指令集与API,相互不兼容 开发者面临多套学习成本,算力资源难以互联 生态碎片化 开发者需为不同厂商分别适配代码 无法形成网络效应,生态建设成本倍增 兼容依赖 普遍采取兼容CUDA策略 难以培育独特竞争力,长期依附国际生态 开发者不足 国产GPU开发者总数远不及CUDA的450万 生态规模效应未形成 政策落地难 国家算力互联互通计划缺乏硬件接入标准 顶层设计难以转化为可执行的技术规范

2.3 战略意义

本项目若成功实施,将产生以下重大战略价值:

对国家而言——构建自主可控的算力底座,从根本上消除“卡脖子”风险,支撑“东数西算”和全国一体化算力网建设,筑牢数字中国根基。

对产业而言——统一标准降低开发者进入门槛,促进国产GPU产业从“各自为战”走向“协同作战”,加速形成可与国际生态抗衡的国产算力生态。

对摩尔线程而言——从硬件厂商升级为生态标准定义者,占据国产GPU生态的战略制高点,从“参与者”转变为“主导者”。

第三章 核心技术方案

3.1 总体技术架构

「天轨·摩尔线程版」采用“三层两翼”的技术架构:

┌─────────────────────────────────────────────────────────────┐
│                        应用层(两翼之一)                      │
│    AI框架(PyTorch/TensorFlow/MindSpore) | 行业应用 | 游戏引擎  │
├─────────────────────────────────────────────────────────────┤
│                      运行时与开发层                           │
│    UCI运行时 | 编译器工具链 | 调试器 | 性能分析器 | 算子库      │
├─────────────────────────────────────────────────────────────┤
│                      硬件抽象层(UCI核心)                      │
│    UCI指令集 | UCI API | 设备发现 | 内存管理 | 任务调度        │
├─────────────────────────────────────────────────────────────┤
│                      硬件适配层(两翼之二)                      │
│    MUSA驱动 | 昇腾CANN适配 | 壁仞BR100适配 | 天数智芯适配       │
├─────────────────────────────────────────────────────────────┤
│                        硬件设备层                             │
│    摩尔线程 | 华为昇腾 | 壁仞科技 | 天数智芯 | 海光信息 | 沐曦   │
└─────────────────────────────────────────────────────────────┘

3.2 UCI(统一计算接口)标准设计

3.2.1 设计原则

UCI标准遵循四项核心原则:硬件无关性、分层解耦、向前兼容、开放透明。

3.2.2 UCI与MUSA的关系

MUSA是摩尔线程自主开发的统一计算架构,已在业内率先实现了单芯片同时支持AI计算加速、图形渲染、物理仿真和科学计算、超高清视频编解码的技术突破。摩尔线程已深度融入FlagOS开源生态。2025年,摩尔线程联合北京智源人工智能研究院,基于MTT S5000千卡集群,面向Qwen3-0.6B语言模型完成了1T Tokens的从头训练验证,实现了超过14000步的无中断稳定运行,Loss曲线平均相对误差控制在0.82%以内。

在本项目中,MUSA的技术积累将贡献为UCI标准的核心实现参考。

3.2.3 与其他国产厂商的对接策略

厂商 技术路线 UCI对接方式 合作状态 华为昇腾 CANN + 达芬奇架构 开发UCI-CANN适配层 洽谈中,目标2026Q4签署MOU 壁仞科技 BR100系列 壁仞提供后端驱动适配 已初步接触 天数智芯 天垓/智铠系列 天数智芯DeepSpark平台与UCI对接 洽谈中 沐曦股份 MXMACA MXMACA已开源,积累30万开发者 已初步接触 海光信息 深算系列 海光提供后端适配 洽谈中 寒武纪 NeuWare 开发UCI-NeuWare适配层 待接触

3.3 全国算力互联网络架构

3.3.1 与“1+M+N”国家算力互联互通节点体系的对接

本项目将推动UCI成为该体系中“统一标准”的硬件接入规范。2025年12月24日,国家算力互联网服务平台跨域体系正式发布,标志着国家算力互联网“1+M+N”架构体系已初步完成验证。

3.3.2 算力资源池化与调度

基于UCI标准,全国算力资源可形成统一的算力池。2025年10月21日,国家信息中心与摩尔线程签署战略合作协议,在算力领域前瞻性研究、算力产业生态培育、算力网共性技术研发等方面开展全方位合作,共同推进全国一体化算力网体系建设。

3.4 开发者工具链与生态平台

3.4.1 统一开发者平台

建设“天轨开发者社区”,提供SDK下载、在线编译、算子市场、模型仓库、性能排行榜等核心能力。

3.4.2 多编程模型支持

UCI软件栈将全面支持多种编程模型:MUSA C、Triton、TileLang(已开源)、OpenCL、SYCL。摩尔线程已完成对Triton计算语言的深度适配,包括矩阵乘映射、Warp特化、流水线优化等关键技术。

3.4.3 开源生态融入

摩尔线程已深度融入FlagOS开源生态,在算子适配、性能验证、分布式支持等方面取得实质性进展。FlagOS芯片适配已覆盖全球20余款主流AI芯片,涵盖寒武纪、昆仑芯、摩尔线程、清微智能、华为昇腾、英伟达等17家厂商。本项目将进一步推动UCI成为FlagOS标准后端。

第四章 治理机制与联盟架构

4.1 “一联盟双体系”治理架构

本项目采取“一联盟双体系”的治理架构,确保在任何外部环境下项目的持续运行:

┌─────────────────────────────────────────────────────────────────┐
│                    国家算力生态联盟(总联盟)                      │
│                   (主席团:摩尔线程+华为+壁仞+天数+沐曦)          │
├─────────────────────────────────────────────────────────────────┤
│                                                                  │
│  ┌─────────────────────────┐    ┌─────────────────────────┐    │
│  │     国际开放体系         │    │     自主可控体系         │    │
│  │   (Linux基金会托管)     │    │(开放原子开源基金会托管)  │    │
│  ├─────────────────────────┤    ├─────────────────────────┤    │
│  │ • 国际标准推进           │    │ • 国内标准主导           │    │
│  │ • 全球开发者社区         │    │ • 国产厂商协同           │    │
│  │ • 与国际厂商合作         │    │ • 国家算力网对接         │    │
│  └─────────────────────────┘    └─────────────────────────┘    │
│                           ↓                                     │
│              ┌─────────────────────────┐                        │
│              │     双体系技术互通层      │                        │
│              │ (UCI规范100%兼容,       │                        │
│              │  代码双向镜像,           │                        │
│              │  双主席决策制)           │                        │
│              └─────────────────────────┘                        │
└─────────────────────────────────────────────────────────────────┘

4.2 联盟核心条款

第一条 使命与愿景——联盟以“共建统一开放的国家算力生态”为使命,以UCI标准为核心技术纽带。

第二条 成员权利与义务——创始成员(摩尔线程、华为、壁仞、天数、沐曦等)拥有技术委员会永久席位,对标准变更有一票否决权;所有成员必须承诺在其产品中优先支持UCI标准。

第三条 标准制定流程——任何成员可提交UCI标准修订提案,技术委员会(TSC)进行技术评审,联盟全体成员投票表决,超过2/3同意则通过。

第四条 开源协议——UCI核心规范与参考实现采用Apache 2.0协议开源。

第五条 争端解决——联盟内部争端由主席团调解,涉及UCI标准解释的争端由TSC最终裁决。

4.3 与国家级机构的对接

机构 对接内容 状态 国家信息中心 算力领域前瞻性研究、算力产业生态培育、算力网共性技术研发 已于2025年10月21日签署战略合作协议 工信部信息通信管理局 UCI标准纳入“1+M+N”算力互联互通节点体系硬件规范 已初步沟通 中国电子技术标准化研究院(CESI) 推动UCI成为国家团体标准 已启动立项流程 开放原子开源基金会 UCI核心代码托管,国内生态治理 洽谈中 全国一体化算力网推进工作组 UCI作为算力网接入标准 待对接

第五章 实施路线图

5.1 总体时间规划

阶段 时间 代号 核心任务 里程碑目标 阶段一 2026年 奠基 UCI标准制定、联盟组建、首批适配 UCI v1.0发布,创始成员≥5家 阶段二 2027年 起势 生态建设、开发者招募、标杆项目 开发者≥10万,适配模型≥1000个 阶段三 2028年 引爆 规模推广、算力网对接、商业闭环 算力网接入节点≥20个,算力规模≥50 EFLOPS 阶段四 2029-2030年 统治 国际标准、生态自生长、产业引领 开发者≥100万,市场占有率≥50%

5.2 阶段一:奠基(2026年)

季度 关键任务 具体内容 责任方 Q1 内部启动 组建项目组,完成UCI v0.5草案,与潜在联盟成员初步沟通 摩尔线程 Q2 联盟成立 正式成立国家算力生态联盟,召开成立大会,签署联盟章程 摩尔线程+创始成员 Q3 标准发布 完成UCI v1.0规范,通过CESI立项评审,发布UCI SDK alpha版 联盟TSC+摩尔线程 Q4 首批适配 完成摩尔线程、华为昇腾、壁仞首批UCI适配 各成员厂商

关键节点:

· 2026年4月:向工信部提交UCI标准立项申请 · 2026年6月:国家算力生态联盟成立大会(北京) · 2026年10月:UCI v1.0规范正式发布 · 2026年12月:首个UCI兼容算力集群上线

5.3 阶段二:起势(2027年)

季度 关键任务 具体内容 预期指标 Q1 开发者社区上线 天轨开发者平台v1.0上线,开放SDK下载和文档 注册开发者5000+ Q2 首批行业应用 与金融、能源、政务等行业头部客户合作,部署UCI算力 标杆客户10家 Q3 教育推广 与10所高校共建UCI实验室,纳入教学体系 培训学生5000+ Q4 模型适配冲刺 完成Top 2000 AI模型的UCI适配 适配模型2000个

5.4 阶段三:引爆(2028年)

任务 具体内容 预期指标 算力网全面对接 UCI成为“1+M+N”体系推荐硬件标准,全国20+算力节点接入 算力规模50+ EFLOPS 开发者百万计划 举办UCI开发者大赛,设立1000万元奖金池 开发者突破50万 国际标准推进 推动UCI在IEEE立项,与“一带一路”沿线国家合作推广 IEEE标准工作组立项 商业闭环形成 UCI兼容算力占国产AI算力市场30%以上 年度算力服务收入20+亿元

5.5 阶段四:统治(2029-2030年)

任务 具体内容 预期指标 生态自生长 开发者社区形成自循环,新应用优先开发UCI版本 开发者100万+ 国际影响力 UCI成为全球第二大的GPU计算生态 国际开发者10万+ 市场主导 UCI兼容算力占国产AI算力市场50%以上 市场占有率第一 持续演进 UCI v2.0发布,支持新硬件架构和新计算范式 保持技术领先

第六章 财务计划与资源需求

6.1 资金需求总览

资金用途 2026年 2027年 2028年 2029-2030年 合计 UCI标准研发 3亿元 1亿元 0.5亿元 0.5亿元 5亿元 开发者平台建设 0.5亿元 1亿元 0.5亿元 0.5亿元 2.5亿元 生态激励与社区运营 1亿元 2亿元 3亿元 3亿元 9亿元 市场推广与教育 0.5亿元 1亿元 2亿元 2亿元 5.5亿元 算力集群部署(联合投资) 3亿元 7亿元 10亿元 8亿元 28亿元 联盟运营与标准工作 0.5亿元 0.5亿元 0.5亿元 0.5亿元 2亿元 合计 8.5亿元 12.5亿元 16.5亿元 14.5亿元 52亿元

6.2 资金来源

来源 金额 说明 摩尔线程IPO募集资金 25亿元 从75.76亿元净募资中划拨,用于核心研发和集群部署 政府专项补贴 10亿元 申请“十五五”算力基础设施专项、工信部算力互联互通专项资金 联盟成员投入 10亿元 各成员厂商按股权比例分担 市场化融资 7亿元 B/C轮融资用于算力网络建设和生态推广 合计 52亿元 —

6.3 财务预测

6.3.1 收入预测

收入来源 2026年 2027年 2028年 2029年 2030年 UCI算力服务收入 0.5亿元 3亿元 10亿元 25亿元 50亿元 开发者平台增值服务 — 0.2亿元 0.8亿元 2亿元 5亿元 标准认证与培训 — 0.3亿元 0.7亿元 1.5亿元 3亿元 政府项目经费 1亿元 1亿元 0.5亿元 — — 合计 1.5亿元 4.5亿元 12亿元 28.5亿元 58亿元

6.3.2 盈亏平衡预测

· 预计盈亏平衡时间:2029年Q4 · 累计投资回收期:约6年(自2026年起算)

6.4 摩尔线程已有财务基础

摩尔线程2025年实现营业收入15.06亿元,同比增长243.37%;归母净利润为-10.24亿元,亏损同比收窄36.70%;毛利率达69%,为行业最高水平。公司总资产达1,530,782.30万元。公司已于2025年12月5日登陆科创板,IPO募集资金净额75.76亿元。

摩尔线程持续高强度的研发投入——研发占比超过60%,成功推动MTT S5000芯片进入头部云服务商供应链,第四季度出货量突破2万片。这为承担“天轨”项目提供了坚实的技术和财务基础。

第七章 风险应对

7.1 风险识别与应对矩阵

风险类型 具体描述 概率 严重度 应对措施 技术风险 UCI标准性能低于各厂商原生生态 中 高 性能目标设定为原生性能90%以上;持续优化编译器;允许厂商在UCI之上叠加专有优化 联盟治理风险 厂商间利益冲突导致联盟分裂 中 高 设置清晰的决策机制和利益分配规则;重大事项创始成员一票否决权保障核心利益 市场竞争风险 某厂商拒绝加入联盟并自成生态 中 中 通过国家算力网政策倾斜引导;市场会自然选择统一标准的算力资源 外部封锁风险 国际开源合作中断 中 中 启用“双轨制”,国内体系独立运行,代码镜像同步 政策落地风险 国家算力网推进不及预期 中 中 联盟可自行建设UCI算力网络,不依赖国家节点 开发者不足风险 开发者增长不及预期 中 中 加强教育推广,提供算力补贴,降低开发门槛 资金风险 后续融资受阻 低 高 摩尔线程IPO募资提供核心资金保障;项目分阶段推进,资金压力可控

7.2 对外部封锁的专项预案

本项目采取“一联盟双体系”架构,核心代码同时托管于GitHub(国际版)和Gitee/GitCode(国内版),核心规范同时推进IEEE国际标准和中国电子技术标准化研究院团体标准。技术委员会实行双主席制,一位国际代表,一位国内代表。

如果极端封锁发生,国内体系(开放原子开源基金会托管+中国标准+国产硬件基座)可独立运行。全国一体化算力网基础设施建设提供了坚实的政策与基础设施支撑——工信部已明确到2026年建立较为完备的算力互联互通标准、标识和规则体系。全国算力互联网的“1+M+N”节点体系框架已确立,UCI标准即使在国际合作中断后,仍可在国内框架下独立运行和演进。

第八章 效益分析

8.1 国家战略效益

· 算力主权:消除对国外GPU生态的依赖,实现从芯片到软件栈的全链条自主可控 · 算力效率:统一标准使全国算力资源可以无缝互联调度,整体利用率提升30%以上 · 创新加速:统一生态大幅降低AI应用开发门槛,加速“人工智能+”行动落地 · 产业安全:形成完整自主的GPU产业链,支撑制造强国、网络强国建设

8.2 产业经济效益

· 市场规模:2025年中国云端AI加速器市场总出货量约400万张,本土厂商出货165万张,市场份额41%。预计2030年国产AI算力市场规模持续扩大,UCI生态占据50%以上份额 · 开发效率:统一标准使AI模型跨平台迁移成本降低80%以上 · 算力成本:通过统一调度和充分竞争,企业算力使用成本预计降低40-60% · 产业带动:带动芯片设计、软件工具、系统集成、行业应用等上下游产业协同发展

8.3 生态建设效益

维度 现状 2030年目标 开发者数量 约20万(国产GPU各平台合计);华为昇腾开发者已突破400万 100万+ 适配AI模型 数千个(各平台分散) 5000+(UCI统一生态) 行业应用覆盖 以信创领域为主 全面覆盖金融、能源、制造、医疗、教育等 国际影响力 几乎为零 全球第二GPU计算生态

第九章 结语

“我们不挑战CUDA,我们重新定义‘兼容’的含义。让统一成为唯一符合所有人长期利益的选择。”

「天轨·摩尔线程版」项目的核心理念不是以某一家企业对抗CUDA,而是联合所有苦于生态碎片化、受制于外部封锁的国内力量,共同制定一个更公平、更开放、更符合国家战略利益的计算标准。

这盘棋,国外生态巨头不加入,就面临被边缘化的风险;加入,则意味着承认中国主导的开放标准。

对于摩尔线程而言,这不仅是商业竞争的策略,更是一种历史使命。在算力即权力的时代,拥有自主可控的算力生态,就是拥有数字时代的主动权。

“天轨”已启,众行致远。

附录

附录A:UCI v1.0 规范目录(草案)

  1. 总体架构
  2. 指令集定义
  3. API参考
  4. 运行时规范
  5. 设备发现与初始化
  6. 内存管理
  7. Kernel执行模型
  8. 流与事件
  9. 多设备协同
  10. 性能计数与调试
  11. 安全规范
  12. 兼容性测试套件(CTS)规范

附录B:国家算力生态联盟章程(草案)

(详见附件文档)

附录C:已落实合作与意向单位清单

类别 单位名称 合作内容 状态 国家级机构 国家信息中心 算力领域前瞻性研究、算力产业生态培育、算力网共性技术研发 已于2025年10月21日签署战略合作协议 GPU厂商 摩尔线程 发起单位 确认 GPU厂商 华为昇腾 战略合作 洽谈中 GPU厂商 壁仞科技 合作 初步接触 GPU厂商 天数智芯 合作 初步接触 GPU厂商 沐曦股份 合作 初步接触 AI框架 智源研究院 FlagOS深度融入 已合作 科研机构 中科院计算所 标准共建 洽谈中 高校 清华大学 教育合作 洽谈中 高校 北京大学 教育合作 洽谈中

附录D:术语表

术语 英文 定义 UCI Unified Computing Interface 统一计算接口,本项目定义的国家级GPU计算标准 MUSA Moore Threads Unified Computing Architecture 摩尔线程统一计算架构,UCI的核心技术来源 TSC Technical Steering Committee 技术指导委员会,联盟的技术决策机构 CTS Conformance Test Suite 兼容性测试套件,验证UCI实现的标准测试集 FlagOS — 智源研究院主导的开源统一AI软件栈 算力互联网 Computing Power Internet 工信部规划的国家级算力互联网络 1+M+N — 工信部算力互联互通节点体系架构

附录E:参考文献

  1. 摩尔线程2025年度业绩快报公告(证券日报,2026年2月28日)
  2. 摩尔线程IPO招股说明书(2025年11月)
  3. IDC《2025年中国云端AI加速器市场研究报告》(2026年4月)
  4. 华为昇腾AI生态2025年度报告(2026年1月)
  5. 工信部《算力互联互通行动计划》(工信部信管〔2025〕119号)
  6. 工信部《关于组织开展国家算力互联互通节点建设工作的通知》(2026年2月)
  7. 国家信息中心与摩尔线程战略合作协议(2025年10月21日)
  8. 摩尔线程首届MUSA开发者大会(MDC 2025)成果发布(2025年12月20日)
  9. 智源研究院众智FlagOS技术白皮书(2025年)