天数智芯天垓100的软件生态名为IXUCA天数智算软件栈),github开源项目和类库

0 阅读10分钟

天数智芯天垓100的软件生态名为 IXUCA(天数智算软件栈),其设计思路是高度兼容CUDA编程模型,通过提供等效组件实现"低代码修改"甚至"零代码修改"迁移。以下是它与CUDA生态的组件映射关系,以及GitHub上的开源资源汇总。

开源项目 www.deepspark.org.cn/ github.com/Deep-Spark/

启智社区(OpenI)的官方网站地址是:天数智芯天垓100算力租借 www.openi.org.cn 启智云脑(提供天垓100等国产算力)的入口通常在官网内,具体算力平台地址为: cloud.openi.org.cn

启智算力平台 送50卡时(50积分,有些卡没有50卡时) www.openi.org.cn/

注册地址 您的好友正在邀请您加入OpenI启智AI协作平台,畅享充沛的普惠算力资源(GPU/NPU/GCU/GPGPU/DCU/MLU)。

注册地址:openi.pcl.ac.cn/user/sign_u… 推荐人:yanggg1133 在这里插入图片描述 在这里插入图片描述

一、IXUCA 与 CUDA 生态组件对照表

CUDA 生态组件IXUCA 对应组件说明
CUDA Driver / RuntimeDayChip Driver / Runtime底层驱动与运行时库,管理设备内存、线程调度
nvcc (CUDA Compiler)DayCompile (Clang编译器)必须使用天数智芯提供的Clang编译器重新编译,不支持直接运行NVIDIA编译的cubin
cuDNNixDNN深度学习基础算子库
cuBLASixBLAS线性代数/矩阵运算库
NCCLixCCL多卡通信库,支持分布式训练
cuFFT / 其他数学库DayOP 算子库覆盖通用计算及深度学习所需基础算子
TensorRTIGIE / ixRT高性能推理引擎。IGIE基于TVM框架,支持量化、图优化;ixRT为自研专用推理引擎,支持动态形状、INT8/FP16
CUDA-GDBixgdbGPU调试工具,GDB扩展
nvidia-smi / DCGMixsmi / ixDCGMGPU监控与管理工具。ixDCGM提供数据中心级GPU管理软件
NVIDIA Container Toolkitix-container-toolkit容器运行时支持,快速构建GPU容器
NVIDIA GPU Operatorix-gpu-operatorK8s集群GPU资源管理
NVIDIA Device Pluginix-device-pluginK8s设备插件,通过DaemonSet调度GPU
Triton Inference Servertis-igie-backend / tis-ixrt-backend对接Triton推理服务框架的后端

此外,IXUCA还包含 IxFormer(基于vLLM的大模型推理加速框架)和 ixTE(ix-TransformerEngine,支持FP8混合精度)。


二、深度学习框架支持

IXUCA 对主流框架的适配程度如下:

框架兼容程度说明
PyTorch完全兼容torchtorch.nntorch.cuda、混合精度torch.cuda.amp、分布式torch.distributed均支持,可直接用.cuda()迁移
TensorFlow适配提供官方适配版本
PaddlePaddle (飞桨)III级兼容性已完成51个模型验证,覆盖NLP、CV、推荐等五大领域
vLLM / TGI / Xinference适配通过IxFormer或ixRT实现大模型推理加速

迁移要点:大部分CUDA代码无需重写,仅需用天数智芯Clang重新编译即可运行。但需注意warp size差异——天垓100/150的warp size为64,而CUDA为32,涉及warpSize__syncwarp()、warp级原语(如__shfl_down_sync)的代码必须手动适配。


三、GitHub 开源资源汇总

天数智芯通过 DeepSpark 开源社区在GitHub上维护了约20个仓库,核心项目如下:

仓库名地址简介
DeepSparkgithub.com/Deep-Spark/DeepSpark社区主项目,百大应用开放平台
DeepSparkHubgithub.com/Deep-Spark/DeepSparkHub训练模型库,提供数百个模型示例
DeepSparkInferencegithub.com/Deep-Spark/DeepSparkInference推理模型库,支持IGIE/ixRT引擎,已开源48+推理示例
iluvatar-corex-ixrtgithub.com/Deep-Spark/iluvatar-corex-ixrtixRT高性能推理引擎的开源代码(含插件、部署工具、应用示例)
tis-igie-backendgithub.com/Deep-Spark/tis-igie-backendIGIE引擎对接Triton推理服务器的后端
tis-ixrt-backendgithub.com/Deep-Spark/tis-ixrt-backendixRT引擎对接Triton推理服务器的后端
ix-container-toolkitgithub.com/Deep-Spark/ix-container-toolkitGPU容器运行时工具集
ix-device-plugingithub.com/Deep-Spark/ix-device-pluginK8s GPU设备插件
ix-gpu-operatorgithub.com/Deep-Spark/ix-gpu-operatorK8s GPU Operator
ix-exportergithub.com/Deep-Spark/ix-exporterK8s GPU监控指标导出
ix-feature-discoverygithub.com/Deep-Spark/ix-feature-discoveryK8s节点GPU自动标签发现
ix-volcano-plugingithub.com/Deep-Spark/ix-volcano-plugin基于Volcano的多节点GPU拓扑调度
go-ixdcgmgithub.com/Deep-Spark/go-ixdcgmixDCGM的Golang API
go-ixmlgithub.com/Deep-Spark/go-ixmlixML系统管理接口的Golang API
ixgdbgithub.com/Deep-Spark/ixgdb基于CUDA-GDB的GPU调试工具
ixjpeg-pythongithub.com/Deep-Spark/ixjpeg-pythonixJPEG图像编解码的Python封装

组织地址:github.com/Deep-Spark
社区官网:www.deepspark.org.cn


四、第三方生态与社区协作

除官方IXUCA外,天数智芯还积极参与以下开源生态:

项目说明
FlagOS (github.com/flagos-ai)智源研究院发起的异构AI芯片统一系统软件栈,支持"一次开发跨芯迁移"。天数智芯通过FlagOS实现Qwen、DeepSeek、MiniMax等模型的Day0适配
FlagGems基于Triton语言的高性能算子库,已适配天数智芯
FlagAttention智源开源的长文本Attention算子集,已适配天数智芯
DeepLink / KernelSwift自动算子生成工具,天数智芯已完成DeepSeek-V4核心算子的Day0适配,代码开源至DeepLink-org仓库
vLLM-plugin-FLFlagOS统一多芯片插件,实现零代码修改完成vLLM推理部署

五、总结

天数智芯的软件生态策略可以概括为 "兼容CUDA编程模型 + 自研工具链 + 开源社区共建"。对于开发者而言:

  • 已有CUDA代码:大部分情况下只需用天数智芯的Clang编译器重新编译,无需重写代码。
  • PyTorch用户:可直接使用官方适配的torch版本,接口与NVIDIA版本一致。
  • K8s/云原生用户:有完整的GPU Operator、Device Plugin、监控工具链。
  • 开源社区:DeepSpark社区活跃度在国产GPU中属"中等偏上",核心仓库保持年度迭代,Gitee/GitHub双平台镜像。

主要限制在于warp size差异(64 vs 32)和部分低精度格式(如double类型有限支持),迁移时需针对性检查底层并行代码。

Clang 是一个开源的编译器前端项目,专门负责把 C/C++/CUDA 等编程语言的源代码翻译成中间代码,然后交给后端生成最终的机器指令。


一、通俗理解

你可以把编译器想象成一个"翻译官":

你的源代码(C++/CUDA) → [Clang 前端] → 中间代码 → [LLVM 后端] → 芯片能运行的机器码
  • Clang:负责理解你的代码(语法检查、报错提示、生成中间表示)
  • LLVM:负责生成机器码(针对 x86、ARM、GPU 等不同芯片优化)

二、关键背景

项目说明
出身由苹果公司在 2007 年主导开发,作为 GCC 的替代品
许可证Apache 2.0 开源协议,商业友好
核心特点编译速度快、报错信息友好、模块化设计
与 LLVM 的关系Clang 是 LLVM 项目的"前端",两者通常一起使用,合称 Clang/LLVM

三、为什么天数智芯选择 Clang?

天数智芯要做自己的国产 GPU,但又希望开发者能继续使用 CUDA 的写法__global____shared__cudaMalloc 等)。Clang 正好提供了这个能力:

原因解释
原生支持 CUDA 语法Clang 能直接识别 .cu 文件里的 CUDA 关键字,不需要开发者重写代码
开源可定制因为开源,天数智芯可以修改 Clang,让它把 CUDA 代码翻译给自家的天垓芯片执行,而不是 NVIDIA 的 GPU
报错信息好相比其他编译器,Clang 的报错提示更精准,开发者更容易定位问题
现代架构模块化设计,方便添加新的芯片后端

简单来说:天数智芯拿开源的 Clang 做了"改装",让它假装成 nvcc(NVIDIA 的编译器),但最终生成的机器码是给天垓 100 用的。


四、对比:GCC vs Clang vs nvcc

编译器主要用途特点
GCCLinux 下编译 C/C++老牌编译器,支持平台多,但报错信息较晦涩
Clang编译 C/C++/CUDA/Objective-C苹果主导,速度快,报错友好,模块化
nvccNVIDIA 专用 CUDA 编译器只能编译 NVIDIA GPU 代码,闭源
天数智芯 Clang天垓芯片专用语法像 nvcc,但生成天垓芯片的机器码

五、一句话总结

Clang 是一个开源的、能读懂 CUDA 语法的编译器前端。天数智芯基于它开发了自家的编译器,让开发者可以用写 NVIDIA CUDA 代码的方式,来开发天垓 100 的程序。

这段文字是天数智芯官方对 DeepSpark 开源社区百大应用开放平台 的介绍。我把它拆成几个部分,用大白话解释:


一、背景:天数智芯在做什么?

天数智芯是做国产 GPU 芯片的公司(产品就是天垓 100)。但光有芯片没用,开发者需要软件、模型、工具才能用起来。所以他们要建生态

核心逻辑:芯片造出来了 → 必须证明它能跑各种 AI 应用 → 吸引更多人用 → 生态才能活。


二、DeepSpark 开源社区是什么?

这是天数智芯建的开发者社区,口号是"平台共建、生态共享、产业共赢"。

大白话:我们不自己闷头干,把代码和工具开源出来,让开发者、客户、合作伙伴一起用、一起改、一起完善。大家共建生态,这样国产 GPU 才能有人用。


三、百大应用开放平台是什么?

这是 DeepSpark 社区的核心项目,可以理解为一个**"国产 GPU 的试用/评测平台"**。它有以下几个特点:

官方说法大白话
DeepSparkHub:上百个开源模型我们挑了 100 多个流行的 AI 模型(比如 ResNet、BERT 等),放在平台上,开发者可以直接下载用。
DeepSparkInference:推理示例针对国产推理引擎 IGIEIxRT,我们做了模型推理的示例代码。开发者抄作业就能在天垓 100 上跑推理。
支持主流生态框架兼容 PyTorch、TensorFlow 等主流框架,降低迁移成本。
多维度评测体系不仅看跑得快不快,还看准不准、省不省电、显存占多少、稳不稳定。并且把评测工具也开放给社区用。

一句话总结:这是一个**"国产 GPU 的样板间 + 考试卷"**——既有现成模型给你跑,又有标准告诉你跑得怎么样。


四、合作部分是什么意思?

2023年8月,与上海白玉兰开源开放研究院签署战略合作

白玉兰开源研究院是上海推动开源软件的官方/半官方机构。合作意思是:天数智芯抱紧开源组织的大腿,增加社区公信力,共同推动国产开源生态。

2023年11月,与启智社区合作,用户可通过启智云脑的天垓100算力训练模型

启智社区(OpenI)是国内知名的 AI 开源社区,旗下"启智云脑"提供云端算力。合作意思是:开发者不用自己买天垓 100 显卡,直接上启智云脑免费/低成本租用,跑 DeepSparkHub 上的模型。


五、整段话的核心意图

这段文字本质上是天数智芯的"生态招商广告"

  1. 我们有芯片(天垓 100)
  2. 我们做了软件(IXUCA、IGIE、IxRT)
  3. 我们开源了模型和工具(DeepSparkHub、DeepSparkInference)
  4. 我们提供评测标准(让你知道国产 GPU 行不行)
  5. 我们联合了云平台和开源组织(给你算力、给你背书)

最终目的:解决国产 GPU 最大的痛点——没人用、没生态。通过开源社区降低开发者的试用门槛,让更多人把模型迁移到天垓 100 上,从而形成"芯片-软件-应用"的闭环。