天数智芯天垓100的软件生态名为 IXUCA(天数智算软件栈),其设计思路是高度兼容CUDA编程模型,通过提供等效组件实现"低代码修改"甚至"零代码修改"迁移。以下是它与CUDA生态的组件映射关系,以及GitHub上的开源资源汇总。
开源项目 www.deepspark.org.cn/ github.com/Deep-Spark/
启智社区(OpenI)的官方网站地址是:天数智芯天垓100算力租借 www.openi.org.cn 启智云脑(提供天垓100等国产算力)的入口通常在官网内,具体算力平台地址为: cloud.openi.org.cn
启智算力平台 送50卡时(50积分,有些卡没有50卡时) www.openi.org.cn/
注册地址 您的好友正在邀请您加入OpenI启智AI协作平台,畅享充沛的普惠算力资源(GPU/NPU/GCU/GPGPU/DCU/MLU)。
注册地址:openi.pcl.ac.cn/user/sign_u…
推荐人:yanggg1133
一、IXUCA 与 CUDA 生态组件对照表
| CUDA 生态组件 | IXUCA 对应组件 | 说明 |
|---|---|---|
| CUDA Driver / Runtime | DayChip Driver / Runtime | 底层驱动与运行时库,管理设备内存、线程调度 |
| nvcc (CUDA Compiler) | DayCompile (Clang编译器) | 必须使用天数智芯提供的Clang编译器重新编译,不支持直接运行NVIDIA编译的cubin |
| cuDNN | ixDNN | 深度学习基础算子库 |
| cuBLAS | ixBLAS | 线性代数/矩阵运算库 |
| NCCL | ixCCL | 多卡通信库,支持分布式训练 |
| cuFFT / 其他数学库 | DayOP 算子库 | 覆盖通用计算及深度学习所需基础算子 |
| TensorRT | IGIE / ixRT | 高性能推理引擎。IGIE基于TVM框架,支持量化、图优化;ixRT为自研专用推理引擎,支持动态形状、INT8/FP16 |
| CUDA-GDB | ixgdb | GPU调试工具,GDB扩展 |
| nvidia-smi / DCGM | ixsmi / ixDCGM | GPU监控与管理工具。ixDCGM提供数据中心级GPU管理软件 |
| NVIDIA Container Toolkit | ix-container-toolkit | 容器运行时支持,快速构建GPU容器 |
| NVIDIA GPU Operator | ix-gpu-operator | K8s集群GPU资源管理 |
| NVIDIA Device Plugin | ix-device-plugin | K8s设备插件,通过DaemonSet调度GPU |
| Triton Inference Server | tis-igie-backend / tis-ixrt-backend | 对接Triton推理服务框架的后端 |
此外,IXUCA还包含 IxFormer(基于vLLM的大模型推理加速框架)和 ixTE(ix-TransformerEngine,支持FP8混合精度)。
二、深度学习框架支持
IXUCA 对主流框架的适配程度如下:
| 框架 | 兼容程度 | 说明 |
|---|---|---|
| PyTorch | 完全兼容 | torch、torch.nn、torch.cuda、混合精度torch.cuda.amp、分布式torch.distributed均支持,可直接用.cuda()迁移 |
| TensorFlow | 适配 | 提供官方适配版本 |
| PaddlePaddle (飞桨) | III级兼容性 | 已完成51个模型验证,覆盖NLP、CV、推荐等五大领域 |
| vLLM / TGI / Xinference | 适配 | 通过IxFormer或ixRT实现大模型推理加速 |
迁移要点:大部分CUDA代码无需重写,仅需用天数智芯Clang重新编译即可运行。但需注意warp size差异——天垓100/150的warp size为64,而CUDA为32,涉及warpSize、__syncwarp()、warp级原语(如__shfl_down_sync)的代码必须手动适配。
三、GitHub 开源资源汇总
天数智芯通过 DeepSpark 开源社区在GitHub上维护了约20个仓库,核心项目如下:
| 仓库名 | 地址 | 简介 |
|---|---|---|
| DeepSpark | github.com/Deep-Spark/DeepSpark | 社区主项目,百大应用开放平台 |
| DeepSparkHub | github.com/Deep-Spark/DeepSparkHub | 训练模型库,提供数百个模型示例 |
| DeepSparkInference | github.com/Deep-Spark/DeepSparkInference | 推理模型库,支持IGIE/ixRT引擎,已开源48+推理示例 |
| iluvatar-corex-ixrt | github.com/Deep-Spark/iluvatar-corex-ixrt | ixRT高性能推理引擎的开源代码(含插件、部署工具、应用示例) |
| tis-igie-backend | github.com/Deep-Spark/tis-igie-backend | IGIE引擎对接Triton推理服务器的后端 |
| tis-ixrt-backend | github.com/Deep-Spark/tis-ixrt-backend | ixRT引擎对接Triton推理服务器的后端 |
| ix-container-toolkit | github.com/Deep-Spark/ix-container-toolkit | GPU容器运行时工具集 |
| ix-device-plugin | github.com/Deep-Spark/ix-device-plugin | K8s GPU设备插件 |
| ix-gpu-operator | github.com/Deep-Spark/ix-gpu-operator | K8s GPU Operator |
| ix-exporter | github.com/Deep-Spark/ix-exporter | K8s GPU监控指标导出 |
| ix-feature-discovery | github.com/Deep-Spark/ix-feature-discovery | K8s节点GPU自动标签发现 |
| ix-volcano-plugin | github.com/Deep-Spark/ix-volcano-plugin | 基于Volcano的多节点GPU拓扑调度 |
| go-ixdcgm | github.com/Deep-Spark/go-ixdcgm | ixDCGM的Golang API |
| go-ixml | github.com/Deep-Spark/go-ixml | ixML系统管理接口的Golang API |
| ixgdb | github.com/Deep-Spark/ixgdb | 基于CUDA-GDB的GPU调试工具 |
| ixjpeg-python | github.com/Deep-Spark/ixjpeg-python | ixJPEG图像编解码的Python封装 |
组织地址:github.com/Deep-Spark
社区官网:www.deepspark.org.cn
四、第三方生态与社区协作
除官方IXUCA外,天数智芯还积极参与以下开源生态:
| 项目 | 说明 |
|---|---|
FlagOS (github.com/flagos-ai) | 智源研究院发起的异构AI芯片统一系统软件栈,支持"一次开发跨芯迁移"。天数智芯通过FlagOS实现Qwen、DeepSeek、MiniMax等模型的Day0适配 |
| FlagGems | 基于Triton语言的高性能算子库,已适配天数智芯 |
| FlagAttention | 智源开源的长文本Attention算子集,已适配天数智芯 |
| DeepLink / KernelSwift | 自动算子生成工具,天数智芯已完成DeepSeek-V4核心算子的Day0适配,代码开源至DeepLink-org仓库 |
| vLLM-plugin-FL | FlagOS统一多芯片插件,实现零代码修改完成vLLM推理部署 |
五、总结
天数智芯的软件生态策略可以概括为 "兼容CUDA编程模型 + 自研工具链 + 开源社区共建"。对于开发者而言:
- 已有CUDA代码:大部分情况下只需用天数智芯的Clang编译器重新编译,无需重写代码。
- PyTorch用户:可直接使用官方适配的
torch版本,接口与NVIDIA版本一致。 - K8s/云原生用户:有完整的GPU Operator、Device Plugin、监控工具链。
- 开源社区:DeepSpark社区活跃度在国产GPU中属"中等偏上",核心仓库保持年度迭代,Gitee/GitHub双平台镜像。
主要限制在于warp size差异(64 vs 32)和部分低精度格式(如double类型有限支持),迁移时需针对性检查底层并行代码。
Clang 是一个开源的编译器前端项目,专门负责把 C/C++/CUDA 等编程语言的源代码翻译成中间代码,然后交给后端生成最终的机器指令。
一、通俗理解
你可以把编译器想象成一个"翻译官":
你的源代码(C++/CUDA) → [Clang 前端] → 中间代码 → [LLVM 后端] → 芯片能运行的机器码
- Clang:负责理解你的代码(语法检查、报错提示、生成中间表示)
- LLVM:负责生成机器码(针对 x86、ARM、GPU 等不同芯片优化)
二、关键背景
| 项目 | 说明 |
|---|---|
| 出身 | 由苹果公司在 2007 年主导开发,作为 GCC 的替代品 |
| 许可证 | Apache 2.0 开源协议,商业友好 |
| 核心特点 | 编译速度快、报错信息友好、模块化设计 |
| 与 LLVM 的关系 | Clang 是 LLVM 项目的"前端",两者通常一起使用,合称 Clang/LLVM |
三、为什么天数智芯选择 Clang?
天数智芯要做自己的国产 GPU,但又希望开发者能继续使用 CUDA 的写法(__global__、__shared__、cudaMalloc 等)。Clang 正好提供了这个能力:
| 原因 | 解释 |
|---|---|
| 原生支持 CUDA 语法 | Clang 能直接识别 .cu 文件里的 CUDA 关键字,不需要开发者重写代码 |
| 开源可定制 | 因为开源,天数智芯可以修改 Clang,让它把 CUDA 代码翻译给自家的天垓芯片执行,而不是 NVIDIA 的 GPU |
| 报错信息好 | 相比其他编译器,Clang 的报错提示更精准,开发者更容易定位问题 |
| 现代架构 | 模块化设计,方便添加新的芯片后端 |
简单来说:天数智芯拿开源的 Clang 做了"改装",让它假装成 nvcc(NVIDIA 的编译器),但最终生成的机器码是给天垓 100 用的。
四、对比:GCC vs Clang vs nvcc
| 编译器 | 主要用途 | 特点 |
|---|---|---|
| GCC | Linux 下编译 C/C++ | 老牌编译器,支持平台多,但报错信息较晦涩 |
| Clang | 编译 C/C++/CUDA/Objective-C | 苹果主导,速度快,报错友好,模块化 |
| nvcc | NVIDIA 专用 CUDA 编译器 | 只能编译 NVIDIA GPU 代码,闭源 |
| 天数智芯 Clang | 天垓芯片专用 | 语法像 nvcc,但生成天垓芯片的机器码 |
五、一句话总结
Clang 是一个开源的、能读懂 CUDA 语法的编译器前端。天数智芯基于它开发了自家的编译器,让开发者可以用写 NVIDIA CUDA 代码的方式,来开发天垓 100 的程序。
这段文字是天数智芯官方对 DeepSpark 开源社区 和 百大应用开放平台 的介绍。我把它拆成几个部分,用大白话解释:
一、背景:天数智芯在做什么?
天数智芯是做国产 GPU 芯片的公司(产品就是天垓 100)。但光有芯片没用,开发者需要软件、模型、工具才能用起来。所以他们要建生态。
核心逻辑:芯片造出来了 → 必须证明它能跑各种 AI 应用 → 吸引更多人用 → 生态才能活。
二、DeepSpark 开源社区是什么?
这是天数智芯建的开发者社区,口号是"平台共建、生态共享、产业共赢"。
大白话:我们不自己闷头干,把代码和工具开源出来,让开发者、客户、合作伙伴一起用、一起改、一起完善。大家共建生态,这样国产 GPU 才能有人用。
三、百大应用开放平台是什么?
这是 DeepSpark 社区的核心项目,可以理解为一个**"国产 GPU 的试用/评测平台"**。它有以下几个特点:
| 官方说法 | 大白话 |
|---|---|
| DeepSparkHub:上百个开源模型 | 我们挑了 100 多个流行的 AI 模型(比如 ResNet、BERT 等),放在平台上,开发者可以直接下载用。 |
| DeepSparkInference:推理示例 | 针对国产推理引擎 IGIE 和 IxRT,我们做了模型推理的示例代码。开发者抄作业就能在天垓 100 上跑推理。 |
| 支持主流生态框架 | 兼容 PyTorch、TensorFlow 等主流框架,降低迁移成本。 |
| 多维度评测体系 | 不仅看跑得快不快,还看准不准、省不省电、显存占多少、稳不稳定。并且把评测工具也开放给社区用。 |
一句话总结:这是一个**"国产 GPU 的样板间 + 考试卷"**——既有现成模型给你跑,又有标准告诉你跑得怎么样。
四、合作部分是什么意思?
2023年8月,与上海白玉兰开源开放研究院签署战略合作
白玉兰开源研究院是上海推动开源软件的官方/半官方机构。合作意思是:天数智芯抱紧开源组织的大腿,增加社区公信力,共同推动国产开源生态。
2023年11月,与启智社区合作,用户可通过启智云脑的天垓100算力训练模型
启智社区(OpenI)是国内知名的 AI 开源社区,旗下"启智云脑"提供云端算力。合作意思是:开发者不用自己买天垓 100 显卡,直接上启智云脑免费/低成本租用,跑 DeepSparkHub 上的模型。
五、整段话的核心意图
这段文字本质上是天数智芯的"生态招商广告":
- 我们有芯片(天垓 100)
- 我们做了软件(IXUCA、IGIE、IxRT)
- 我们开源了模型和工具(DeepSparkHub、DeepSparkInference)
- 我们提供评测标准(让你知道国产 GPU 行不行)
- 我们联合了云平台和开源组织(给你算力、给你背书)
最终目的:解决国产 GPU 最大的痛点——没人用、没生态。通过开源社区降低开发者的试用门槛,让更多人把模型迁移到天垓 100 上,从而形成"芯片-软件-应用"的闭环。