开源 AI 训练观测平台：支持30+主流框架，云/自托管一键部署AI 研究与工程落地日益紧密，训练一个模型早已不只是"跑

前言

AI 研究与工程落地日益紧密，训练一个模型早已不只是"跑通代码"那么简单。超参数调了多少轮？哪次实验 loss 最低？GPU 到底用了多少？团队里谁改了学习率却没通知你？这些问题，每天都在消耗大家的精力。

有没有一种工具，既能像写日记一样自动记录训练全过程，又能用图表一目了然地对比几十个实验，还能让整个团队实时看到最新结果、甚至手机上就能查看进度？

现在，有了——SwanLab。

项目介绍

SwanLab 是一个开源、现代化设计的深度学习训练跟踪与可视化工具，专为 AI 打造。它不搞复杂配置，也不强制绑定云服务——你可以在线使用，也可以完全离线自托管；它轻量、灵活，却功能强大，目前已支持 30 多个主流 AI 框架，从 PyTorch、HuggingFace Transformers 到 LLaMA Factory、Ultralytics、PaddleDetection、veRL、Swift、XGBoost……几乎覆盖了当前 AI 领域的所有热门生态。

项目使用

极简集成，一行代码开启实验追踪

使用 SwanLab 非常简单。

只需两步：

pip install swanlab

然后在你的训练脚本开头加入：

import swanlabswanlab.init(project="my-llm-finetune", config={"lr": 3e-4, "batch_size": 16})

在训练循环中记录指标：

swanlab.log({"loss": loss, "accuracy": acc})

就这么简单。剩下的——超参数、指标曲线、硬件资源（CPU/GPU/NPU/MLU/内存等）、Git 提交记录、Python 环境、日志输出——全部自动捕获，并实时同步到 Web 仪表盘。

不只是看图，更是洞察实验

SwanLab 的 UI 设计干净直观，但功能远不止"画折线图"。

它支持：

多维度图表：标量、图像、音频、文本、视频、3D 点云、分子结构、PR 曲线、混淆矩阵、热力图、雷达图等；

LLM 专属可视化：为大模型训练定制的 Markdown 渲染文本视图，清晰展示生成内容；

表格+图表联动：在表格中筛选、排序、Pin 关键列，图表自动联动更新；

实验分组管理：面对上百个实验，可通过"分组"和"Job Type"高效组织；

断点续训支持：训练中断后，可继续向同一实验追加数据，无需新建。

更贴心的是，所有图表都经过性能优化，即使加载上千个实验点，依然流畅如初。

团队协作，打破信息孤岛

过去，训练结果散落在不同人的本地机器上，想对比就得"发截图+问参数"。SwanLab 改变了这一点：

支持项目级协作，可邀请成员加入；
每个实验生成永久链接，一键分享给同事或嵌入 Notion；
支持组织切换，适合多项目并行的团队；
还能通过插件将关键事件推送到飞书、钉钉、Slack、邮件等。

这意味着，算法研究员、工程部署、产品经理，都能在同一页面看到模型进展，沟通成本大幅降低。

开源 + 自托管，真正掌控你的数据

很多类似工具（比如 W&B）是闭源且强制联网的。而 SwanLab 坚持 Apache 2.0 开源协议，不仅免费，还提供完整的自托管方案。

通过 Docker 一条命令即可在内网或私有服务器部署：

git clone https://github.com/SwanHubX/self-hosted.gitcd self-hosted/docker && ./install.sh

之后只需在代码中指定 host：

swanlab login --host http://your-server:8000

所有实验数据留在本地，安全可控，特别适合对数据敏感的企业或科研机构。

实战验证，覆盖全场景

SwanLab 广泛应用于各类真实项目中：

Qwen、GLM、DeepSeek 等大模型的指令微调与 RL 训练；
YOLOv8 目标检测、UNet 医学分割、ResNet 图像分类；
LSTM 股价预测、DQN 强化学习、Stable Diffusion 微调；
甚至具身智能（LeRobot）、多模态（Qwen2-VL）、生物信息等前沿方向。

硬件记录

SwanLab会对AI训练过程中所使用的硬件信息和资源使用情况进行记录，下面是支持情况表格：

硬件	信息记录	资源监控	脚本
英伟达GPU	✅	✅	nvidia.py
昇腾NPU	✅	✅	ascend.py
苹果SOC	✅	✅	apple.py
寒武纪MLU	✅	✅	cambricon.py
昆仑芯XPU	✅	✅	kunlunxin.py
摩尔线程GPU	✅	✅	moorethreads.py
沐曦GPU	✅	✅	metax.py
海光DCU	✅	✅	hygon.py
CPU	✅	✅	cpu.py
内存	✅	✅	memory.py
硬盘	✅	✅	disk.py
网络	✅	✅	network.py

项目源码

开源地址：github.com/SwanHubX/sw…

在线体验：swanlab.cn

文档&自托管：docs.swanlab.cn

别再让训练变成"黑盒"。从下一个实验开始，用 SwanLab 看见你的 AI 成长轨迹。

总结

SwanLab 的目标不是取代 TensorBoard 或 W&B，而是提供一个更现代、更开放、更贴近大家开发习惯的选择。它不炫技，不堆功能，只专注一件事：让每一次训练都可追溯、可比较、可协作。

不管大家是个人研究，还是百人 AI 团队，还是公有云训练千亿参数模型，还是在实验室小服务器跑个 MNIST——SwanLab 都能让大家的实验过程更清晰、迭代更高效。

关键词

#SwanLab、#AI训练可视化、#开源项目、#实验跟踪、#自托管、#多框架支持、#LLM微调、#硬件监控、#深度学习、#AI、#人工智能

最后

如果你觉得这篇文章对你有帮助，不妨点个赞支持一下！你的支持是我继续分享知识的动力。如果有任何疑问或需要进一步的帮助，欢迎随时留言。

也可以加入微信公众号 [DotNet技术匠] 社区，与其他热爱技术的同行一起交流心得，共同成长！

优秀是一种习惯，欢迎大家留言学习！