2025年10月4日,Qwen3系列模型发布并开源其新一代多模态模型:Qwen3-VL-30B-A3B-Thinking和Qwen3-VL-30B-A3B-Instruct。Qwen3-VL是一个多模态视觉语言模型系列,基于其前代产品,Qwen3-VL 在视觉理解方面实现了显著提升,同时保持了强大的纯文本处理能力。 Qwen3-VL-30B-A3B-Thinking/Instruct模型介绍 Qwen3-VL是迄今为止Qwen系列中最强大的视觉语言模型,此次开源的Qwen3-VL-30B-A3B-Thinking和Qwen3-VL-30B-A3B-Instruct模型体积更小,性能依旧强劲,并集Qwen3-VL全部能力于一身! 模型仅需激活30亿参数,即可在STEM、视觉问答(VQA)、光学字符识别(OCR)、视频理解、智能体(Agent)任务等多个领域媲美GPT-5-Mini和Claude4-Sonnet,甚至表现更优。 基于昇腾快速上手Qwen3-VL-30B-A3B模型 本教程将手把手指导您完成Qwen3-VL-30B-A3B-Instruct模型的训练、推理部署流程。我们提供了详尽的步骤说明和最佳实践,确保您能够快速上手。 此前昇腾一直同步支持Qwen系列模型,此次Qwen3-VL-30B-A3B-Thinking和Qwen3-VL-30B-A3B-Instruct模型一经发布开源,即在LLaMA Factory和vLLM中开箱即用,实现模型的0Day适配。 同时,模型权重已上线魔乐社区,欢迎开发者下载体验! 魔乐社区链接: usercenter.modelers.cn/register?cl… 权重链接: 🔗modelers.cn/models/Qwen… 🔗modelers.cn/models/Qwen… 环境配置
开发环境配置
| 软件 | 版本 |
|---|---|
| Python | 3.10.18 |
| PyTorch | 2.5.1 |
| Transformers | main |
| LLaMA Factory | main |
| CANN | 8.2.RC1 |
安装Ascend Cann Toolkit和kernels
可参考安装指南进行安装。
安装LLaMA Factory
执行以下指令即可安装LLaMA Factory及其依赖,此步骤会自动安装torch及torch_npu。
git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory pip install-e".[torch-npu,metrics]"--no-build-isolation cd .. git clone https://github.com/huggingface/transformers.git cd transformers pip install -e . pip install qwen_vl_utils