4月29日,Qwen3正式发布并开源!讯飞星辰MaaS平台率先支持Qwen3旗舰模型Qwen3-235B-A22B和Qwen3-30B-A3B推理,并提供500w Tokens的免费额度,供开发者调用体验。
同时,讯飞星辰Agent平台也已同步支持Qwen3。开发者在创建高阶智能体时,可将Qwen3作为选择的大模型,创建高效智能体。
作为Qwen 系列的最新一代大型语言模型,Qwen3 是 提供了一系列密集型和专家混合(MoE)模型。基于广泛的训练,Qwen3在推理能力、指令遵循、代理能力以及多语言支持方面取得了突破性的进展,主要特点如下:
多种思考模式
支持在单一模型内无缝切换思考模式(用于复杂的逻辑推理、数学和编程)和非思考模式(用于高效、通用的对话),确保在各种场景下都能实现最佳性能。
推理能力显著提升
在思考模式下超越了之前的 QwQ(思考模式) 和 Qwen2.5 指令模型(非思考模式) ,在数学、代码生成和常识逻辑推理方面表现出色。
更好地符合人类偏好
在创意写作、角色扮演、多轮对话和指令遵循方面表现出色,能够提供更自然、引人入胜且沉浸式的对话体验。
强大的代理能力
能够在思考和非思考模式下精准地与外部工具集成,并在复杂的基于代理的任务中实现开源模型中的领先性能。
多语言支持
支持 100+ 种语言和方言,具备强大的多语言指令遵循和翻译能力。
旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与DeepSeek-R1、o1、o3mini、Grok-3和Gemini2.5-pro等一众顶级模型相比,表现出极具竞争力的结果。此外,小型MoE模型Qwen3-30B-A3B的激活参数数量是QwQ-32B10%,表现更胜一筹, 甚至像Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。
讯飞星辰MaaS平台 ,低门槛一站式大模型精调训练平台,助力企业快速构建专属大模型
- 开箱即用,上手快: 覆盖数据工程、精调训练、推理服务等全生命周期工具链,提供开箱即用、即用即销的平台服务能力。
- 模型丰富,应用快: 支持星火全系列,兼容超30个开源大模型版本的微调与服务,微调到应用的工期从几天降低到小时级。
- 成熟训推框架,高可用: 构建开箱即用的训推工具与框架,支持lora、full sft等多种训练方式,定制模型按需托管,服务可用性99.95%
- 算力利用率高,成本低: 实现基于弹性混合云训推算力的潮汐调度,支持即用即销的大模型自主托管推理模式, 持续提升算力资源利用率,实现大模型推理成本持续降低