无问芯穹上线Qwen3推理加速版!Qwen3-235B-A22B无门槛使用

253 阅读3分钟

无问芯穹大模型服务平台正式上线Qwen3推理加速版,支持128k和function call,注册后即可无门槛免费使用(含API调用)。

Qwen3开源模型版本,包含6款Dense模型Qwen3-32B/14B/8B/4B/1.7B/0.6B和2款MOE模型:Qwen3-235B-A22B(总参235B|激活22B)、Qwen3-30B-A3B(总参30B|激活3B)

相比于先前模型,核心升级亮点如下: 

  1. 双模推理能力:支持"深入思考"与"快速响应"两种模式(和Claude3.7/Gemini2.5 Flash同类技术)

  2. 多语言扩展:支持119种语言及方言

  3. 专项强化:训练数据量提升至36T,优化了工具调用、Agent与代码执行能力增强  

对于企业或个人开发者构建知识库和Agent应用来说,双模推理能力可智能切换推理深度,更好平衡推理成本与任务复杂度。

图片

cloud.infini-ai.com/genstudio/m…

01

无问芯穹推理加速版Qwen3表现

1. 代码能力测试

直接输出一个python脚本,实现一个绿色的球在旋转的正十二边形内弹跳。小球应受到重力和摩擦力的影响,而且必须真实地从旋转的墙壁上弹起。/no_think

图片

代码运行展示

图片

2. 前端代码生成

根据以下信息,帮我制作一张精美的卡片,可以使用 html+css+js 等技术。模型介绍Qwen3-32B 是 Qwen 系列第三代的大型语言模型,拥有 328 亿参数,专为高效推理和多语言任务设计。支持无缝切换思考模式(复杂推理)和非思考模式(通用对话),在数学、编码、常识推理及多语言指令执行中表现出色。
模型亮点Qwen3-32B 提供以下关键特性:
灵活模式切换:支持思考模式(逻辑推理、数学、编码)和非思考模式(高效对话),适配多种场景。强大推理能力:在数学、代码生成和常识推理方面超越 QwQ 和 Qwen2.5 模型。人类偏好对齐:在创意写作、角色扮演及多轮对话中提供自然且沉浸式体验。代理能力:与外部工具集成,表现出色,适合复杂代理任务。多语言支持:支持 100 多种语言和方言,具备强大的翻译和指令执行能力。模型规格:因果语言模型,328 亿参数,312 亿非嵌入参数,64 层,GQA 注意力(Q64, KV: 8)。

图片

API调用示例

在每个模型主页,无问芯穹大模型服务平台提供了每个模型的API调用示例,用户可以在平台中找示例代码和调用方法,快速实现模型能力的集成和应用开发。

import requests
url"https://cloud.infini-ai.com/maas/v1/chat/completions"
payload = {    "model""qwen3-235b-a22b",    "messages": [        {            "role""user",            "content""你是谁"        }    ]}headers = {    "Content-Type""application/json",    "Authorization""Bearer $API_KEY"}
response = requests.post(url, json=payload, headers=headers)
print(response.json())

无问芯穹大模型服务平台提供大模型推理加速高性能API,资源充足,确保AI应用服务的稳定性。支持文本、图像、视频等多种模态,包括最新开源Qwen2.5 VL系列多模态、Qwen3/DeepSeek(R1/V3)系列LLM模型,以及Jina/bge等sota嵌入重排模型等。