无问芯穹上线Qwen3推理加速版！Qwen3-235B-A22B无门槛使用无问芯穹大模型服务平台正式上线Qwen3推理加

无问芯穹大模型服务平台正式上线Qwen3推理加速版，支持128k和function call，注册后即可无门槛免费使用（含API调用）。

Qwen3开源模型版本，包含6款Dense模型Qwen3-32B/14B/8B/4B/1.7B/0.6B和2款MOE模型：Qwen3-235B-A22B（总参235B｜激活22B）、Qwen3-30B-A3B（总参30B｜激活3B）

相比于先前模型，核心升级亮点如下：

双模推理能力：支持"深入思考"与"快速响应"两种模式（和Claude3.7/Gemini2.5 Flash同类技术）
多语言扩展：支持119种语言及方言
专项强化：训练数据量提升至36T，优化了工具调用、Agent与代码执行能力增强

对于企业或个人开发者构建知识库和Agent应用来说，双模推理能力可智能切换推理深度，更好平衡推理成本与任务复杂度。

无问芯穹推理加速版Qwen3表现

1. 代码能力测试

直接输出一个python脚本，实现一个绿色的球在旋转的正十二边形内弹跳。小球应受到重力和摩擦力的影响，而且必须真实地从旋转的墙壁上弹起。/no_think

代码运行展示

2. 前端代码生成

根据以下信息，帮我制作一张精美的卡片，可以使用 html+css+js 等技术。模型介绍Qwen3-32B 是 Qwen 系列第三代的大型语言模型，拥有 328 亿参数，专为高效推理和多语言任务设计。支持无缝切换思考模式（复杂推理）和非思考模式（通用对话），在数学、编码、常识推理及多语言指令执行中表现出色。
模型亮点Qwen3-32B 提供以下关键特性：
灵活模式切换：支持思考模式（逻辑推理、数学、编码）和非思考模式（高效对话），适配多种场景。强大推理能力：在数学、代码生成和常识推理方面超越 QwQ 和 Qwen2.5 模型。人类偏好对齐：在创意写作、角色扮演及多轮对话中提供自然且沉浸式体验。代理能力：与外部工具集成，表现出色，适合复杂代理任务。多语言支持：支持 100 多种语言和方言，具备强大的翻译和指令执行能力。模型规格：因果语言模型，328 亿参数，312 亿非嵌入参数，64 层，GQA 注意力（Q: 64, KV: 8）。

API调用示例

在每个模型主页，无问芯穹大模型服务平台提供了每个模型的API调用示例，用户可以在平台中找示例代码和调用方法，快速实现模型能力的集成和应用开发。

import requests
url = "https://cloud.infini-ai.com/maas/v1/chat/completions"
payload = {    "model": "qwen3-235b-a22b",    "messages": [        {            "role": "user",            "content": "你是谁"        }    ]}headers = {    "Content-Type": "application/json",    "Authorization": "Bearer $API_KEY"}
response = requests.post(url, json=payload, headers=headers)
print(response.json())

无问芯穹大模型服务平台提供大模型推理加速高性能API，资源充足，确保AI应用服务的稳定性。支持文本、图像、视频等多种模态，包括最新开源Qwen2.5 VL系列多模态、Qwen3/DeepSeek（R1/V3）系列LLM模型，以及Jina/bge等sota嵌入重排模型等。