4 月 2 日,通义千问正式发布了新一代大语言模型 Qwen3.6-Plus。继 2 月份 Qwen3.5 系列亮相后,这次更新在智能体编程(Agentic Coding)和多模态推理维度实现了显著跨越。作为一款面向真实开发场景设计的模型,Qwen3.6-Plus 不仅在各项基准测试中表现出色,更通过深度集成推理与执行能力,堪称当下编程能力最强的国产模型,接近 Claude 系列(可能卡皮巴拉都是这么厉害吧)。
编程智能体的全面进化
对比上一代,Qwen3.6-Plus 表现更加出色了。在 SWE-bench 系列真实编程任务、Terminal-Bench 2.0 终端编程测试以及 NL2Repo 长程编程任务中,它的表现已经可以正面对标 Claude 4.5 Opus,并大幅领先于 GLM-5 和 Kimi-K2.5 等同类模型。
这种提升不仅仅体现在代码补全上,更在于模型对仓库级复杂问题的处理能力。它能自主拆解任务需求,在长达 100 万词元(1M Context Window)的上下文窗口中精准提取信息,并执行跨文件的代码治理。通过这种高度自主的执行逻辑,自然语言驱动开发的 Vibe Coding 体验变得更加可靠。
原生多模态推理与视觉编程
多模态能力是 Qwen3.6-Plus 的另一大亮点。它不再局限于基础的图像识别,而是进化到了视觉推理与任务执行阶段。
在实际演示中,模型表现出了极强的视觉编程能力。无论是根据 UI 截图生成前端页面,还是基于设计稿完成 3D 动效网页的开发,Qwen3.6-Plus 都能精准理解视觉元素间的逻辑关系。
此外,模型在视频理解和 GUI 智能体(计算机操作助手)场景下也有突破。它能像人类一样感知屏幕状态,结合规划能力决定下一步操作,例如在网页上自动筛选特定价位和外观的商品。这种从感知到推理再到行动的闭环,使得多模态模型在真实工作流中具备了实用价值。
API 新特性:保留推理链路
针对智能体任务的复杂性,Qwen3.6-Plus 在 API 中引入了 preserve_thinking 功能。在多轮对话中,模型可以保留之前的思考过程,这不仅增强了决策的一致性,还能在长程任务中减少重复推理带来的 token 消耗。对于需要调用外部工具、进行多步搜索的开发者来说,这一特性显著提升了系统的稳定性。
Qwen Code
为了让开发者更高效地调用模型能力,官方深度优化了开源工具 Qwen Code。这是一个运行在终端的 AI 智能体,能自动化处理代码库分析、Bug 修复等繁琐任务。目前,通过 Qwen Code OAuth 登录的用户每天可享受 1,000 次免费调用 Qwen3.6-Plus 的额度。
由于 Qwen Code 基于 Node.js 开发,要求运行 Node.js 环境版本在20以上。所以,如果不想在环境上浪费时间,可以通过ServBay来部署。
ServBay 支持在本地一键部署 Node.js 环境,根本不用手动处理环境变量。在 ServBay 中完成 Node.js 初始化后,在终端执行几行命令即可快速上手.
- 安装工具:
npm install -g @qwen-code/qwen-code@latest
- 启动程序:
qwen
- 身份验证:
/auth
通过 ServBay 搭建的稳定底座,结合 Qwen Code 的自动化能力,开发者可以迅速将 Qwen3.6-Plus 的推理能力接入到本地开发流程中。
全面兼容 Claude Code 与 Anthropic 协议
Qwen3.6-Plus 的还有一大亮点,就是它的兼容性很高。官方 API 不仅支持标准协议,还专门提供了兼容 Anthropic 的接口规范,那可以直接将 Qwen3.6-Plus 接入到 Claude Code、OpenClaw、Cline 等流行的第三方智能体框架中。
对于习惯使用 Claude Code 的开发者,现在只需要修改环境变量中的 ANTHROPIC_BASE_URL 指向阿里云百炼地址,并配置相应的 API Key,就能在原有的工具链中体验 Qwen3.6-Plus 的百万级上下文和强悍的推理能力。这种无缝切换的能力,极大地降低了开发者尝试新模型的门槛。
总结与展望
Qwen3.6-Plus 出息了,它正在朝着高度自主的超级智能体演进。它通过百万级上下文、精准的工具调用以及强悍的多模态推理,解决了大量真实世界中的工程难题。
目前 Qwen3.6-Plus 已在阿里云百炼平台上线,并全面兼容 OpenAI 和 Anthropic 的协议规范。随着后续更小尺寸模型的开源以及旗舰版 Qwen3.6-Max 的临近,国产 AI 智能体生态将迎来更广阔的创作空间。