阿里今天发布Qwen3.6-27B,在代码任务上刷新开源SOTA,参数效率远超预期。
标签:Qwen · 开源模型 · 代码AI · 量化技术
核心技术:TurboQuant量化
TurboQuant是阿里自研的量化技术,能在将模型体积压缩50%的同时,保持超过95%的原始性能。
本地部署指南
# 使用 Ollama 本地运行
ollama run qwen3.6-27b
参数效率对比
| 模型 | 参数量 | 代码能力 | 内存需求 |
|---|---|---|---|
| Qwen3.6-27B | 27B | SOTA | ~16GB |
| Llama3-70B | 70B | 接近 | ~48GB |
| GPT-4 | 未公开 | 领先 | API |