【AI】2026年4月开源模型排行榜

1 阅读5分钟

根据截至 2026 年 4 月 21 日 的最新公开信息,以下是市面上已开源模型的分类排名。排名主要依据权威基准测试分数(如 SWE-Bench、Elo 评分、LMSYS 盲测等)、社区活跃度及工程化落地能力。


一、文字生成类(通用 LLM)

排名模型机构架构/参数核心优势许可证
1Llama 4 MaverickMetaMoE / 400B+综合得分 88.5,海外生态最丰富,多语言均衡Llama 4 License
2DeepSeek-V3.2深度求索MoE / 671B综合得分 87.5,数学与推理能力顶尖,性价比极高DeepSeek License
3Qwen3-72B阿里云72B 稠密综合得分 87.2,中文第一,Apache 2.0 可商用Apache 2.0
4GLM-5智谱 AIMoE / 744B 总 / 40B 激活代码与 Agent 专精,长程任务稳定性 42.1%(SWE-rebench 第一)开源可商用
5Llama 4 ScoutMetaMoE / 109B综合得分 85.3,轻量且能力强Llama 4 License
6Qwen3-32B阿里云32B综合得分 84.1,消费级显卡可流畅运行Apache 2.0
7MiniMax M2.5MiniMaxSparse MoE / 10B 激活极速推理(100 TPS),SWE-Bench 80.2%(编程极强)开源
8Kimi K2.5月之暗面MoE / 200B 总 / 20B 激活256K 上下文,原生多模态,VideoMMMU 86.6%开源
9Yi-Large 2零一万物34B 稠密中文语义、创作、对话顶尖,部署简单稳定开源
10Seed-Thinking-v1.5字节跳动MoE / 200B 总 / 20B 激活逻辑推理与流式推理强,AIME/Codeforces 准确率超 75%开源
11Mistral Large 2Mistral AI24B欧洲合规首选,轻量高效,GDPR 友好开源
12XVERSE-MoE-A4.2B元象25.8B 总 / 4.2B 激活端侧部署王者,仅激活 4.2B,性能媲美 13B完全开源免费商用

二、编码类(Code LLM)

注:以下仅列出已开源的代码专用模型,Claude Opus 4.6(80.8%)、GPT-5.4(75.1%)等闭源模型未列入。

排名模型机构SWE-Bench Verified特色能力许可证
1MiniMax-M2.5MiniMax80.2%编程能力开源第一,100 TPS 极速,Agent-native开源
2Qwen3.6-Plus阿里云78.8%Terminal-Bench 61.6(全球第一),原生多模态,1M 上下文开源
3GLM-5智谱 AI77.8%长程任务最稳(SWE-rebench 42.1%),24 小时不崩盘开源
4Kimi K2.6月之暗面80.2%(综合)2026.4.20 刚开源,SWE-Bench Pro 58.6%,多语言 76.7%,支持 300 子 Agent 并行免费商用
5Kimi K2.5月之暗面76.8%原生多模态编程,视觉理解强开源
6DeepSeek-V3.2深度求索76.4%LiveCodeBench 86.4%,数学推理天花板,成本极低DeepSeek License
7Qwen3.5-Plus阿里云70.6%多模态+性价比,前代主力开源
8Qwen3-Coder-Next阿里云SWE-rebench 40.0%,Coder 专项优化开源

三、图片生成类(Image Generation)

排名模型机构Elo 分数核心优势开源情况
1Flux 2 MaxBlack Forest Labs1168开放权重巅峰,艺术风格范围最广,支持 LoRA 微调开放权重
2Flux 2 DevBlack Forest Labs1245开发者首选,图像转图像和修复能力卓越开放权重
3Flux 2 SchnellBlack Forest Labs1232极速生成(2-5 秒),本地可跑开放权重
4Stable Diffusion 3.5 LargeStability AI1198完全开源,ControlNet 生态最完善,可定制性最强完全开源
5Hunyuan Image 3.0腾讯1238亚洲语言支持好,官方提供 API权重开放情况需确认
6Seedream 4.5字节跳动1225创意美学强,风格迁移和参考能力好WaveSpeedAI 独家

四、视频生成类(Video Generation)

排名模型机构Elo 分数核心优势开源情况
1HappyHorse 1.0前阿里淘天团队(张迪)T2V: 1333 / I2V: 14042026.4.8 登顶双榜第一,15B 统一 Transformer,原生同步音视频,7 种语言唇形同步,1080p完全开源+商用授权
2SkyReels V4昆仑万维1245短剧生成最强,商业化成熟,月活 8000 万+开源权重(有商业 API)
3LTX-2.3Lightricks129022B 双流架构,生成速度快开源
4Wan 2.6阿里部分开源,运动质量中等部分开源

五、语音生成类(TTS / Voice)

排名模型机构参数/特色核心优势开源情况
1LongCat-AudioDiT美团3.5B / 1BSeed 基准 SOTA,零样本音色克隆 SIM 0.818,直接在波形潜空间生成,抛弃梅尔谱完全开源
2OmniVoice小米支持 600+ 语言,基于 58 万小时数据训练,语音克隆+设计+自动语音开源
3Step-Audio阶跃星辰Hugging Face 全球热度 Top 5,产品级语音大模型开源
4VoxCPM2OpenBMB2BTokenizer-free,30+ 语言+9 大方言,48kHz 高保真,极致音色克隆开源
5IndexTTS-2IndexTeam零样本语音合成,支持音色克隆、情感迁移、语速调节开源
6VoxCPM-1.5OpenBMB44.1kHz 专业级音质,6.25Hz 标记率,效率优化开源

总结

截至 2026 年 4 月 21 日,开源模型已在多个领域达到或超越闭源商业模型:

  • 文字/编码:国产模型(Qwen、GLM、MiniMax、Kimi、DeepSeek)已占据开源榜单头部,与 Llama 4 形成双雄格局。
  • 视频HappyHorse 1.0 是历史上首个在 Artificial Analysis Video Arena 双赛道击败所有闭源商业产品的开源模型 。
  • 语音LongCat-AudioDiT 在零样本音色克隆上达到 SOTA,美团、小米、阶跃星辰等纷纷开源高质量 TTS 模型。
  • 图片:Flux 2 系列和 Stable Diffusion 3.5 仍是开源图像生成的核心基座。