【AI】2026年4月开源模型排行榜

2026-04-21 1 阅读5分钟

根据截至 2026 年 4 月 21 日 的最新公开信息，以下是市面上已开源模型的分类排名。排名主要依据权威基准测试分数（如 SWE-Bench、Elo 评分、LMSYS 盲测等）、社区活跃度及工程化落地能力。

一、文字生成类（通用 LLM）

排名	模型	机构	架构/参数	核心优势	许可证
1	Llama 4 Maverick	Meta	MoE / 400B+	综合得分 88.5，海外生态最丰富，多语言均衡	Llama 4 License
2	DeepSeek-V3.2	深度求索	MoE / 671B	综合得分 87.5，数学与推理能力顶尖，性价比极高	DeepSeek License
3	Qwen3-72B	阿里云	72B 稠密	综合得分 87.2，中文第一，Apache 2.0 可商用	Apache 2.0
4	GLM-5	智谱 AI	MoE / 744B 总 / 40B 激活	代码与 Agent 专精，长程任务稳定性 42.1%（SWE-rebench 第一）	开源可商用
5	Llama 4 Scout	Meta	MoE / 109B	综合得分 85.3，轻量且能力强	Llama 4 License
6	Qwen3-32B	阿里云	32B	综合得分 84.1，消费级显卡可流畅运行	Apache 2.0
7	MiniMax M2.5	MiniMax	Sparse MoE / 10B 激活	极速推理（100 TPS），SWE-Bench 80.2%（编程极强）	开源
8	Kimi K2.5	月之暗面	MoE / 200B 总 / 20B 激活	256K 上下文，原生多模态，VideoMMMU 86.6%	开源
9	Yi-Large 2	零一万物	34B 稠密	中文语义、创作、对话顶尖，部署简单稳定	开源
10	Seed-Thinking-v1.5	字节跳动	MoE / 200B 总 / 20B 激活	逻辑推理与流式推理强，AIME/Codeforces 准确率超 75%	开源
11	Mistral Large 2	Mistral AI	24B	欧洲合规首选，轻量高效，GDPR 友好	开源
12	XVERSE-MoE-A4.2B	元象	25.8B 总 / 4.2B 激活	端侧部署王者，仅激活 4.2B，性能媲美 13B	完全开源免费商用

二、编码类（Code LLM）

注：以下仅列出已开源的代码专用模型，Claude Opus 4.6（80.8%）、GPT-5.4（75.1%）等闭源模型未列入。

排名	模型	机构	SWE-Bench Verified	特色能力	许可证
1	MiniMax-M2.5	MiniMax	80.2%	编程能力开源第一，100 TPS 极速，Agent-native	开源
2	Qwen3.6-Plus	阿里云	78.8%	Terminal-Bench 61.6（全球第一），原生多模态，1M 上下文	开源
3	GLM-5	智谱 AI	77.8%	长程任务最稳（SWE-rebench 42.1%），24 小时不崩盘	开源
4	Kimi K2.6	月之暗面	80.2%（综合）	2026.4.20 刚开源，SWE-Bench Pro 58.6%，多语言 76.7%，支持 300 子 Agent 并行	免费商用
5	Kimi K2.5	月之暗面	76.8%	原生多模态编程，视觉理解强	开源
6	DeepSeek-V3.2	深度求索	76.4%	LiveCodeBench 86.4%，数学推理天花板，成本极低	DeepSeek License
7	Qwen3.5-Plus	阿里云	70.6%	多模态+性价比，前代主力	开源
8	Qwen3-Coder-Next	阿里云	—	SWE-rebench 40.0%，Coder 专项优化	开源

三、图片生成类（Image Generation）

排名	模型	机构	Elo 分数	核心优势	开源情况
1	Flux 2 Max	Black Forest Labs	1168	开放权重巅峰，艺术风格范围最广，支持 LoRA 微调	开放权重
2	Flux 2 Dev	Black Forest Labs	1245	开发者首选，图像转图像和修复能力卓越	开放权重
3	Flux 2 Schnell	Black Forest Labs	1232	极速生成（2-5 秒），本地可跑	开放权重
4	Stable Diffusion 3.5 Large	Stability AI	1198	完全开源，ControlNet 生态最完善，可定制性最强	完全开源
5	Hunyuan Image 3.0	腾讯	1238	亚洲语言支持好，官方提供 API	权重开放情况需确认
6	Seedream 4.5	字节跳动	1225	创意美学强，风格迁移和参考能力好	WaveSpeedAI 独家

四、视频生成类（Video Generation）

排名	模型	机构	Elo 分数	核心优势	开源情况
1	HappyHorse 1.0	前阿里淘天团队（张迪）	T2V: 1333 / I2V: 1404	2026.4.8 登顶双榜第一，15B 统一 Transformer，原生同步音视频，7 种语言唇形同步，1080p	完全开源+商用授权
2	SkyReels V4	昆仑万维	1245	短剧生成最强，商业化成熟，月活 8000 万+	开源权重（有商业 API）
3	LTX-2.3	Lightricks	1290	22B 双流架构，生成速度快	开源
4	Wan 2.6	阿里	—	部分开源，运动质量中等	部分开源

五、语音生成类（TTS / Voice）

排名	模型	机构	参数/特色	核心优势	开源情况
1	LongCat-AudioDiT	美团	3.5B / 1B	Seed 基准 SOTA，零样本音色克隆 SIM 0.818，直接在波形潜空间生成，抛弃梅尔谱	完全开源
2	OmniVoice	小米	—	支持 600+ 语言，基于 58 万小时数据训练，语音克隆+设计+自动语音	开源
3	Step-Audio	阶跃星辰	—	Hugging Face 全球热度 Top 5，产品级语音大模型	开源
4	VoxCPM2	OpenBMB	2B	Tokenizer-free，30+ 语言+9 大方言，48kHz 高保真，极致音色克隆	开源
5	IndexTTS-2	IndexTeam	—	零样本语音合成，支持音色克隆、情感迁移、语速调节	开源
6	VoxCPM-1.5	OpenBMB	—	44.1kHz 专业级音质，6.25Hz 标记率，效率优化	开源

总结

截至 2026 年 4 月 21 日，开源模型已在多个领域达到或超越闭源商业模型：

文字/编码：国产模型（Qwen、GLM、MiniMax、Kimi、DeepSeek）已占据开源榜单头部，与 Llama 4 形成双雄格局。
视频：HappyHorse 1.0 是历史上首个在 Artificial Analysis Video Arena 双赛道击败所有闭源商业产品的开源模型。
语音：LongCat-AudioDiT 在零样本音色克隆上达到 SOTA，美团、小米、阶跃星辰等纷纷开源高质量 TTS 模型。
图片：Flux 2 系列和 Stable Diffusion 3.5 仍是开源图像生成的核心基座。