Mistral：Medium is the new large.中型模型即新旗舰。 Mistral Medium 3 凭

看官方给出的评估，效果和4o打平，成本比Deepseek低。没说参数大小。

中型模型即新旗舰。

Mistral Medium 3 凭借业界领先的性能和 8 倍成本优势，极大简化了企业部署流程。

2025年5月7日
来自 Mistral AI

在 Mistral AI，我们持续拓展开源模型（如 Mistral Small、Mistral Large、Pixtral 等）与企业级模型（如 Mistral OCR、Mistral Saba、Ministral 3B / 8B 等）的边界。从 Mistral 7B 开始，我们的模型就已经展现出远超更大、更昂贵模型的性能表现。今天，我们隆重推出 Mistral Medium 3，将语言模型的效率和易用性提升到全新高度。

核心亮点

Mistral Medium 3 开启了一个全新模型类别，具备以下特点：

业界领先的性能（SOTA）
成本降低 8 倍
部署流程更简单，企业更易采用

该模型在 代码生成 和 多模态理解 等专业场景中表现尤为出色。

它支持一系列企业级能力，包括：

混合部署或本地部署 / VPC 内部署
定制化后训练（post-training）
可无缝集成至企业现有系统和工具中

性能与成本的完美平衡

Mistral Medium 3 具备前沿级性能，但成本却大幅降低。例如，在多个基准测试中，其性能达到了 Claude Sonnet 3.7 的 90% 以上，但成本显著更低： $0.4/百万 tokens（输入） /$ 2/百万 tokens（输出） 。

性能方面，Mistral Medium 3 超越了领先的开源模型如 Llama 4 Maverick，以及商用模型如 Cohere Command R+ 。
成本方面，它优于诸如 DeepSeek v3 这类以低价著称的模型，无论是 API 使用还是自部署场景中。

此外，Mistral Medium 3 可在任何云环境部署，最低仅需四张 GPU 即可运行。

顶级性能表现

Mistral Medium 3 专为专业用途打造，尤其在代码生成和STEM（科学、技术、工程、数学）任务中表现突出，接近甚至超越一些体积更大、速度更慢的旗舰模型。

（注：所有基准测试均基于统一内部评估流程，部分指标来源于公开报告，部分由 Mistral 自测。）

人类评估（Human Eval）

除了学术基准测试，我们还引入了更贴近实际应用的人类评估。Mistral Medium 3 在代码相关任务中持续领先，全面超越一些体量更大的模型。

为企业打造

与其他 SOTA 模型相比，Mistral Medium 3 在适配企业场景方面表现更佳。在当前企业不得不在“API 微调”和“自部署+自定义行为”之间艰难选择的背景下，Mistral Medium 3 提供了一条更综合的路径，能够真正将智能能力嵌入企业系统中。

借助 Mistral 的 AI 应用方案，模型可以实现：

持续预训练
全面精调（full fine-tuning）
与企业知识库融合

从而成为适用于领域定制训练、持续学习和自适应工作流的高保真解决方案。来自金融、能源、医疗等领域的 beta 用户，正在利用该模型进行：

更深度的客户服务上下文理解
个性化业务流程
复杂数据集的分析处理

即日起可用

Mistral Medium 3 的 API 今日起可在 Mistral La Plateforme 与 Amazon SageMaker 上使用。即将登陆：IBM WatsonX、NVIDIA NIM、Azure AI Foundry、Google Cloud Vertex 等平台。

如需在您的本地环境中部署和定制模型，请与我们联系。

## One more thing…

继 3 月发布 Mistral Small、今天发布 Mistral Medium 后，我们即将在未来几周推出一款“大”产品已不是什么秘密。

在我们的中型模型已全面超越如 Llama 4 Maverick 等开源旗舰模型的今天，下一步会带来什么样的“开放”惊喜，敬请期待 :)