看官方给出的评估,效果和4o打平,成本比Deepseek低。没说参数大小。
中型模型即新旗舰。
Mistral Medium 3 凭借业界领先的性能和 8 倍成本优势,极大简化了企业部署流程。
2025年5月7日
来自 Mistral AI
在 Mistral AI,我们持续拓展开源模型(如 Mistral Small、Mistral Large、Pixtral 等)与企业级模型(如 Mistral OCR、Mistral Saba、Ministral 3B / 8B 等)的边界。从 Mistral 7B 开始,我们的模型就已经展现出远超更大、更昂贵模型的性能表现。今天,我们隆重推出 Mistral Medium 3,将语言模型的效率和易用性提升到全新高度。
核心亮点
Mistral Medium 3 开启了一个全新模型类别,具备以下特点:
- 业界领先的性能(SOTA)
- 成本降低 8 倍
- 部署流程更简单,企业更易采用
该模型在 代码生成 和 多模态理解 等专业场景中表现尤为出色。
它支持一系列企业级能力,包括:
- 混合部署或本地部署 / VPC 内部署
- 定制化后训练(post-training)
- 可无缝集成至企业现有系统和工具中
性能与成本的完美平衡
Mistral Medium 3 具备前沿级性能,但成本却大幅降低。例如,在多个基准测试中,其性能达到了 Claude Sonnet 3.7 的 90% 以上,但成本显著更低: 2/百万 tokens(输出) 。
性能方面,Mistral Medium 3 超越了领先的开源模型如 Llama 4 Maverick,以及商用模型如 Cohere Command R+ 。
成本方面,它优于诸如 DeepSeek v3 这类以低价著称的模型,无论是 API 使用还是自部署场景中。
此外,Mistral Medium 3 可在任何云环境部署,最低仅需四张 GPU 即可运行。
顶级性能表现
Mistral Medium 3 专为专业用途打造,尤其在代码生成和STEM(科学、技术、工程、数学)任务中表现突出,接近甚至超越一些体积更大、速度更慢的旗舰模型。
(注:所有基准测试均基于统一内部评估流程,部分指标来源于公开报告,部分由 Mistral 自测。)
人类评估(Human Eval)
除了学术基准测试,我们还引入了更贴近实际应用的人类评估。Mistral Medium 3 在代码相关任务中持续领先,全面超越一些体量更大的模型。
为企业打造
与其他 SOTA 模型相比,Mistral Medium 3 在适配企业场景方面表现更佳。在当前企业不得不在“API 微调”和“自部署+自定义行为”之间艰难选择的背景下,Mistral Medium 3 提供了一条更综合的路径,能够真正将智能能力嵌入企业系统中。
借助 Mistral 的 AI 应用方案,模型可以实现:
- 持续预训练
- 全面精调(full fine-tuning)
- 与企业知识库融合
从而成为适用于领域定制训练、持续学习和自适应工作流的高保真解决方案。来自金融、能源、医疗等领域的 beta 用户,正在利用该模型进行:
- 更深度的客户服务上下文理解
- 个性化业务流程
- 复杂数据集的分析处理
即日起可用
Mistral Medium 3 的 API 今日起可在 Mistral La Plateforme 与 Amazon SageMaker 上使用。即将登陆:IBM WatsonX、NVIDIA NIM、Azure AI Foundry、Google Cloud Vertex 等平台。
如需在您的本地环境中部署和定制模型,请与我们联系。
## One more thing…
继 3 月发布 Mistral Small、今天发布 Mistral Medium 后,我们即将在未来几周推出一款“大”产品已不是什么秘密。
在我们的中型模型已全面超越如 Llama 4 Maverick 等开源旗舰模型的今天,下一步会带来什么样的“开放”惊喜,敬请期待 :)