GPT-5.4 mini/nano发布

28 阅读1分钟

GPT-5.4 mini/nano 系列基准表现一览

最近看到一张模型对比图,OpenAI 的 GPT-5.4 在多个公开基准上都表现很稳:SWE-Bench Pro、Terminal-Bench 2.0、OSWorld-Verified、MCP Atlas、GPQA Diamond 都有不错成绩。

其中:

  • GPT-5.4 在软件工程和终端 coding 场景优势明显
  • mini / nano 版本在性能和成本之间更灵活
  • 在工具调用和通用推理上也保持了较强竞争力

如果你在做 AI Agent、自动化或编程辅助,这组结果值得关注。

image.png