GPT-5.4 mini/nano 系列基准表现一览
最近看到一张模型对比图,OpenAI 的 GPT-5.4 在多个公开基准上都表现很稳:SWE-Bench Pro、Terminal-Bench 2.0、OSWorld-Verified、MCP Atlas、GPQA Diamond 都有不错成绩。
其中:
- GPT-5.4 在软件工程和终端 coding 场景优势明显
- mini / nano 版本在性能和成本之间更灵活
- 在工具调用和通用推理上也保持了较强竞争力
如果你在做 AI Agent、自动化或编程辅助,这组结果值得关注。