MiniMax M2.7 能力总结
来源:MiniMax M2.7:开启模型的自我进化
总览表
| 维度 | 核心内容 | 关键数据 / 案例 |
|---|
| 定位 | 首个由模型深度参与迭代自身的版本;组织向 AI Native 进化 | Agent Harness、Skills、Tool Search、RL 闭环 |
| 自我进化 | 研究型 Agent 覆盖数据/训练/评测/协作;Harness 自收集反馈迭代 | 内部 RL 工作流承担 30%–50%;自主优化脚手架 100+ 轮、评测 +30%;MLE Bench Lite 三次平均得牌率 66.6% |
| 软件工程 | 日志/Bug/重构/安全/ML/安卓;生产故障因果推理与止血 | SWE-Pro 56.22%;VIBE-Pro 55.6%;Terminal Bench 2 57.0%;线上恢复多次 <3 分钟 |
| 专业办公 | 领域知识 + 任务交付;与复杂环境交互 | GDPval-AA ELO ~1495–1500(开源前列);复杂 skills(>2K Token)遵循率 97%;Toolathon 46.3%;MM-Claw 62.7% |
| 互动娱乐 | 人设保持与情商;对话驱动 GUI 互动 | OpenRoom 开源:GitHub / openroom.ai |
| 落地 | Agent 与开放平台 | agent.minimaxi.com · platform.minimaxi.com |
四大板块对照表
| 板块 | 典型能力 | 一句话 |
|---|
| 01 自我进化 | 文献/实验监控/代码修复/MR;记忆+自反馈+自优化循环 | 模型参与构建下一代模型与 Harness |
| 02 软件工程 | 监控+时间线+DB 验证;非阻塞索引;原生 Agent Teams | 从「会写代码」到「懂生产系统」 |
| 03 专业办公 | Word/Excel/PPT 多轮高保真;金融研报→模型→PPT/报告 | 接近分析师初稿级交付 |
| 04 互动娱乐 | OpenRoom:万物可互动的 Web GUI | 生产力之外的人机「相处」体验 |
总结图
