MiniMax M2.7 能力总结

0 阅读1分钟

MiniMax M2.7 能力总结

来源:MiniMax M2.7:开启模型的自我进化

总览表

维度核心内容关键数据 / 案例
定位首个由模型深度参与迭代自身的版本;组织向 AI Native 进化Agent Harness、Skills、Tool Search、RL 闭环
自我进化研究型 Agent 覆盖数据/训练/评测/协作;Harness 自收集反馈迭代内部 RL 工作流承担 30%–50%;自主优化脚手架 100+ 轮、评测 +30%;MLE Bench Lite 三次平均得牌率 66.6%
软件工程日志/Bug/重构/安全/ML/安卓;生产故障因果推理与止血SWE-Pro 56.22%;VIBE-Pro 55.6%;Terminal Bench 2 57.0%;线上恢复多次 <3 分钟
专业办公领域知识 + 任务交付;与复杂环境交互GDPval-AA ELO ~1495–1500(开源前列);复杂 skills(>2K Token)遵循率 97%;Toolathon 46.3%;MM-Claw 62.7%
互动娱乐人设保持与情商;对话驱动 GUI 互动OpenRoom 开源:GitHub / openroom.ai
落地Agent 与开放平台agent.minimaxi.com · platform.minimaxi.com

四大板块对照表

板块典型能力一句话
01 自我进化文献/实验监控/代码修复/MR;记忆+自反馈+自优化循环模型参与构建下一代模型与 Harness
02 软件工程监控+时间线+DB 验证;非阻塞索引;原生 Agent Teams从「会写代码」到「懂生产系统」
03 专业办公Word/Excel/PPT 多轮高保真;金融研报→模型→PPT/报告接近分析师初稿级交付
04 互动娱乐OpenRoom:万物可互动的 Web GUI生产力之外的人机「相处」体验

总结图

Generated_image.png