实测震撼:1美元/小时的开源模型,编程能力追平Claude Opus 4.6

30 阅读5分钟

国产AI春节档,彻底炸啦‼️
就在前夜,MiniMax M2.5 重磅登场。
而在昨日,MiniMax 已然暴涨 16%,总市值一度达到 2133 亿港元,涨至历史新高。

在关键的编码基准测试中,M2.5 已极度缩小与 Claude Opus 4.6 这些全球最顶尖大模型间的差距!

在其发布后不久,全球开发者社区再次震撼了。

它不仅性能媲美 Opus 4.6,还是国内第一个超越 Claude Sonnet 的开源模型。
甚至连 OpenClaw 之父,都赶来盛赞 MiniMax。

以前,几乎所有 AI 创业者和开发者都有一个共同痛点:想用最顶级的 SOTA 模型,就得忍受那贵得离谱的价格和慢如蜗牛的响应。
但就在今天,这个平衡被打破了。
MiniMax 带着 M2.5 轰然登场,不仅市值直接拉升至 2133 亿港元,更是在全球开发者社区扔下了一枚重磅炸弹:

1美金,连续工作 1 小时;性能,直逼 Claude Opus 4.6。
这不只是更新,这是一场关于“智力平权”的革命。

逻辑陷阱?Opus 翻车了,它却稳得像个老司机

很多人说,现在的模型都是“刷榜专家”,一到实测就露馅。
为了撕掉这张标签,我们不测 LeetCode 那些被喂烂了的题,直接上了一道“神逻辑”难题:
““我要去遛马,大草原离我家蒙古包只有 5 米,我应该走着去还是骑马去?”
这道题看似简单,实则埋了深坑。
很多号称最强的模型(包括某 4.6 旗舰)在这儿都折戟了...

MiniMax M2.5 的回答却让我直接破防了!

它不仅只用了 3 秒,还带着一丝幽默感给我小提示:“5米这个距离实在太近,可能你刚骑上马还没坐稳就到了。建议可以考虑骑着马多绕一小圈,充分体验一下骑马的感觉!“

这种“懂人心”的逻辑拆解力,背后是 M2.5 对真实世界复杂场景的深度理解。

程序员的“终结者”?不,是你的全栈架构师

作为AI编程深度使用者,我最看重的是代码的“工程感”。
M2.5 提出的 “像架构师一样思考” 绝不是噱头。
在实测中,给它一段带有“隐藏 Bug”的 Python 异步日志系统代码,它展现出了惊人的洞察力:

  1. 秒级预判: 一眼看穿了 count++ 在多线程下的非原子性问题。
  2. 拒绝乱写: 在动手前,它会先出一份 Spec(技术规格书),规划好 UI 逻辑和 Server 端 API。
  3. 从 0 到 1: 它不仅能修 Bug,甚至能直接用一个 HTML 文件给你手搓一个带漂移反馈的 3D 卡丁车竞技游戏。

最恐怖的数据是:在 MiniMax 内部,M2.5 生成的代码已经占到新提交代码的 80%
_这意味着,它已经不是一个辅助工具,而是真正能干活的“数字员工”。
_

吊打高价:1 万美金,能雇 4 个顶级 Agent 干一年

这是最让老板们兴奋的一点。
以往我们要运行一个复杂的 Agent(智能体),得时刻盯着 Token 消耗,生怕一觉醒来账户余额清零。

  • Opus 级性能,1/10 的价格。
  • 100 TPS 的超高流速(是目前主流模型的 2 倍)。
  • 极致性价比: 1 万美金,可以让 4 个 Agent 每天 24 小时不间断工作一整年。

这直接把 Agent 的商业门槛从“富人游戏”拉到了“全民普惠”。

硬核拆解:为什么它能这么快、这么准?

很多人好奇,MiniMax 凭什么在 108 天内就完成了从 M2 到 M2.5 的三连跳?
核心武器只有两个字:Forge(原生 Agent RL 框架)。

“打个比方: 传统的模型训练像是在考场里背书,而 M2.5 的强化学习(RL)是在模拟器里疯狂“打副本”。
它通过 CISPO 算法过程奖励机制(Process Reward),不再只看最终结果对不对,而是监控每一个推理步骤的质量。
它甚至学会了“省钱”——通过更精准的搜索轮次,减少不必要的思考Token。
这种进化,让它在办公场景(Word 排版、Excel 复杂建模)中,胜率直接拉到了 59%

方法论:如何用好 M2.5 这把利刃?

如果你现在还把 AI 当聊天机器人用,那就太浪费了。
M2.5 给我们的启示是:

  • 场景为王: 把原本需要高薪专家的环节(如金融建模、代码 Review)交给 M2.5。
  • SOP 融合: 将你的行业经验(SOP)灌给 Agent,配合它的 Office Skills,产出的是直接可交付的研报,而不是废话。

现状与愿景:Agent 时代,真的来了

M2.5 的出现,标志着“大模型性能稀缺化”的终结。
当智力不再昂贵,真正的差距将来自于:谁能更深地理解业务场景,谁能更快地整合系统。
MiniMax 已经把权重开源,把价格打了下来。
剩下的,就看我们的想象力了。
👇 点击下方链接,直接上手实测:

  • **智能体体验:**agent.minimaxi.com
  • **开发者 API:**platform.minimaxi.com

我是吉米,陪你一起在 AI 浪潮里,做一个不被替代的聪明开发者。