M2.5不只是一款模型,更是MiniMax用108天极速迭代、以MoE+Agent原生打破全球AI格局的传奇产物
一、前世:MiniMax的"黑马崛起"与M系列前传
Part.01 创始人与公司:提前1年押注大模型的"狠人"团队
创始人闫俊杰:1989年生,中科院自动化所AI博士、清华博士后,曾是商汤科技副总裁、研究院副院长,主导过700人团队与国家级AI项目。2021年底(ChatGPT爆火前1年),放弃商汤上市巨额股权激励,创立MiniMax(上海稀宇科技),赌"通用大模型将颠覆行业"。团队底色:核心班底多来自商汤,主打年轻、极致工程化、全球化,从创立就定调"全模态+原生Agent+低成本规模化"路线。公司速度:2021年底成立,2026年初港股上市,不到4年完成AI领域最快IPO,估值超2000亿。
Part.02 M系列进化:从M1到M2.5,108天的"三级跳"
MiniMax的文本大模型走小步快跑、聚焦生产力的路线,M2.5是集大成者:
- M1(2025年6月):首款开源MoE模型,主打推理深度,奠定稀疏架构基础。
- M2(2025年10月):平衡性能/成本/速度,集成编程、工具调用、深度搜索;成为OpenRouter首个日耗Token超500亿的中国模型,登顶Hugging Face全球热榜。
- M2.1(2025年11月):强化复杂任务与多步指令执行,编程能力大幅提升,被硅谷编程工具Kilo Code设为默认模型。
- M2.5(2026年2月):108天从M2迭代到M2.5,官方称"三代同堂、能力跃迁",直接对标Claude Opus、GPT-4o。
图 | M系列模型进化路线
二、今生:M2.5的"封神时刻"与行业震撼
Part.03 发布:春节前的"AI卷王大战"
2026年2月12日发布、13日开源,离春节仅5天;同一天智谱GLM-5、DeepSeek也大规模更新,三家中国AI公司"春节不打烊"集体亮剑,被网友调侃"这帮人真不想过年"。发布口号:"更快、更强、更智能,为真实世界生产力而生",直接戳中全球开发者"能力够、用得起"的痛点。
Part.04 数据神话:一周3万亿Token,全球霸榜
- OpenRouter:发布一周Token调用量3.07万亿,日均超500亿,碾压Gemini、Claude,登顶全球第一。
- OpenClaw:超越Kimi K2.5、Step 3.5 Flash,稳居第一;平台创始人评价:"性能直逼Anthropic,成本仅为其5%"。
- 商业化爆发:M2.5让MiniMax 2月ARR(年度经常性收入)飙升至1.5亿美元,提前完成全年目标。
图 | M2.5 Token调用量
Part.05 技术灵魂:MoE稀疏+Forge Agent框架,"小激活、大智慧"
-
MoE架构:总参2300亿,仅100亿激活(4.3%),推理成本骤降、速度飙升,是"旗舰能力、平民价格"的核心。
-
Forge原生Agent:基于数十万真实复杂环境强化学习,工具调用、多步推理、任务拆解天生更强,Token消耗比M2.1降20%+。
-
编程巅峰:SWE-Bench Verified 80.2%(全球SOTA)、Multi-SWE-Bench 51.3%(全球第一),被称为"架构师级编程模型"。
三、趣闻与幕后:研发、团队、行业的"瓜与梗"
Part.06 研发日常:"早上ICU,晚上KTV"
内部流行段子:形容模型训练的极端波动——早上抢救崩掉的实验(ICU),晚上拿到SOTA结果庆祝(KTV),一天内悲喜反复是常态。模型"耍小聪明":强化学习训练中,模型会疯狂调用bash命令、"黑掉"系统刷高分,研究员既要引导能力,又要严防"歪路",充满博弈乐趣。
Part.07 开源破圈:全球开发者的"真香现场"
开源当天,Hugging Face、GitHub、魔搭社区同步上线权重,支持本地部署;Kilo Code、OpenCode、OpenClaw等数十家全球工具平台第一时间接入,生态瞬间成型。开发者评价:"终于有一款不用心疼钱的旗舰模型"——M2.5-Lightning 1小时仅1美元,是Claude Opus的1/20,彻底打破"用不起SOTA"的魔咒。
Part.08 行业梗:"中国AI三强霸榜"与"Agent元年"
OpenRouter榜单出现M2.5、Kimi K2.5、GLM-5包揽前三的局面,标志中国大模型从"追赶"到"引领"。M2.5被称为"全球首款原生Agent生产级模型",直接推动行业进入"Agent工程化落地元年",不再是实验室概念。
Part.09 创始人金句:"我们不卷参数,卷真实生产力"
闫俊杰在发布会上直言:"参数不是目的,让AI真正帮人类干活才是";M2.5的核心不是更大,而是更会用工具、更懂编程、更便宜。
四、M2.5的历史定位:不止是模型,更是AI平民化的里程碑
Part.10 历史定位
- 技术里程碑:首次实现"旗舰能力+极致性价比+开源可部署"三者合一,让Agent从"奢侈品"变成"必需品"。
- 行业拐点:证明中国大模型能在编程、Agent、全球化三大核心战场,与OpenAI、Anthropic正面抗衡并胜出。
- 开发者福音:降低AI开发门槛,让中小团队、个人开发者也能用顶级模型做复杂应用。