近日,雷军牵头打造的自研开源推理模型Xiaomi MiMo-V2-Flash正式发布, 该模型在代码能力与Agent测评基准中跻身全球开源模型前二,部分指标比肩顶尖闭源模型。这一突破不仅标志着小米在AI大模型领域实现从跟跑到并跑的跨越,更以“低成本、高速度”的特性,为行业开启了大模型实用化落地的新路径。
作为小米MiMo大模型负责人罗福莉入职后的首秀成果,MiMo-V2-Flash的核心优势在于“小参数大能力”。 据36氪实测报道,该模型总参数309B、激活参数仅15B,参数量不足同类顶尖模型的1/2,却在SWE-Bench多语版等软件工程测评中解决71.7%的问题,超越所有开源竞争对手,性能接近GPT-5-High。更关键的是其极致效率:推理速度达每秒150个token,是Claude 4.5 Sonnet的2倍,而API定价仅为后者的2.5%,输入0.7元/百万tokens、输出2.1元/百万tokens的成本优势显著。
实测案例更直观展现其落地价值。该模型可一键生成带交互功能的电商页面、迷宫闯关小游戏,甚至能通过HTML复刻macOS模拟操作系统,支持手势控制与场景切换。 在长文本创作与多轮交互任务中,256k的上下文窗口可完成数百轮Agent对话,配合工具调用能力,实现从“回答问题”到“完成任务”的跨越。目前小米已开源全部代码并向开发者社区贡献推理代码,API限时免费开放,进一步降低了行业应用门槛。
整体来看,MiMo-V2-Flash的发布是小米AI战略的关键落子。 从2023年表态“不做通用大模型”到2025年密集开源多款模型,小米的转向背后是行业趋势的变化——大模型竞争已从“卷参数”进入“卷落地”阶段。正如卢伟冰在大会上披露,小米未来五年研发投入将超2000亿元,其中四分之一投向AI领域,而MiMo系列模型正是为“人车家全生态”量身打造的核心算力基座,将赋能超级小爱、澎湃OS及智驾系统,实现硬件与AI的深度融合。
此次开源登顶更具行业意义。在国内开源模型与顶尖闭源模型差距缩至数月的背景下,MiMo-V2-Flash的高性价比路线,打破了“大参数=高性能”的固有认知,为中小企业与开发者提供了普惠性AI工具。当技术竞争回归效率与实用,小米的探索不仅强化了自身生态壁垒,更将推动国内AI产业从技术竞赛走向价值落地。未来,随着模型在更多硬件终端的适配,小米“AI+硬件”的生态故事正逐步照进现实。