当 OpenRouter 榜单被两个神秘模型霸榜,所有人都以为是 DeepSeek V4 来了。谜底揭晓的那一刻,整个 AI 圈都震惊了——这竟然是小米的万亿参数大模型。
一、神秘模型的「霸榜」传奇
2026年3月,知名大模型基础设施平台 OpenRouter 上突然出现了两个匿名模型:Hunter Alpha 和 Healer Alpha。
没有任何官宣,没有技术博客,甚至没有模型卡片。但它们的表现却让整个开发者社区炸开了锅:
- Hunter Alpha 连续多天登顶 OpenRouter 日榜第一
- 累计调用量突破 1T tokens
- 性能表现被开发者评价为"接近 Claude 4.6"
一时间,猜测四起。有人说是 DeepSeek V4,有人说是 Grok 3,还有人猜测是某个神秘实验室的未公开模型。
直到 3月19日凌晨,小米官方正式揭晓谜底——这两个模型正是小米全新一代 MiMo-V2 系列大模型的早期内测版本。
更戏剧性的是,小米 MiMo 大模型负责人罗福莉(前 DeepSeek 核心研究员)在 X 平台公开认领,让这场"身份之谜"画上了句号。
二、MiMo-V2 家族:三款模型全解析
小米此次发布了三款 MiMo-V2 系列模型,分别对应不同的应用场景:
1. MiMo-V2-Pro Preview(即 Hunter Alpha)
定位:面向 Agent 时代的旗舰基座模型
核心参数:
- 总参数量:1021B(1.02万亿)
- 激活参数量:42B
- 上下文长度:1M(100万 tokens)
技术亮点:
- 采用创新的混合注意力机制(Hybrid Attention),将 SWA(滑动窗口注意力)与 GA(全局注意力)的混合比例提升至 7:1
- 搭配轻量级 MTP(Multi Token Prediction)层,实现高效生成速度
- 针对 OpenClaw 等 Agent 框架的 Scaffold 进行深度 SFT 与 RL 训练
实测表现:
- 在 Artificial Analysis 权威榜单上位列全球第九,国内第三
- 在 OpenClaw PinchBench 评测中跻身全球顶尖水平
- 代码生成、研报撰写、复杂任务规划能力接近 Claude Opus 4.6
2. MiMo-V2-Omni(即 Healer Alpha)
定位:全模态模型,专为快速推理和低延迟场景打造
核心能力:
- 支持文本、图像、音频、视频(最长一小时)的多模态输入
- 具备 GUI Agent 能力,可处理网页、摄像头截图、音频分析等任务
- 在 OpenClaw 中可实现端到端的复杂工作流编排
典型应用场景:
- 截图比价、根据会议录音生成结构化笔记
- 自动操作浏览器、处理多窗口任务
- 与小米智能生态深度集成,操作智能家居
3. MiMo-V2-TTS
定位:首款「说唱兼备」的超拟人语音大模型
核心能力:
- 支持多方言、多音色切换
- 具备音色克隆能力
- 可生成具有情感表达的拟人语音
三、为什么 Hunter Alpha 能「骗过」所有人?
1. 性能表现过于惊艳
在 OpenRouter 的盲测中,Hunter Alpha 展现出了与 Claude 4.6、GPT-5.4 等顶级模型相当的能力:
- 代码生成:能够完成复杂的全栈开发任务,生成的代码风格优雅
- 长文本处理:在百万上下文范围内保持稳定的理解和生成能力
- Agent 能力:可自主完成多步骤任务规划,无需人工干预
2. 时机恰到好处
当时恰逢 DeepSeek V4 即将发布的消息流传,加上 Hunter Alpha 的"匿名+高性能"组合,自然让人联想到 DeepSeek 的低调风格。
3. 负责人背景加成
罗福莉作为前 DeepSeek 核心研究员,其技术路线和工程风格与 DeepSeek 有相似之处。她在小米打造的模型被误认为 DeepSeek 新作,也算是一种"技术传承"的巧合。
四、实测:MiMo-V2-Pro 到底有多强?
测试一:深度研报生成
任务:搜索小米 SU7 Ultra 的相关信息,生成一份详细的调研报告
结果:
- 自动识别需要多步骤执行,并选择合适的工具
- 当检测到工具不可用时,主动寻找替代方案
- 生成的报告格式规范、章节完整、内容详实
测试二:实时热点分析
任务:观察马斯克最近 48 小时的社交动态,分析利好哪些股票概念
结果:
- 正确剔除了大量无用信息(如"True"、"Nice"、"😂"等短回复)
- 识别出矿业机器人和 Autopilot 辩护两个实质信号
- 结合 Optimus 3、xAI、X Money 等信息,给出机器人与 AI 算力的投资主线判断
测试三:复杂代码工程
任务:编写一个「肯德基疯狂星期四」文案生成器,包含:
- 5 种不同风格(悬疑、言情、科幻、职场、废话文学)
- 自动获取当天日期和天气
- 部署在 Linux 上的定时任务
结果:
- 完整生成 Python 脚本、requirements.txt、crontab 配置
- 代码结构清晰,可直接运行
测试四:前端页面生成
任务:生成一个介绍 Healer Alpha 的 HTML 页面,包含参数对比和社区评价
结果:
- 生成的页面排版清晰美观
- 内容充实,包含表格、样式和交互元素
- 展现出优秀的系统设计与任务规划能力
五、价格屠夫:Claude 五分之一的价格
小米在定价策略上延续了"性价比"传统:
| 上下文范围 | 输入价格 | 输出价格 |
|---|---|---|
| 256K 以内 | $1 / 1M tokens | $3 / 1M tokens |
| 1M 以内 | $2 / 1M tokens | $6 / 1M tokens |
对比 Claude Opus 4.6 的定价,MiMo-V2-Pro 的价格仅为其 五分之一,但能力却接近行业天花板。
此外,小米还联合 OpenClaw、OpenCode、KiloCode、Blackbox 及 Cline 五大主流 Agent 框架团队,向全球开发者提供为期一周的限时免费接口。
六、技术架构深度解析
混合注意力机制(Hybrid Attention)
MiMo-V2-Pro 的核心创新在于优化了混合注意力机制:
- SWA(滑动窗口注意力):处理局部依赖,降低计算复杂度
- GA(全局注意力):捕捉长距离依赖,保证全局理解
- 7:1 的混合比例:在效率和效果之间取得最佳平衡
多 Token 预测(MTP)
轻量级的 MTP 层让模型在生成阶段能够:
- 一次预测多个 token,提升生成速度
- 保持生成质量的同时降低延迟
- 特别适合 Agent 场景下的实时交互需求
Agent 专项优化
MiMo-V2-Pro 针对 Agent 框架进行了深度优化:
- SFT(监督微调):学习 Agent 工作流的规范模式
- RL(强化学习):优化长周期任务规划和工具调用策略
- Scaffold 适配:与 OpenClaw 等框架无缝集成
七、生态布局:从「会对话」到「能干活」
1. 小米版「龙虾」MiClaw
作为首个基于 MiMo 模型构建的手机端 AI 智能体产品:
- 具备深入系统的执行能力
- 与小米「人车家」全生态深度集成
- 推动 AI 从「对话」迈向「系统级执行」
2. WPS 灵犀集成
MiMo 的底层推理引擎已与金山办公达成框架级集成:
- WPS 灵犀可直接向 MiMo-V2-Pro 提问或布置复杂任务
- 原生支持 Word、Excel、PPT、PDF 格式
- 覆盖超 95% 的日常文档类型
3. 小米浏览器接入
小米浏览器已全面接入 MiMo-V2-Pro:
- AI 搜索信息获取效率大幅提升
- 支持复杂查询的理解和推理
4. AI Studio 体验平台
小米官方上线了 AI Studio(aistudio.xiaomimimo.com):
- 免费解锁 MiMo-V2-Pro 完整体验
- MiMo Claw 模块打通金山 WebOffice 生态
八、行业影响:AI Agent 进入「系统级执行」时代
MiMo-V2 系列的发布,标志着 AI Agent 从「对话框里的聊天伴侣」进化为「现实世界里的 AI 打工人」。
对开发者的意义
- 更低成本:以五分之一的价格获得接近 Claude 4.6 的能力
- 更强能力:原生支持复杂 Agent 工作流,无需额外工程
- 更好生态:与主流 Agent 框架深度集成,降低接入门槛
对行业的冲击
- 价格战升级:小米的加入将加剧大模型 API 的价格竞争
- Agent 普及:强大的基座模型将加速 AI Agent 在各行业的落地
- 多模态融合:Omni 和 TTS 模型为 Agent 提供了「眼睛」和「嘴巴」
未来展望
小米大模型 Core 团队表示,将以星期为单位持续迭代 MiMo-V2 系列:
- 提供更完善的复杂推理能力
- 优化长周期任务规划
- 向真正的通用智能迈进
九、结语:小米的 AI 野望
雷军在发布会上表示:"在 AI 领域,我们今年的研发和资本投入将超过 160 亿元。"
从 Hunter Alpha 和 Healer Alpha 的惊艳表现来看,小米的 AI 战略绝非空谈。这款万亿参数大模型的发布,不仅证明了小米在 AI 核心技术上的实力,更展现了其打造「人车家全生态 AI」的野心。
当全网都在猜 DeepSeek V4 的时候,小米用实力证明:中国大模型的竞争,已经进入了一个全新的阶段。
参考链接
标签:#小米 #MiMo #大模型 #HunterAlpha #HealerAlpha #AIAgent #OpenClaw #人工智能 #2026技术趋势