全网猜了一周 DeepSeek V4，结果是小米干的！Hunter Alpha 与 Healer Alpha 深度解析

当 OpenRouter 榜单被两个神秘模型霸榜，所有人都以为是 DeepSeek V4 来了。谜底揭晓的那一刻，整个 AI 圈都震惊了——这竟然是小米的万亿参数大模型。

一、神秘模型的「霸榜」传奇

2026年3月，知名大模型基础设施平台 OpenRouter 上突然出现了两个匿名模型：Hunter Alpha 和 Healer Alpha。

没有任何官宣，没有技术博客，甚至没有模型卡片。但它们的表现却让整个开发者社区炸开了锅：

Hunter Alpha 连续多天登顶 OpenRouter 日榜第一
累计调用量突破 1T tokens
性能表现被开发者评价为"接近 Claude 4.6"

一时间，猜测四起。有人说是 DeepSeek V4，有人说是 Grok 3，还有人猜测是某个神秘实验室的未公开模型。

直到 3月19日凌晨，小米官方正式揭晓谜底——这两个模型正是小米全新一代 MiMo-V2 系列大模型的早期内测版本。

更戏剧性的是，小米 MiMo 大模型负责人罗福莉（前 DeepSeek 核心研究员）在 X 平台公开认领，让这场"身份之谜"画上了句号。

二、MiMo-V2 家族：三款模型全解析

小米此次发布了三款 MiMo-V2 系列模型，分别对应不同的应用场景：

1. MiMo-V2-Pro Preview（即 Hunter Alpha）

定位：面向 Agent 时代的旗舰基座模型

核心参数：

总参数量：1021B（1.02万亿）
激活参数量：42B
上下文长度：1M（100万 tokens）

技术亮点：

采用创新的混合注意力机制（Hybrid Attention），将 SWA（滑动窗口注意力）与 GA（全局注意力）的混合比例提升至 7:1
搭配轻量级 MTP（Multi Token Prediction）层，实现高效生成速度
针对 OpenClaw 等 Agent 框架的 Scaffold 进行深度 SFT 与 RL 训练

实测表现：

在 Artificial Analysis 权威榜单上位列全球第九，国内第三
在 OpenClaw PinchBench 评测中跻身全球顶尖水平
代码生成、研报撰写、复杂任务规划能力接近 Claude Opus 4.6

2. MiMo-V2-Omni（即 Healer Alpha）

定位：全模态模型，专为快速推理和低延迟场景打造

核心能力：

支持文本、图像、音频、视频（最长一小时）的多模态输入
具备 GUI Agent 能力，可处理网页、摄像头截图、音频分析等任务
在 OpenClaw 中可实现端到端的复杂工作流编排

典型应用场景：

截图比价、根据会议录音生成结构化笔记
自动操作浏览器、处理多窗口任务
与小米智能生态深度集成，操作智能家居

3. MiMo-V2-TTS

定位：首款「说唱兼备」的超拟人语音大模型

核心能力：

支持多方言、多音色切换
具备音色克隆能力
可生成具有情感表达的拟人语音

三、为什么 Hunter Alpha 能「骗过」所有人？

1. 性能表现过于惊艳

在 OpenRouter 的盲测中，Hunter Alpha 展现出了与 Claude 4.6、GPT-5.4 等顶级模型相当的能力：

代码生成：能够完成复杂的全栈开发任务，生成的代码风格优雅
长文本处理：在百万上下文范围内保持稳定的理解和生成能力
Agent 能力：可自主完成多步骤任务规划，无需人工干预

2. 时机恰到好处

当时恰逢 DeepSeek V4 即将发布的消息流传，加上 Hunter Alpha 的"匿名+高性能"组合，自然让人联想到 DeepSeek 的低调风格。

3. 负责人背景加成

罗福莉作为前 DeepSeek 核心研究员，其技术路线和工程风格与 DeepSeek 有相似之处。她在小米打造的模型被误认为 DeepSeek 新作，也算是一种"技术传承"的巧合。

四、实测：MiMo-V2-Pro 到底有多强？

测试一：深度研报生成

任务：搜索小米 SU7 Ultra 的相关信息，生成一份详细的调研报告

结果：

自动识别需要多步骤执行，并选择合适的工具
当检测到工具不可用时，主动寻找替代方案
生成的报告格式规范、章节完整、内容详实

测试二：实时热点分析

任务：观察马斯克最近 48 小时的社交动态，分析利好哪些股票概念

结果：

正确剔除了大量无用信息（如"True"、"Nice"、"😂"等短回复）
识别出矿业机器人和 Autopilot 辩护两个实质信号
结合 Optimus 3、xAI、X Money 等信息，给出机器人与 AI 算力的投资主线判断

测试三：复杂代码工程

任务：编写一个「肯德基疯狂星期四」文案生成器，包含：

5 种不同风格（悬疑、言情、科幻、职场、废话文学）
自动获取当天日期和天气
部署在 Linux 上的定时任务

结果：

完整生成 Python 脚本、requirements.txt、crontab 配置
代码结构清晰，可直接运行

测试四：前端页面生成

任务：生成一个介绍 Healer Alpha 的 HTML 页面，包含参数对比和社区评价

结果：

生成的页面排版清晰美观
内容充实，包含表格、样式和交互元素
展现出优秀的系统设计与任务规划能力

五、价格屠夫：Claude 五分之一的价格

小米在定价策略上延续了"性价比"传统：

上下文范围	输入价格	输出价格
256K 以内	$1 / 1M tokens	$3 / 1M tokens
1M 以内	$2 / 1M tokens	$6 / 1M tokens

对比 Claude Opus 4.6 的定价，MiMo-V2-Pro 的价格仅为其 五分之一，但能力却接近行业天花板。

此外，小米还联合 OpenClaw、OpenCode、KiloCode、Blackbox 及 Cline 五大主流 Agent 框架团队，向全球开发者提供为期一周的限时免费接口。

六、技术架构深度解析

混合注意力机制（Hybrid Attention）

MiMo-V2-Pro 的核心创新在于优化了混合注意力机制：

SWA（滑动窗口注意力）：处理局部依赖，降低计算复杂度
GA（全局注意力）：捕捉长距离依赖，保证全局理解
7:1 的混合比例：在效率和效果之间取得最佳平衡

多 Token 预测（MTP）

轻量级的 MTP 层让模型在生成阶段能够：

一次预测多个 token，提升生成速度
保持生成质量的同时降低延迟
特别适合 Agent 场景下的实时交互需求

Agent 专项优化

MiMo-V2-Pro 针对 Agent 框架进行了深度优化：

SFT（监督微调）：学习 Agent 工作流的规范模式
RL（强化学习）：优化长周期任务规划和工具调用策略
Scaffold 适配：与 OpenClaw 等框架无缝集成

七、生态布局：从「会对话」到「能干活」

1. 小米版「龙虾」MiClaw

作为首个基于 MiMo 模型构建的手机端 AI 智能体产品：

具备深入系统的执行能力
与小米「人车家」全生态深度集成
推动 AI 从「对话」迈向「系统级执行」

2. WPS 灵犀集成

MiMo 的底层推理引擎已与金山办公达成框架级集成：

WPS 灵犀可直接向 MiMo-V2-Pro 提问或布置复杂任务
原生支持 Word、Excel、PPT、PDF 格式
覆盖超 95% 的日常文档类型

3. 小米浏览器接入

小米浏览器已全面接入 MiMo-V2-Pro：

AI 搜索信息获取效率大幅提升
支持复杂查询的理解和推理

4. AI Studio 体验平台

小米官方上线了 AI Studio（aistudio.xiaomimimo.com）：

免费解锁 MiMo-V2-Pro 完整体验
MiMo Claw 模块打通金山 WebOffice 生态

八、行业影响：AI Agent 进入「系统级执行」时代

MiMo-V2 系列的发布，标志着 AI Agent 从「对话框里的聊天伴侣」进化为「现实世界里的 AI 打工人」。

对开发者的意义

更低成本：以五分之一的价格获得接近 Claude 4.6 的能力
更强能力：原生支持复杂 Agent 工作流，无需额外工程
更好生态：与主流 Agent 框架深度集成，降低接入门槛

对行业的冲击

价格战升级：小米的加入将加剧大模型 API 的价格竞争
Agent 普及：强大的基座模型将加速 AI Agent 在各行业的落地
多模态融合：Omni 和 TTS 模型为 Agent 提供了「眼睛」和「嘴巴」

未来展望

小米大模型 Core 团队表示，将以星期为单位持续迭代 MiMo-V2 系列：

提供更完善的复杂推理能力
优化长周期任务规划
向真正的通用智能迈进

九、结语：小米的 AI 野望

雷军在发布会上表示："在 AI 领域，我们今年的研发和资本投入将超过 160 亿元。"

从 Hunter Alpha 和 Healer Alpha 的惊艳表现来看，小米的 AI 战略绝非空谈。这款万亿参数大模型的发布，不仅证明了小米在 AI 核心技术上的实力，更展现了其打造「人车家全生态 AI」的野心。

当全网都在猜 DeepSeek V4 的时候，小米用实力证明：中国大模型的竞争，已经进入了一个全新的阶段。

参考链接

标签：#小米 #MiMo #大模型 #HunterAlpha #HealerAlpha #AIAgent #OpenClaw #人工智能 #2026技术趋势