全网猜了一周 DeepSeek V4,结果是小米干的!Hunter Alpha 与 Healer Alpha 深度解析

2 阅读8分钟

当 OpenRouter 榜单被两个神秘模型霸榜,所有人都以为是 DeepSeek V4 来了。谜底揭晓的那一刻,整个 AI 圈都震惊了——这竟然是小米的万亿参数大模型。

一、神秘模型的「霸榜」传奇

2026年3月,知名大模型基础设施平台 OpenRouter 上突然出现了两个匿名模型:Hunter AlphaHealer Alpha

没有任何官宣,没有技术博客,甚至没有模型卡片。但它们的表现却让整个开发者社区炸开了锅:

  • Hunter Alpha 连续多天登顶 OpenRouter 日榜第一
  • 累计调用量突破 1T tokens
  • 性能表现被开发者评价为"接近 Claude 4.6"

一时间,猜测四起。有人说是 DeepSeek V4,有人说是 Grok 3,还有人猜测是某个神秘实验室的未公开模型。

直到 3月19日凌晨,小米官方正式揭晓谜底——这两个模型正是小米全新一代 MiMo-V2 系列大模型的早期内测版本

更戏剧性的是,小米 MiMo 大模型负责人罗福莉(前 DeepSeek 核心研究员)在 X 平台公开认领,让这场"身份之谜"画上了句号。

二、MiMo-V2 家族:三款模型全解析

小米此次发布了三款 MiMo-V2 系列模型,分别对应不同的应用场景:

1. MiMo-V2-Pro Preview(即 Hunter Alpha)

定位:面向 Agent 时代的旗舰基座模型

核心参数

  • 总参数量:1021B(1.02万亿)
  • 激活参数量:42B
  • 上下文长度:1M(100万 tokens)

技术亮点

  • 采用创新的混合注意力机制(Hybrid Attention),将 SWA(滑动窗口注意力)与 GA(全局注意力)的混合比例提升至 7:1
  • 搭配轻量级 MTP(Multi Token Prediction)层,实现高效生成速度
  • 针对 OpenClaw 等 Agent 框架的 Scaffold 进行深度 SFT 与 RL 训练

实测表现

  • 在 Artificial Analysis 权威榜单上位列全球第九,国内第三
  • 在 OpenClaw PinchBench 评测中跻身全球顶尖水平
  • 代码生成、研报撰写、复杂任务规划能力接近 Claude Opus 4.6

2. MiMo-V2-Omni(即 Healer Alpha)

定位:全模态模型,专为快速推理和低延迟场景打造

核心能力

  • 支持文本、图像、音频、视频(最长一小时)的多模态输入
  • 具备 GUI Agent 能力,可处理网页、摄像头截图、音频分析等任务
  • 在 OpenClaw 中可实现端到端的复杂工作流编排

典型应用场景

  • 截图比价、根据会议录音生成结构化笔记
  • 自动操作浏览器、处理多窗口任务
  • 与小米智能生态深度集成,操作智能家居

3. MiMo-V2-TTS

定位:首款「说唱兼备」的超拟人语音大模型

核心能力

  • 支持多方言、多音色切换
  • 具备音色克隆能力
  • 可生成具有情感表达的拟人语音

三、为什么 Hunter Alpha 能「骗过」所有人?

1. 性能表现过于惊艳

在 OpenRouter 的盲测中,Hunter Alpha 展现出了与 Claude 4.6、GPT-5.4 等顶级模型相当的能力:

  • 代码生成:能够完成复杂的全栈开发任务,生成的代码风格优雅
  • 长文本处理:在百万上下文范围内保持稳定的理解和生成能力
  • Agent 能力:可自主完成多步骤任务规划,无需人工干预

2. 时机恰到好处

当时恰逢 DeepSeek V4 即将发布的消息流传,加上 Hunter Alpha 的"匿名+高性能"组合,自然让人联想到 DeepSeek 的低调风格。

3. 负责人背景加成

罗福莉作为前 DeepSeek 核心研究员,其技术路线和工程风格与 DeepSeek 有相似之处。她在小米打造的模型被误认为 DeepSeek 新作,也算是一种"技术传承"的巧合。

四、实测:MiMo-V2-Pro 到底有多强?

测试一:深度研报生成

任务:搜索小米 SU7 Ultra 的相关信息,生成一份详细的调研报告

结果

  • 自动识别需要多步骤执行,并选择合适的工具
  • 当检测到工具不可用时,主动寻找替代方案
  • 生成的报告格式规范、章节完整、内容详实

测试二:实时热点分析

任务:观察马斯克最近 48 小时的社交动态,分析利好哪些股票概念

结果

  • 正确剔除了大量无用信息(如"True"、"Nice"、"😂"等短回复)
  • 识别出矿业机器人和 Autopilot 辩护两个实质信号
  • 结合 Optimus 3、xAI、X Money 等信息,给出机器人与 AI 算力的投资主线判断

测试三:复杂代码工程

任务:编写一个「肯德基疯狂星期四」文案生成器,包含:

  • 5 种不同风格(悬疑、言情、科幻、职场、废话文学)
  • 自动获取当天日期和天气
  • 部署在 Linux 上的定时任务

结果

  • 完整生成 Python 脚本、requirements.txt、crontab 配置
  • 代码结构清晰,可直接运行

测试四:前端页面生成

任务:生成一个介绍 Healer Alpha 的 HTML 页面,包含参数对比和社区评价

结果

  • 生成的页面排版清晰美观
  • 内容充实,包含表格、样式和交互元素
  • 展现出优秀的系统设计与任务规划能力

五、价格屠夫:Claude 五分之一的价格

小米在定价策略上延续了"性价比"传统:

上下文范围输入价格输出价格
256K 以内$1 / 1M tokens$3 / 1M tokens
1M 以内$2 / 1M tokens$6 / 1M tokens

对比 Claude Opus 4.6 的定价,MiMo-V2-Pro 的价格仅为其 五分之一,但能力却接近行业天花板。

此外,小米还联合 OpenClaw、OpenCode、KiloCode、Blackbox 及 Cline 五大主流 Agent 框架团队,向全球开发者提供为期一周的限时免费接口

六、技术架构深度解析

混合注意力机制(Hybrid Attention)

MiMo-V2-Pro 的核心创新在于优化了混合注意力机制:

  • SWA(滑动窗口注意力):处理局部依赖,降低计算复杂度
  • GA(全局注意力):捕捉长距离依赖,保证全局理解
  • 7:1 的混合比例:在效率和效果之间取得最佳平衡

多 Token 预测(MTP)

轻量级的 MTP 层让模型在生成阶段能够:

  • 一次预测多个 token,提升生成速度
  • 保持生成质量的同时降低延迟
  • 特别适合 Agent 场景下的实时交互需求

Agent 专项优化

MiMo-V2-Pro 针对 Agent 框架进行了深度优化:

  • SFT(监督微调):学习 Agent 工作流的规范模式
  • RL(强化学习):优化长周期任务规划和工具调用策略
  • Scaffold 适配:与 OpenClaw 等框架无缝集成

七、生态布局:从「会对话」到「能干活」

1. 小米版「龙虾」MiClaw

作为首个基于 MiMo 模型构建的手机端 AI 智能体产品:

  • 具备深入系统的执行能力
  • 与小米「人车家」全生态深度集成
  • 推动 AI 从「对话」迈向「系统级执行」

2. WPS 灵犀集成

MiMo 的底层推理引擎已与金山办公达成框架级集成:

  • WPS 灵犀可直接向 MiMo-V2-Pro 提问或布置复杂任务
  • 原生支持 Word、Excel、PPT、PDF 格式
  • 覆盖超 95% 的日常文档类型

3. 小米浏览器接入

小米浏览器已全面接入 MiMo-V2-Pro:

  • AI 搜索信息获取效率大幅提升
  • 支持复杂查询的理解和推理

4. AI Studio 体验平台

小米官方上线了 AI Studio(aistudio.xiaomimimo.com):

  • 免费解锁 MiMo-V2-Pro 完整体验
  • MiMo Claw 模块打通金山 WebOffice 生态

八、行业影响:AI Agent 进入「系统级执行」时代

MiMo-V2 系列的发布,标志着 AI Agent 从「对话框里的聊天伴侣」进化为「现实世界里的 AI 打工人」。

对开发者的意义

  • 更低成本:以五分之一的价格获得接近 Claude 4.6 的能力
  • 更强能力:原生支持复杂 Agent 工作流,无需额外工程
  • 更好生态:与主流 Agent 框架深度集成,降低接入门槛

对行业的冲击

  • 价格战升级:小米的加入将加剧大模型 API 的价格竞争
  • Agent 普及:强大的基座模型将加速 AI Agent 在各行业的落地
  • 多模态融合:Omni 和 TTS 模型为 Agent 提供了「眼睛」和「嘴巴」

未来展望

小米大模型 Core 团队表示,将以星期为单位持续迭代 MiMo-V2 系列:

  • 提供更完善的复杂推理能力
  • 优化长周期任务规划
  • 向真正的通用智能迈进

九、结语:小米的 AI 野望

雷军在发布会上表示:"在 AI 领域,我们今年的研发和资本投入将超过 160 亿元。"

从 Hunter Alpha 和 Healer Alpha 的惊艳表现来看,小米的 AI 战略绝非空谈。这款万亿参数大模型的发布,不仅证明了小米在 AI 核心技术上的实力,更展现了其打造「人车家全生态 AI」的野心。

当全网都在猜 DeepSeek V4 的时候,小米用实力证明:中国大模型的竞争,已经进入了一个全新的阶段。


参考链接


标签:#小米 #MiMo #大模型 #HunterAlpha #HealerAlpha #AIAgent #OpenClaw #人工智能 #2026技术趋势