阿里"欢乐马"屠榜:国产AI视频生成全球第一

0 阅读6分钟

没有发布会,没有官方预热,一个"假名匿名"的模型突然登顶全球榜首,把字节、快手、谷歌全部斩落马下——这匹"马"到底什么来头?"

周末早上,科技圈炸了

今天本来想睡个懒觉,结果手机一直响。

打开一看,朋友圈、科技群都在转发同一个消息:阿里开源了一个叫HappyHorse的视频生成模型,直接登顶全球榜首,把字节Seedance 2.0、快手可灵3.0这些"老牌劲旅"全甩身后了。

我第一反应是:真的假的?

毕竟这两年"国产AI第一"的消息没少听说,大部分是自嗨。但这次好像不太一样——连海外开发者都在刷屏,有人甚至用了"The West is watching"这样的标题。

到底怎么回事,我花了一上午把相关资料翻了个遍,给大家捋清楚。


先说成绩:断崖式领先

4月10日,国际权威AI评测平台Artificial Analysis的Video Arena榜单突然出现了一个陌生的名字——"HappyHorse-1.0"。

没有所属机构,没有团队介绍,就一个"假名匿名",但它交出的成绩单让整个行业坐不住了:

文生视频赛道:Elo评分1374分,领先第二名Seedance 2.0整整115分

图生视频赛道:Elo评分1410分,刷新了该平台历史最高纪录

这个领先幅度是什么概念?

Artificial Analysis上,头部模型之间的Elo差距通常只有二三十分。115分的领先,意味着在100次对决中能赢64次以上,碾压级的优势。

更让人意外的是,这居然是个开源模型。


技术突破:38秒生成5秒高清视频

HappyHorse是阿里ATH创新事业部打造的150亿参数视频生成模型。

参数规模不是最大的看点,效率才是。

在单张H100显卡上,生成一段5秒1080P高清视频,只需要约38秒。这个速度,让很多需要"等几小时"的团队沉默了。

但真正让海外开发者"破防"的,是它的原生音视频联合生成能力。

行业传统的做法是"先有视频,再配音",两条独立的生产线,后期再对齐。HappyHorse从底层架构上打通了这个环节——一次前向传递,视频帧和音频同步生成,人物口型与台词天然匹配。

更绝的是,它支持7种语言的唇形同步:英语、普通话、粤语、日语、韩语、德语、法语。每一个语种,模型都能精准控制对应人种的唇形运动。

这意味着什么?

过去做一个多语言版本的品牌宣传片,需要分别请各语种配音演员,再花大量时间做唇形对齐。现在,一个模型,38秒,全部搞定。


开源背后的战略考量

阿里选择在这个时候开源,意义非凡。

目前,全球顶尖AI视频模型大多采用闭源收费模式。Runway Gen-3生成5秒视频要好几美元,中小团队根本用不起。

HappyHorse承诺完全开源,Apache 2.0协议,可以商用、可以微调、可以本地部署。这意味着:

中小企业:不用再花几十万买商业API用自己的GPU就能跑

出海团队:一个模型覆盖七种语言,本地化成本大幅降低

独立创作者:以前"只有大公司才能做的事",现在个人也能做了

当然,泼点冷水——截至今天,模型权重还没有公开。GitHub仓库基本是个空壳,官方说法是"即将开源"。

但即便如此,它的发布路线本身就很值得玩味:

先匿名打榜→全网热议→官方认领→开放开源。这套"冷启动"玩法,比传统"先发论文再发权重"的路线更接近消费级产品的逻辑。


国产AI的新阶段

HappyHorse的出现,某种程度上代表了中国AI发展的一个新阶段。

过去几年,AI领域有个说法叫"跟随式创新"——美国先做出什么,我们再跟进。但从DeepSeek到GLM-5,再到HappyHorse,这个说法正在被打破。

视频生成领域,中国AI从"追赶者"变成了"定义规则的玩家"。

路透社科技频道在报道中写道:"HappyHorse's native audio-visual fusion approach represents a paradigm shift that Western labs are now scrambling to replicate."

翻译过来就是:HappyHorse的原生音视频融合路线代表了范式转移,西方实验室正在争相复制。

这话听起来有点"大",但看看海外开发者的反应,确实不是自嗨。


普通人能怎么用?

说了这么多硬核的东西,最后说说实际能怎么用。

等开源正式发布后,几个场景值得关注:

电商从业者:输入产品图+文案,直接生成带解说、带场景氛围的种草视频,批量生产内容不再是难题。

自媒体创作者:不用再为"不会做视频"发愁,文字转视频,AI全搞定。

出海团队:一个模型覆盖七种语言,做本地化内容比以前简单太多。

独立开发者:拿到完整开源权重,免费研究、二次开发,不用再等闭源API。

当然,也要提醒一句:网络上已经出现了很多"HappyHorse"的第三方站点,质量参差不齐。建议等官方渠道正式发布后再说,别踩坑。


最后

2018年,OpenAI发布GPT-2时,选择"谨慎开源",理由是"担心被滥用"。

2026年,阿里发布HappyHorse时,选择全面开源、彻底开放。

这背后,是中国AI从技术自信走向生态自信的缩影。

不谦虚地说,这确实是2026年以来,国产AI最让人振奋的消息之一。

你看好这匹"欢乐马"吗?等开源后最想用它做什么?欢迎评论区聊聊。


关于作者

作者:近 20 年技术生涯,待过大厂也创过业。 懂大厂的规范与困境,也懂创业公司的敏捷与无奈。 懂技术也懂商业,实践用技术重构传统业务。公众号「AI 提效随笔」主理人。

欢迎转发,转载请注明出处。


📌 觉得有用?欢迎:

点赞 - 让更多人看到

转发 - 分享给需要的同事/朋友

关注 - 不错过后续更多精彩内容分享