本报综合报道 2026年4月16日,中国互联网巨头腾讯和阿里不约而同地按下了同一个按钮——同日发布各自"世界模型"产品。腾讯推出混元3D世界模型2.0(HY-World 2.0),阿里则推出主打实时交互的HappyOyster。这种"撞车"在科技圈并不少见,但这次撞上的,是人工智能下一个十年。
什么是"世界模型"?
这词听着挺玄乎,其实简单来说,就是让AI真正"看懂"这个世界。过去的大语言模型(LLM)就像个读过万卷书的图书管理员,能跟你聊八卦、写代码、翻译外语,但它"知道"玻璃杯掉地上会碎,是因为训练数据里出现过无数次,而不是真懂物理规律。
而世界模型不一样,它要预测的不是下一个词,而是下一个状态——物体怎么移动、一个动作引发什么反应、光影怎么变化。就像那个曾经在城市里生活过、对每条胡同都熟门熟路的向导。
Meta前首席AI科学家杨立昆去年底放话:"三到五年内,世界模型将取代LLM成为主流AI架构。"这话当时得罪了一堆人,但现在全球资本、人才正疯狂涌向这个方向。
两大巨头怎么选赛道?
腾讯和阿里的选择很有意思。阿里HappyOyster走的是"视频基世界模型"路线,支持用户实时调整镜头、改写剧情,最多能连续导演三分钟以上的互动场景。腾讯HY-World 2.0则主攻"3D资产化",直接生成可导入游戏引擎的3D模型。据称,生成一个可交互的游戏原型场景从几个月缩短到12分钟。
风口已来,钱景如何?
热闹背后,难题不少。世界模型的商业闭环还没跑通,目前只有群核科技在港交所上市首日股价暴涨171%,但核心产品营收占比不足1%。大语言模型有清晰的API收费模式,世界模型还在"画饼"阶段。
更麻烦的是定义混乱——国内大量"世界模型"产品,本质可能是视频生成模型、3D重建工具,甚至是披着新皮的仿真软件。
中国玩家机会在哪?
优势很明确:中国有全球最丰富的应用场景和垂直数据积累。阿里有电商和物流数据、腾讯有游戏三维资产、群核有家装设计数据。劣势也很清楚:基础研究深度不如硅谷,商业化路径尚不明朗。
腾讯和阿里同日"亮剑",说明头部科技公司对AI下一个主战场已达成共识。至于谁能笑到最后,时间会给出答案。
这场竞赛,可能比我们想象的更快,也比我们期待的更远。