你可能会说:这不就跟开放世界游戏(比如GTA5、塞尔达)一样吗?我也可以在里面到处跑啊。
还真不太一样。
开放世界游戏的世界是做好的,它是一张被精心搭建过的固定地图,所有元素都被工程师摆在那里,你只是在里面走动而已。
据说GTA5花了5年时间打造,而GTA6,十多年过去了,还没问世…
但HappyOyster的世界是你自己造出来的(一分钟不到),画面是跟着我的动作实时生成的,没有一张提前做好的地图。
你转头,世界就转。
你按W,前方的画面就往前长一段。
你抬头看天空,天空的细节就跟着出来。
有那一秒钟脑海里闪过《头号玩家》绿洲的感觉。
老实讲,作为产品早期阶段,分辨率还在720p、单次只能漫游1分钟,画面也还不算多惊艳。
但那种"言出法随造世界,世界跟着我转"的感受,是文生视频和开放世界游戏都给不了的。
世界模型到底是什么?跟 Seedance2.0 等视频模型有什么区别?
文生视频模型=看电影 你写prompt,AI给你生成一段成片。 你从头到尾只能看,片子出来就死了。想改剧情?只能重新生成一遍。
世界模型≈实时造世界 没有提前做好的画面,世界是你给Prompt之后,实时造出来的。
它有空间、有物理、有声音。你既是玩家,也是这个世界的创造者。它会跟随你的意志而实时变化。
HappyOyster这款世界模型应用,有导演(Directing)模式:你可以像导演一样,用自然语言实时改变这个世界的剧情和走向。下雪、起风、让角色做某个动作,你说一句,世界就跟着改一次。
据我所知,一般的世界模型应用只有导演模式的玩法。
但这次阿里的HappyOyster除了导演模式外,还支持了Wandering(漫游)模式,也就是你可以先用prompt创建世界,然后可以像开放世界游戏那样,用WASD自己控制方向去探索(开头的案例就是)~
另外,除了自己造世界外,在HappyOyster上面还可以进入别人造的世界
比如进入别人造的滑雪世界,可以看到,还是有一点点延迟(1~2秒之间),但其实现阶段来说,反应已经算快了,因为正常视频模型生成一段视频都还是分钟级。