「这可能是目前国内最好的视频大模型。」
家人们,这难道不是一部电影的切片?
超「戏精」的海螺 AI,要干掉好莱坞?
俗话说得好,光说不练假把式。海螺 AI 视频模型的实力究竟如何,还得看一手评测。
接下来,我们从海螺 AI 的拿手绝活开始试水。
打个响指,金箍棒秒变笛子
海螺 AI 上新的图生视频功能,不仅能准确识别上传的图片,还能准确理解超过图片内容之外的复杂文本。
换句话说,创作者可以化身任性的导演,只需下个指令,海螺 AI 就会发挥充分的想象力予以实现。
例如,让《武林外传》中的佟掌柜和邢捕头,上演一出苦情戏。
(图生视频。Prompt:女人悲伤地哭了起来,男人抱住并安慰她。)
不得不说,海螺 AI 的生成效果相当惊艳。佟掌柜眉一皱、嘴一撅,哭泣的表情非常逼真,邢捕头拥抱的动作也很自然流畅。
更难能可贵的是,虽然表情变化和动作幅度都较大,但画面并未崩坏。
再比如被网友玩坏了的「分心男友」经典梗图。我们输入 Prompt:穿红衣服的女生转身,三个人拥抱在一起。
海螺 AI 完美遵循了文字指令,红衣女子转身,和身后的一对情侣拥抱,整套动作一气呵成,没有任何卡顿。
尤其是六只胳膊交叠在一起,很容易出现扭曲变形,但它生成的视频中,几乎没什么明显的 bug。
我们还拿它各种「折腾」世界名画《蒙娜丽莎》。
_(_Prompt:蒙娜丽莎拿起手机,然后打起了电话。)
(Prompt:蒙娜丽莎戴上墨镜。)
海螺 AI 很会「无中生有」,手里要么掏出个大哥大式儿的手机,扣在耳边假装打电话;要么摸出个赛博朋克风格的墨镜,骂骂咧咧地架在鼻梁上,光影、色调等细节处理得都挺到位。
最让人惊喜的,还得是它对图片中物品的精准控制。
比如那张著名的地铁老人看手机的表情包。
不少人应该都见识过他吃手机的 AI 视频,这次我们来一次难度升级:老人拿着的手机变成鸡腿,并吃了起来。
上一秒老人还嫌弃地看着手机,下一秒就变成了鸡腿,然后大快朵颐。
为了体现地铁的高速运行,海螺 AI 对背景的渲染也很逼真,窗外的绿树快速后撤,环境不断变化,增强了沉浸感。
还有让猴哥的金箍棒秒变笛子,由此可见,海螺 AI 能够很好地解构指令框架和深层语义,并在视频生成中加以整合。
(prompt:男子手中的棍子变成了笛子。)
一张自拍 + 一个目的地,想去哪就去哪
在电影《镜像世界》中,导演使用大量特殊镜头和后期制作技术,让小哥从镜子中穿越到另一个时空。
而现在要完成这一效果,只需要一张自拍和一个目的地,海螺 AI 就能实现「跨屏」联动。
例如,将一位美女的照片和一幅风景图拼在一起,然后输入 prompt:女子走向绿地,站在草地上,望着美丽的湖面,镜头缓缓左移。
来瞅瞅效果:
右边的美女完美融合到左边的草地场景中,并且主体从原场景进入目标场景后,光影、色调都会完美嵌入新场景的设定。
(prompt:女子走向红色的森林列车,镜头缓缓左移。)
海螺 AI 按照文字描述,镜头随着女子的运动轨迹而移动,拼接处也逐渐消失。
轻松搞定好莱坞级特效
AI 时代,要有一颗会整活儿的心。
网友们就开发出各种特效玩法,比如 CG 合成、碎片化、变身、爆炸、流体……
要知道,特效这玩意儿,那是嘎嘎费钱。就拿《阿凡达》来说,它的总制作成本为 2.37 亿美元,其中特效成本就占了 1.5 亿美元。
财大气粗的电影制作公司可以狠砸真金白银,但对于独立电影人来说,一分钱都难倒英雄汉。
如今海螺 AI 不用特效模板,只依靠模型综合能力就能轻松实现好莱坞级别的特效,真・人人都能当导演。
X 网友 Stylez Morales 就用了一张图和一句提示词,得到一段变身特效镜头。
一个变形金刚机器人突然变身成一辆超跑,在赛博朋克的街道上疾驰,这画面,真有一种电影级别的超现实视觉效果。
(Prompt:dramatic action scene dynamic camera shot of a transformer robot running down a futuristic dystopian cybersteampunk street avoiding explosions and transforms into a highly advanced supercar to get away atmospheric cinematic hyperreal photorealistic award winning blockbuster movie directed by Michael bay)
再比如拟人特效。毛茸茸的玩具小鹿突然奔跑起来。
(Prompt:小鹿向前跑动。)
玩具小狗突然「复活」,还招朋引伴。
(Prompt:另一只小狗走进画面,两只小狗玩了起来。)
爆炸特效。《浴血黑帮》中的三兄弟大步流星往前走,身后的建筑在一片爆炸中摧毁。
(Prompt:三个男人往前走,后面的建筑爆炸。)
艺术审美在线
海螺 AI 在艺术审美上,也超能打。
它能用专业级调光与构图营造美学氛围,精细控制光影效果与景别变化,画面质感媲美大片。
比如一只拟人化的小羊在森林里跳舞。
画质高清,镜头缓慢推进,毛茸茸的小羊羔蹦跶着,耳朵也有节奏地上下扇动,效果丝毫不输迪士尼动画。
再来看看海螺 AI 制作的时尚大片。
女模特摆着各种时尚 pose,表情自然且富有表现力,头发也会随着动作而飘动,大衣纽扣等细节也处理得很精细。
_(Prompt:Fashion blockbuster, the female model strikes a fashionable pose, with the camera following closely.)
_
我们还上传了一张戴着墨镜、身穿西装、端着酒杯的男模特图片,然后输入 Prompt:男人开心地举起酒杯,然后从画面左侧走出来一位美女。
海螺 AI 完成度相当高,画面也没有模糊、扭曲等问题。
与 Runway 同台竞技
没有对比,就没有发言权,让海螺 AI 和 Runway 打个擂台,谁强谁弱也就一目了然。
我们就先用 OpenAI 创始四人组的照片打头阵。
上传同样的照片,输入同样的提示词:The three people sitting on the sofa stand up and walk out of the frame to the left.
这是海螺 AI 的生成效果:
这是 Runway Gen-3 Alpha Turbo 的效果:
海螺 AI 严格遵循提示词,坐在沙发上的 Ilya、Greg、Murati 站起来,向左走出画面,独留 Altman 站在原地凌乱;而 Runway 生成的画面则崩得离谱,照片中的四个人飞出沙发,完全没有遵循物理世界的运动规律,甚至还出现了脑袋 360 度旋转的诡异画面。
再来一个多人物场景。
Prompt:strong man with cowboy hat in bar drinking beer with several women
海螺 AI 生成的画面,细节更丰富,场景更复杂,人物表情也更自然。
相比之下,Runway 的镜头较为简单,男子喝啤酒时,杯中的啤酒没有减少,左边女生的手部也出现了莫名其妙的动作。
Prompt:flying toward of a wide shot of an extremely large nuclear powered monster emerging from a fierce storm vortex walking over a city, epic shot in a cinematic fashion, pure destruction.
海螺 AI 的电影质感、画面丰富度更高,怪兽展现得也更生动。
Runway 则直接缺失了怪物主题,没有准确理解 prompt 的含义。
这可能是目前国内最好的视频大模型。
而在已经体验过的人群中,他们毫无例外地将海螺 AI 归入第一梯队。
如果说,9 月的海螺 AI 已经令人印象深刻,那么,新增 「图生视频」的海螺 AI 又更上一层楼。它并不完美,但比大家试过的许多 AI 视频模型都要好。
神奇海螺的智慧和魔力是不容被质疑的,既然 Sora 迟迟不来,为什么不问问神奇海螺呢?
大家还等什么?快去体验一波吧。
海螺 AI 官网链接:hailuoai.com/video