最强卷王 3 个月进化 9 次!可灵 AI 上新 1.5 模型,国外网友:太疯狂

225 阅读4分钟

直出 1080p 影视级视频,加量不加价,相当良心。

传说中的 Sora 公测还遥遥无期,「卷王」可灵又又又上新了。

要知道,自今年 6 月发布以来,仅三个月,可灵 AI 就迭代了 9 次。

这次它还直接把基座模型升级了,推出可灵 1.5 模型。

那么,这个新模型到底强在哪儿?

举个例子,我们输入同样的 Prompt:一位女生看到一封信后悲伤起来,不停地哭泣。

1.0 模型的效果是这样的:

1.5 模型的效果则是这样:

视频详情

而在 1.0 模型中,对于提示词的理解就稍微欠缺一些,画面中没有出现人物,只是出现了一双筷子慢慢夹起了碗中的牛肉。

我们还输入了一段如同小作文般的文本描述,既包括诸多场景细节,又有镜头景深的要求。

Prompt:一只花斑狗在浓密的花园中欢快地穿梭,仿佛在追逐着什么,它向前小跑着,眼睛睁得大大的,充满喜悦之情,在行走的过程中,它仔细地扫视着树枝、花朵和树叶,小径十分狭窄,花斑狗不得不在植物之间穿梭而行,画面是从地面角度拍摄的,紧跟花斑狗的步伐,提供了一个低矮而亲密的视角,画面色调温暖,颗粒感明显,给人一种电影般的视觉效果,树叶和植物上方洒落的阳光营造出温暖的对比效果,突出了花斑狗的毛发。画面清晰锐利,景深较浅。

可灵 1.5 模型生成效果如下:

它不仅准确理解了输入的指令,还生成与之匹配的视频内容,画面整体构图和光影表现也让视频颇具艺术感和观赏性。

再来一个镜头语言更复杂的 Prompt:灯塔周围的超快速无人机视角,悬崖,戏剧性,pov 镜头,电影。

1.0 模型:

 

1.5 模型:

「pov 镜头」、「超快速无人机视角」等镜头描述,无疑加大了 AI 理解难度,但两个模型均给出了超预期的画面。

1.5 模型生成的画面更稳,镜头由远及近慢慢推进,矗立在悬崖上的灯塔还射出一道白色的亮光。

而 1.0 模型的镜头转换则更加刺激,先是一顿旋转式俯拍,接着近距离环绕拍摄,完全契合了超快速无人机拍摄的文本描述。

一勾一画,指哪动哪

图生视频时,为了大幅提升创作者对运动效果的控制能力,可灵 AI 还带来了「运动笔刷」功能。

不过,该功能只能在可灵 1.0 模型中使用。

玩法也很简单。

比如,我们上传一张水母的图片,然后将图片中需要控制运动方向的部分勾勒出来,再画一个示意运动方向箭头,就可实现精准运动控制。

当然,我们也可以开启「自动检测区域」的按钮,让 AI 自动识别,还可以为某些元素额外指定静止区域,让视频内容有更好的运动控制及运动表现。

上效果:

值得注意的是,目前该功能可以为图中的 6 个元素指定运动轨迹。

比如让三只水母在海里朝着不同方向游动:

或者把一幅梵高风格的油画,各种涂抹标轨迹。

最终生成的视频竟有了一种 3D 效果:

此外,可灵 AI 还顺道升级了其他功能,比如可一次性生成最多 4 条视频;「图生视频」功能新增支持 10 秒时长、标准模式下支持增加尾帧;「AI 图片」支持画质增强等。

可灵 AI 的这些新功能一经推出,便吸引了全球网友前往「尝鲜」。不少网友体验后表示,这是迄今为止最好的视频生成模型,足以媲美专业电影制作的标准。

自今年 6 月份首次亮相以来,可灵 AI 已经进行了 9 次迭代升级,至今已服务超过 260 万用户,生成 5300 万张图片和 2700 万个视频,深受包括国内知名导演在内的创作者们的青睐。

为了进一步探索 AI 在电影制作中的潜力,快手还特别启动了「可灵 AI」导演共创计划。该计划汇聚了李少红、贾樟柯、叶锦添等 9 位杰出导演,他们将利用可灵 AI 的技术,创作 9 部 AIGC 电影短片,这不仅是技术与艺术的结合,也是对未来电影制作模式的一次大胆尝试。

由此可见,AI 对电影行业的重塑已不再是一个遥远的预言,而是正在发生的现实。AI「新影像」时代正呼啸而来。

参考链接:

可灵官网 klingai.kuaishou.com/

x.com/Charaspower…

© THE END