最强卷王 3 个月进化 9 次！可灵 AI 上新 1.5 模型，国外网友：太疯狂

2024-09-21 276 阅读4分钟

直出 1080p 影视级视频，加量不加价，相当良心。

传说中的 Sora 公测还遥遥无期，「卷王」可灵又又又上新了。

要知道，自今年 6 月发布以来，仅三个月，可灵 AI 就迭代了 9 次。

这次它还直接把基座模型升级了，推出可灵 1.5 模型。

那么，这个新模型到底强在哪儿？

举个例子，我们输入同样的 Prompt：一位女生看到一封信后悲伤起来，不停地哭泣。

1.0 模型的效果是这样的：

1.5 模型的效果则是这样：

而在 1.0 模型中，对于提示词的理解就稍微欠缺一些，画面中没有出现人物，只是出现了一双筷子慢慢夹起了碗中的牛肉。

我们还输入了一段如同小作文般的文本描述，既包括诸多场景细节，又有镜头景深的要求。

Prompt：一只花斑狗在浓密的花园中欢快地穿梭，仿佛在追逐着什么，它向前小跑着，眼睛睁得大大的，充满喜悦之情，在行走的过程中，它仔细地扫视着树枝、花朵和树叶，小径十分狭窄，花斑狗不得不在植物之间穿梭而行，画面是从地面角度拍摄的，紧跟花斑狗的步伐，提供了一个低矮而亲密的视角，画面色调温暖，颗粒感明显，给人一种电影般的视觉效果，树叶和植物上方洒落的阳光营造出温暖的对比效果，突出了花斑狗的毛发。画面清晰锐利，景深较浅。

可灵 1.5 模型生成效果如下：

它不仅准确理解了输入的指令，还生成与之匹配的视频内容，画面整体构图和光影表现也让视频颇具艺术感和观赏性。

再来一个镜头语言更复杂的 Prompt：灯塔周围的超快速无人机视角，悬崖，戏剧性，pov 镜头，电影。

1.0 模型：

1.5 模型：

「pov 镜头」、「超快速无人机视角」等镜头描述，无疑加大了 AI 理解难度，但两个模型均给出了超预期的画面。

1.5 模型生成的画面更稳，镜头由远及近慢慢推进，矗立在悬崖上的灯塔还射出一道白色的亮光。

而 1.0 模型的镜头转换则更加刺激，先是一顿旋转式俯拍，接着近距离环绕拍摄，完全契合了超快速无人机拍摄的文本描述。

一勾一画，指哪动哪

图生视频时，为了大幅提升创作者对运动效果的控制能力，可灵 AI 还带来了「运动笔刷」功能。

不过，该功能只能在可灵 1.0 模型中使用。

玩法也很简单。

比如，我们上传一张水母的图片，然后将图片中需要控制运动方向的部分勾勒出来，再画一个示意运动方向箭头，就可实现精准运动控制。

当然，我们也可以开启「自动检测区域」的按钮，让 AI 自动识别，还可以为某些元素额外指定静止区域，让视频内容有更好的运动控制及运动表现。

上效果：

值得注意的是，目前该功能可以为图中的 6 个元素指定运动轨迹。

比如让三只水母在海里朝着不同方向游动：

或者把一幅梵高风格的油画，各种涂抹标轨迹。

最终生成的视频竟有了一种 3D 效果：

此外，可灵 AI 还顺道升级了其他功能，比如可一次性生成最多 4 条视频；「图生视频」功能新增支持 10 秒时长、标准模式下支持增加尾帧；「AI 图片」支持画质增强等。

可灵 AI 的这些新功能一经推出，便吸引了全球网友前往「尝鲜」。不少网友体验后表示，这是迄今为止最好的视频生成模型，足以媲美专业电影制作的标准。

自今年 6 月份首次亮相以来，可灵 AI 已经进行了 9 次迭代升级，至今已服务超过 260 万用户，生成 5300 万张图片和 2700 万个视频，深受包括国内知名导演在内的创作者们的青睐。

为了进一步探索 AI 在电影制作中的潜力，快手还特别启动了「可灵 AI」导演共创计划。该计划汇聚了李少红、贾樟柯、叶锦添等 9 位杰出导演，他们将利用可灵 AI 的技术，创作 9 部 AIGC 电影短片，这不仅是技术与艺术的结合，也是对未来电影制作模式的一次大胆尝试。

由此可见，AI 对电影行业的重塑已不再是一个遥远的预言，而是正在发生的现实。AI「新影像」时代正呼啸而来。

参考链接：

可灵官网 klingai.kuaishou.com/

x.com/Charaspower…

© THE END