基于HeyGen,生成AI视频

1,182 阅读2分钟

基于 文心一格 & HeyGen ,生成一个AI人物,并按照给定文案,符合嘴型进行说话。

展示成果:

无法添加视频,这里暂时忽略,根据下文可以自主实现一个AI视频生成。

人物生成:

这里因为Midjourney不在免费试用,而本文 以零消费为目标,选择 使用国内百度的 文心一格 ,在文心一格 中,填写想要生成的人物信息,生成想要的图片,并下载保存。

示例Prompt:"正面,真人,东方美女,写真,美女,微笑,大眼睛,皮肤白皙,黑色长发,瓜子脸。"

image

原图:

image

文案生成:

本示例使用固定的文案:“AI Putor , 基于AI 服务 能力,提供一对一交流服务,帮助K12学生提供更加智能的1对1语言学习答疑支持。”

也可以使用 OpenAi 能力,生成对应的 文案。

视频生成:

本示例使用 HeyGen 进行视频生成。目前新用户有1min的免费体验时长

上传或者生成一张图片:

这里我选择上传了一张图片的方式进行:

需要再 HeyGen Home 页中,选择上传按钮上传 由 文心一格 生成的图片,要求:有完整的正面面部照片

image

创建说话的视频:

需要再 HeyGen Create 页中,选择上面上传的图像,并增加对应的文案,然后选择说话的语言以及说话的风格,目前 HeyGen 内置了多种中文普通话、粤语语言。

image

最后点击 Submit,等待视频生成即可。

HeyGen vs D-ID

优点缺点
HeyGen生成人物说话自然,脸部变化接近真实;平台素材资源丰富;可以方便的预览生成速度慢
D-ID生成速度快生成人物说话不自然,脸部可能存在变形,拉伸的情况;平台素材资源匮乏;暂时没有预览功能

基于当前使用比较,模型随时变化,可能未来各自功能有更大的改变。

视频效果对比:

可以看到 D-ID 生成的视频,人脸在说话时扭曲的很严重,体验会差一些。

其他同类能力:

下面几个功能类似,但是人物生成的面部表情 跟 HeyGen 比会差了很多。

hourone.ai

特点:

  • 可以根据 给定的固定文本,进行自动分帧分场景处理,并根据文本自动 补充背景图片,生成相应视频。

因为免费版,不支持视频下载,但是可以分享生成链接,对应的 链接如下:

app.hourone.ai/editor/646c…

免费方案:

  • 不限次数使用,但是生成视频不可下载,

  • 只支持英语,中文的文本,会自动转为英文。

  • 每个视频支持最大6个Scene。

其他: