做视频不想露脸?用AI不到30分钟打造数字人分身

75 阅读6分钟

大家好,喜欢“瞎折腾”的落叶又来了!


缘起:当“超级社恐”遇上视频创作…

有朋友说前面几期的内容有点偏技术了,全是字看不懂,所以这一期打算来点有意思的,依然围绕着实际问题去解决。以正在做自媒体的我为例,最近就想过这样一个问题:如果某一天的内容更适合做成视频发布,作为超级社恐的我又不想真人出镜,该怎么办?

答案是显而易见的:做个数字人分身!

但是数字分身也分两种:一种是虚拟的真人,也就是用你的真实形象去做“口播”等形式;另一种就是创造一个不同风格的形象去“代替”你出镜。

为了照顾各位观众老爷们的观感,我几乎是没有任何犹豫的选择了后者。


保姆级教程:从0到1“捏”个数字分身

话不多说,上操作步骤!整个流程依然很简单:

1、捏人先画像:关键词锁定你的“梦中情替”

仅仅提出一个模糊的需求,比如“一个正在创业的中年男子”,肯定是远远不够的。AI需要明确的指引才能理解我们期望的“灵魂”特质,否则随机生成的结果很可能与预期相去甚远,导致效果不佳。

因此,在开始操作前,我整理了一些符合自身形象的一些关键词:i人、180cm、70kg、数据分析师、创业者……

2、AI“翻译官”上线:把“人话”变成AI绘画“咒语”

接下来就轮到我们创意和文笔都很优秀的DeepSeek出场了。

地址:chat.deepseek.com/

我将第一步构思的‘人设关键词’提交给DeepSeek,提示词也很简单直接:“请将这些描述性的想法,转换成AI绘画模型能够理解、且细节丰富的中文提示词。

1.png

DeepSeek优化提示词

DeepSeek迅速响应,生成了以下这段提示词:

超现实主义,简单风格,3D卡通,25岁男孩,身高180cm,上半身特写,体型魁梧匀称(体重70kg),具有知性气质。穿着简约商务休闲装(浅蓝色衬衫搭配深灰色针织背心),佩戴半框眼镜。人物站在充满科技感的背景前面向观众,表情自然。整体色调以理性蓝灰为主,搭配温暖橙色点缀。画面需突出以下特征:1. 数据分析师的专业感 2. 创业者的行动力 3. 数学天才的敏锐度 4. INTP性格的内敛智慧 5. 逻辑规划者的条理性,采用明亮色块与柔和线条结合的现代插画风格。

不得不说,DeepSeek生成的提示词在细节上非常周全,涵盖了风格、着装、背景、色调乃至气质要点,比我最初的构思更为细致。

不仅完美覆盖了我的需求,还非常高情商的给我创造了很多属性(比如年轻了十几岁)。

既然要的是“理想”型人设,那我当然是选择照单全收了~

3、“开奖”时刻:让可图把“咒语”变成“画作”

有了优化版的提示词,就可以丢给图像生成工具去出图了。

文生图的大模型几乎每家都有,最近正好可灵发布的新模型大火了一把,所以在这里我们选择了它们旗下的最新生图模型——可图2.0。

地址:app.klingai.com/cn/text-to-…

然而,用过AI生图/视频的朋友们一定知道,AI生成的东西是有很强随机性的,所以我们往往需要多次生成,再从中挑选自己最满意的一张,这个过程一般把它称作:“抽卡”

1-5.png

抽卡过程

最后经过多次生成,我挑选了下面这张图,因为它的整体感觉比较符合预期:眼镜、着装以及人物流露出的思索神态,都比较到位。

2.png

抽卡后的选择

4、后悔药来了?GPT-4o实现“指哪改哪”

图像生成以后,我发现自己对背景不太满意,虽然它符合提示词中“科技感”的要求,但是看到这个人物形象,觉得似乎和背景的“科技风”不是很搭,想把它换成更具现代感的办公室或类似场景。

改变提示词再重新生成固然是一种可行的办法,但好不容易抽出来一个比较满意的形象,实在是不想再重复去抽卡了。

有没有办法不改变人物形象,只更换背景?当然有!

其实很多文生图模型都支持参考图,也就是保持图中的人物形象不变,再去创作一幅新的图像,比如即梦、星流等都有类似的功能。

不过在这里,我还是选择在之前的文章里提到过的 “用嘴改图”神器——GPT-4o(需要魔法,就不贴地址了) ,将这张图片上传给GPT-4o,并向其提出要求:“保持人物形象不变,将背景替换为一个教室黑板风格的背景。”

结果是这样的:

3.png

用GPT-4o更换背景效果图

可以看到,人物主体几乎没有变化,背景成功替换,光线也处理得更加自然舒适。最终效果兼具了沉稳气质与现代感,符合我的预期。

5、画龙点睛:让你的数字分身“活”起来说话!

这一步也很简单,我们的老朋友即梦有专门的数字人生成功能

地址:jimeng.jianying.com/ai-tool/vid…

我们在即梦中选择数字人——对口型,把上面生成的图片上传到“导入角色图片/视频”中,把想要让数字人朗读的文本贴到“文本朗读”中,再选择一个和图片形象相符的音色。点击生成,就大功告成了!

5.png

数字人参数设置

需要注意的是,即梦这里提供了两个模式:大师模式和快速模式,因为我们这里不需要复杂的动作,选快速模式就好(大师模式非常烧积分,有钱人请随意)


写给还在观望的你:这个真不难!

数字人的应用场景有很多,它可以替你出镜、做你的嘴替,还可以让你在录制视频的时候不需要背稿,管理表情,也不需要反复录制和剪辑……也许你已经在很多短视频中刷到过别人的数字人分身了

而这篇文章也是想告诉你,做数字人的门槛真的不高,用到的工具都很常见(需要魔法的GPT-4o完全可以用国产工具平替),而且也都是初阶的用法,新手非常友好。

不妨从现在起,去动手试试看吧!

如果您觉得这篇文章对您有所启发或提供了参考价值,请不吝点赞支持一下,在此提前谢过各位观众老爷们~也欢迎在评论区留言交流!