掌握这几点?就能创造一个属于自己的虚拟数字人!

76 阅读4分钟

数字人是什么?是利用人工智能技术实现与真人直播形象的1:1克隆,即克隆出一个数字化的你自己,包括你的形象、表情、动作和声音都会被克隆下来,让你能够拥有接近真人的表现力。 掌握以下几点就能克隆自己的数字人形象: 一、首先需要独立部署青否数字人克隆源码独立部署到您自己的服务器! 部署AI数字人系统源码需要以下几个步骤: 1.需要准备本地服务器或采购云服务器。 2. 准备域名,进行网站备案。 3.联系青否数字人(数字人源码:zhibo175)做私有化部署。 4.源码部署到服务器。 5.开始运营自己的数字人平台。 完成之后可以无限量克隆数字人 二、青否数字人源码克隆(源码:zhibo175) 视频采集规范: 训练素材录制要求: 1、视频时长:训练素材要求5-10分钟;录制过程中前10s不动,后10s不动。 2、拍摄要求 推荐直接用剪映录制,如果用相机更好;分辨率要求4K,fps不能低于25帧;拍摄主要影响因素是噪音,其次是灯光。 3、噪音 录制时要求环境安静不能有噪音,爆音,回音,最好选择安静的环境拍摄,有降噪麦克风。 4、灯光 灯光要求保证人物脸部,嘴巴,牙齿等五官细节清晰可见,光线均匀,无阴影。 5、视频画面 人物头像不能超过屏幕1/3,人脸尺寸大于300*300px;录制时推荐绿幕背景,后期可以更换各种背景;绿幕平整无褶皱,人距离绿幕2米远。 6、口播内容 内容不限,推荐选模特熟悉的内容,准备6000字文稿;讲的过程说错也没关系,继续讲就可以;千万不要一直说重复的内容。 7、服饰妆造注意事项 避免反光材质衣物;避免半透丝纱材质衣物;避免蕾丝材质的衣物;避免与绿幕相近的衣物以及绿色元素; 首饰:避免佩戴宽松易滑动晃动的首饰,比如项链、容易晃动的耳环(耳钉是可以的)、带链子的眼镜; 妆发:妆容自然得体,头发整理好避免出现散发碎发以及发缝; 8、人物动作 动作自然,与应用场景匹配;动作尽量通用,避免指向性动作;手不挡脸,抬手不过肩;表情动作自然,避免大角度侧脸;避免身体晃动,避免大幅度和迅速的动作;口播时,嘴巴注意张开,口齿清晰,发音标准,说话速度不能太快;避免舔嘴,吞咽,撅嘴,皱眉,摸头,摸脸等小动作。 9、其他注意事项 人物面部不能有遮挡,灯光要求脸部轮廓,牙齿嘴唇清晰可见;人物不能过分瘦脸,美白,可能造成轮廓不清晰。

image.png 声音克隆 - 音频采集规范: 1、音频时长 有效音频时长20分钟,如果带口音,音频建议不少于30分钟; 2、录音准备 根据不同使用需求,准备5000字左右的文本内容,内容和应用场景(朗读、直播、日常讲话等)语境相符; 3、录音环境 录音环境安静,环境底噪小于40dB,可使用“分贝仪”APP测试录音环境底噪; 录制时保持无回音、无混响、无噪声等; 4、录音设备及录音参数 录音设备推荐降噪麦克风/小蜜蜂,条件允许建议使用防风棉衣或防喷罩; 推荐使用48kHz采样率录制音频; 推荐无损音质格式保存音频,如: wav、 fiv、m4a,不能使用压缩格式保存音频,如:mp3; 5、录音人 录音人不宜离麦太近,防止喷麦和录入呼吸声连贯说完一句话; 发音清晰、吐字清楚,句与句之间断句清楚; 句与句之间停顿1~2秒; 保持语境风格一致,避免多种情绪混杂。 三、高清视频录制按照要求完成以下步骤: 第1步:首先拍摄一段5-8分钟真人出镜,正视镜头说话的绿幕视频,用于数字人模型构建,把人物口型、动作、神态等1:1高度还原。青否数字人拥有行业高精度中文唇形驱动技术,性能优势与性价比处于全国领先水平,视频上传到青否数字人saas系统的克隆端 第2步:根据青否数字人SaaS系统(源码:zhibo175)提供的超详细课程,针对真人形象自动进行克隆训练。克隆出的数字人与本人一致!

以上三步是很关键的注意事项,一定要根据要求进行,这样就会得到一个满意的数字人模型,进行制作短视频和直播!