数字人直播走入大家生活当中AI数字人24小时在线直播,让大家又认识了一个新物种。这类“2D超写实数字人”的形象跟普通人接近,不仔细看画面,会误以为就是真人。这与业界最近热议的“数字永生”有何不同?人类离“数字永生”还有多远?
从技术层面讲,‘数字永生’和‘数字分身’都是基于AI‘复刻人’的概念。但从导向上来说,‘数字分身’是功能型的,而‘数字永生’则偏向心理需求方面。”
现阶段,AI数字人主播已经可以做到与真人的外貌、声音相当于复刻一样,但在交互和应变能力上还停留在幼童水平。尽管GPT等人工智能大模型让AI技术又向前迈进了一步,实现“数字永生”状态下的复刻,只是时间问题。
复刻一个人的外貌和声音相对比较容易,其成本也是可控的,但要实现“数字永生”,难的是复刻一个人的行为记忆、知识阅历等内容,目前这方面的复刻成本很高,因此在产品落地上会有较大难度。“即便是用‘知识图谱’这类复杂的算法,目前也没有办法以高度结构化的方式将人脑中的信息呈现出来。”
“完美”复刻真人必须有大量数据支撑才足以实现。“如果将‘数字永生’的受众局限于老年人,那复刻时所得到的数据其实并不充足也不够准确,若将复刻周期拉得足够长,比如从某个体30岁时便开始积累行为习惯、记忆经历等个人数据,那么在长达几十年的积累与训练之后,复刻转化的结果会更符合‘数字永生’的内涵。”他表示,应以“曲线前进”的方式推进整个复刻过程,这样才能使复刻成果更加接近于被复刻者自身。
而在钱小一看来,虽然记忆、人格、表达、思想等维度的复刻仍处于初级阶段,但从声音、外貌开始让消费者体验一把“AI复刻”未尝不可。“我们已将外貌复刻的成本降到了几块钱,把声音复刻的成本降到了500元左右,后续声音复刻的成本还能进一步下降,消费者只要花个几百元就能进行复刻体验。” 青否数字永生的核心技术:zhibo175
(1)形象克隆、声音克隆、 意识克隆:
拍摄真人出镜,正视镜头说话的5-8分钟绿幕视频,即可复刻出口型、动作、神态等1:1的数字人形象,行业高精度中文唇形驱动技术,性能优势与性价比处于全国领先水平。
基于先进的AI人工智能技术,【青否数字人-数字永生】可以精确地复制一个人的外观和声音,甚至个性、情感等特征。
它通过分析被克隆主体的形象、声音数据来重建一个人的AI数字形象和独特声线,以及主体的数据信息用于构建还原现实个性及特征。
不断进化的意识克隆(源码:zhibo175)
可以不断加入数字生命的数据,包括人物自传,人物关系,真实的经历和记忆,以及在对话相处过程中,不断积累的数据,都会转化为数字生命的“意识”。
(2)“Al大脑”模型
接入“讯飞星火认知大模型”,高智商,有灵魂的大脑,拥有跨领域的知识和语言理解能力,完成问答对话和文学创作等任务,还可以上传企业专属的知识库,持续从海量文本数据和大规模语法知识中学习进化,基于知识库问答、多轮对话能力拥有跨领域的知识和语言理解能力,实现从提出问题、规划问题到解决问题的全流程闭环。“数字人”和“AI大脑”构建好后,通过多种技术手段,让数字人理解用户说的话,并把大脑内容传输出去。
(3)音频采集
自研回声消除、声源定位,波束成形、去混响噪声抑制等核心算法用于远场语音交互场景。
(4)显示终端
集合知识、看、听、说等多模态人机交互数字人,展现在大屏、移动设备、台式机或平板电脑等多个终端上,实现不同场景的真人模拟对话。
看一下交互式数字人的效果:zhibo175
在未来,我们也许将以数字形态存在,横亘于生死之间的鸿沟也将逐渐得以跨越。