人工智能时代,AI交互数字人技术不断在冲击公共服务领域。越来越多公共服务领域开始在自身业务中运用AI智能交互数字人,通过布局AI交互数字人应用于代言人、推荐官、客服、主播等诸多领域。 近年来,数字人技术正在成为引领数字化时代营销的重要趋势,而随着AIGC应用的兴起,AI交互数字人技术在公共服务领域应用正呈现无限可能。 AI交互数字人,是指以数字人为载体,搭建数字人语料库,利用大模型强化学习机制,实现与用户语音实时沟通功能,可以承担公共服务职能,提供咨询问答、接待引导、服务指引等职能服务。AI交互数字人可以应用于不同行业、不同领域,能够以一体机、小程序、4k大屏等形式为用户提供智能交互体验。 一、青否交互式数字人的核心技术:(交互:zhibo175) (1)形象克隆 第一步:在进行数字人克隆时,商家仅需将真人录制的2-6分钟绿幕视频素材,主播可手持商品展示上传至克隆端后台,系统便会启动自动克隆。只需1秒钟,就能克隆出一个与本人在形象、表情及动作上1:1的数字人。
第二步:无限量声音克隆:在声音克隆上,仅需10分钟,系统便能克隆出与本人音色、发音风格一致的声音,实现声音的高度还原。
克隆端操作简洁至极,仅需两步:上传视频并开始训练。傻瓜式操作,小白也能轻松搞定!
(2)“Al大脑”模型
接入“讯飞星火认知大模型”,高智商,有灵魂的大脑,拥有跨领域的知识和语言理解能力,完成问答对话和文学创作等任务,还可以上传企业专属的知识库,持续从海量文本数据和大规模语法知识中学习进化,基于知识库问答、多轮对话能力拥有跨领域的知识和语言理解能力,实现从提出问题、规划问题到解决问题的全流程闭环。“数字人”和“AI大脑”构建好后,通过多种技术手段,让数字人理解用户说的话,并把大脑内容传输出去。
(3)音频采集
自研回声消除、声源定位,波束成形、去混响噪声抑制等核心算法用于远场语音交互场景。
(4)显示终端
集合知识、看、听、说等多模态人机交互数字人,展现在大屏、移动设备、台式机或平板电脑等多个终端上,实现不同场景的真人模拟对话。
看一下交互式数字人的效果:
二、多模态交互数字人的应用:(交互:zhibo175)
定制个性化智能大脑,让实时交互更具专属性。
在展厅,实时与观众交互为参展观众提供参观导览、知识讲解、引导等服务
在银行,化身银行虚拟接待,向顾客讲解最新产品,业务办理引导,解答业务问题。
在政务大厅、在商场、在展会等地方,我们将全程个性化为您提供解决方案
多种终端展示 内容灵活多变 可服务于企业展厅、党建馆、科技馆、博物馆、政务大厅;银行大厅、展会、文旅景点、主题公园、规划馆、机场、地铁站、教育培训、商场等场所。
青否数字人拥有AI交互数字人落地应用的全套方案,能够根据各行业特性和需求,定制化训练人设与知识库,根据应用环境定制UI界面,针对交互逻辑打造专属对应画面,以及程序接入自然语言处理能力,包括语音识别、语音生成和语音对话。并且对数字人接入讯飞星火大语言模型,让其拥有多轮对话、临时创作、百科问答以及人文地理通识等多领域的知识储存,可以与用户进行流畅的语音对话。最后将搭建好的AI交互数字人软件程序部署于线下硬件一体机、4k大屏或线上小程序端,实现私有化本地化部署。
在数字化时代,数字人可以替代部分真人工作,如流程指引、业务查询、注意事项等服务,可以降低公共服务场景前台人员投入成本,实现降本增效(交互:zhibo175)。