多模态AI实时人机交互智能体

0 阅读1分钟

高通智匠推出了多模态的AI实时人机交互智能体chat_bot_v3,可用于少儿陪伴,老年陪伴及企业客服等场景。此方案不但实现了AI实时语音交互,其特点为大语言模型和语音模型可以自定义选择,以及角色多维度自定义(包括人设,形象,动画,声音,台词,知识库等),并且支持跨平台使用。

1.  AI角色交互

不同的AI角色和用户设定对话。支持AI智能硬件上使用。

image.png

image.png

image.png

image.png

2.  角色广场

PC客户端或者小程序上使用角色广场

image.png

AI角色详情

image.png

AI形象生成,可以自己上传图片,支持AI文生图,图生图,图生视频

image.png

支持声音克隆

image.png

3.  智能体功能设置

支持情绪识别功能,回复字数设置,大语言模型选择,语种设置

image.png

4.  智能体接口使用

chat_bot_v3智能体接口链接:

ChatBot 智能体V3(socket) - MindCraft AI

智能体工作流程图:

image.png

image.png

image.png

5.  跨平台使用示例

AI智能硬件上使用,GT-HMI Framework,代码即将开源

AI角色选择

image.png

AI对话

image.png

智能硬件端可更改用户人设

image.png

6.  开源前端代码

提供开源的web前端DEMO及代码,方便用户上手熟悉智能体接口。支持github仓库和gitee仓库。

image.png

image.png