人机语音交互系统的全栈设计(车载语音导航)-1

320 阅读1分钟

客户端基于iOS端的实现,服务端基于Java来实现。从设计思路开始着手

项目需求

  • 通过语音交流跟设备进行简单对沟通
  • 利用地图导航技术,对路线进行规划
  • 设计一些基础对本地指令,能够进行简单的人机对话
  • 服务端的nlp方案达到更高智能的人机对话

技术方案

先从iOS客户端的方案开始着手,

  • 首先是音频基本io功能
  • 对采集到的语音数据进行识别本地的处理

项目一步步来,就先从语音采集方案开始搞起。iOS的AVFoundation框架可以说是现成的绝佳方案。

  • 采集工具:iOS端的麦克风即可,暂不考虑其他设备。
  • 技术方案:构建AVAudioSession对话采集音频数据
  • 服务方案:底层的采集封装处理暴露构建方法、创建方法管理类实现对底层采集数据的逻辑功能的实现。该部分只做这两层设计。
  • SAAudioIOUnit负责采集和播放的基本服务
  • SAAudioManager编写功能逻辑,对SAAudioIOUnit做封装

然后直接开始对这两个模块进行开发

要完成对功能是:音频采集封装 。这里我们只实现采集语音数据的功能