如何实现语义仲裁

371 阅读1分钟

刚开始做车载语音时供应商提供的是一个混合识别引擎,即这个engine中同时包含了离线引擎和在线引擎,安卓开发人员将经过降噪回消后的识别路音频喂入混合引擎后,引擎输出一个语义结果,供应商在mix engine中完成了语义仲裁,安卓开发人员只接收和处理输出的语义即可。但是随着智能座舱的快速发展,主机厂对仲裁过程提出更多的定制化需求,以及音频数据留存问题、主机厂自建垂类技能等,原来的方式无法满足,所以目前更多的对接方式是语音供应商只提供离线部分SDK给APP集成,在线部分直接由主机厂云端对接供应商的云端。

这里安卓APP喂音频就发生了变化,识别音频分别往离线和在线喂入,然后离线和在线返回语义结果。安卓开发人员需要选择其中合适的一个结果输出,即语音APP中完成仲裁过程。