对话AI建模挑战赛:提升噪声环境语音交互鲁棒性

22 阅读2分钟

对话AI建模挑战赛:提升噪声环境语音交互鲁棒性

某中心宣布启动名为《基于语音对话的知识驱动任务型对话建模》的新研究挑战,旨在提升对话AI在包含噪声语音输入的现实场景中的鲁棒性。该挑战已被纳入第十届对话系统技术挑战赛(DSTC10)的赛道,这是推动对话系统发展的领先研究挑战赛的最新一届。

该挑战赛包含两个赛道:对话状态追踪和知识驱动的任务型对话建模。两者的目标都是开发在输入为真实语音信号(而不仅仅是文本)时表现良好的模型。

对话状态追踪是对话研究领域最广泛研究的问题之一,涉及在整个对话过程中估计和跟踪用户目标。某中心在去年的DSTC中引入了知识驱动的任务型对话建模,其目标是利用在线信息补充通过特定应用程序接口获取的信息。例如,基于对话的酒店预订代理可以获取客房价格和可用性等信息,但如果预订客房的顾客询问酒店停车费用,代理可能需要从酒店网站的常见问题解答中检索该信息。

大多数关于这两个问题的研究都使用仅包含书面对话的公共数据集,这导致最终模型与涉及语音输入的实际用例之间存在差距。在新挑战中,参赛者将使用任何公共数据为其中一个或两个任务开发对话系统,其中大部分数据仍由书面对话组成。然而,最终评估将使用语音数据,鼓励参赛团队专注于构建鲁棒的系统。

“该挑战的目标是弥合学术研究与实际应用之间的差距,”某中心Alexa AI组织的高级应用科学家表示,“希望激励开发实践中更鲁棒的对话系统算法,这是以往挑战和数据集未能解决的问题。”

DSTC自2011年起每年举办。去年,某中心的“非结构化知识访问的任务型对话建模”赛道是最成功的赛道,收到来自24个团队的105个参赛系统。今年,某中心的提案再次被选为DSTC的四个主要赛道之一。挑战赛报名将持续开放至9月21日,欢迎来自学术界、工业界以及非营利和政府部门的研究团队参与。某中心已为挑战赛参与者及该领域的其他研究人员开源了开发数据、评估脚本和基线系统。