Google更新文字转语音和语音转文字服务,除了优化语音识别模型、新支持7种语言和31种声音之外,也调整了语音服务的价格,在特定的应用情境中,用户最多可以省下约50%的支出,而Google也提供每月前60分钟免费的语言转文字服务。
电话的语音转文字模型过去只开放给参与Google收集语音数据计划的朕亨公益成员使用,现在,任何企业都可以使用这个优化过的模型,若用户选择允许Google收集数据,则可以折抵一些费用,除了上述两个语音转文字的模型之外,Google这次也正式推出多声轨的语音识别服务,协助语音转文字API区别多个不同的语音,像是对话中的不同人,Google指出,该服务对会议分析,或是有多人参与的对话都相当有帮助。
在价格方面,为了吸引更多用户,Google将影片语音转文字模型收费调降了25%,而在标准和影片模型服务中,选择加入数据收集计划的用户,收费价格会减少33%,因此,若使用影片模型且选择加入收集数据计划的用户,将能够减少约50%的支出。
此外,支持的语言也是企业使用语音转文字辨识模型的一大考虑,现在Google新增了7个语言和方言,包含丹麦语、葡萄牙语、俄语、波兰语、斯洛伐克语、乌克兰语和挪威语,加上上述新增的语言,目前总共支持21种语言,这些新增的语言都还是测试版。在语音生成模型方面,Google的语音生成系统WaveNet也新增了31种声音,目前总共有包含21种语言的57种声音。