什么是人工智能?我觉得能从某种程度上把人变成——”人工智障“,就成功一半了。
技术的进步带来的确实是一种便利,但便捷的同时不可避免地会将人推向“懒惰”,生活中目前飞速发展的语音技术就是其中之一。比起手动的缓慢操作,谁不想轻轻动动嘴皮子就解决?
好,天空一声巨响!计算机科学领域与人工智能领域中的自然语言处理闪亮登场。亚马逊的Alexa、苹果的Siri和微软的Cortana等语音助手与电脑、手机和智能音箱聊天越来越融入人们的日常生活,我们越来越习惯它们的存在甚至是依赖。 其中,Siri是最知名的,她使用语音查询和一种面向用户自然语言的界面回答问题。最重要的是,她能做到”日久见你心“,会随着持续使用适应用户个人的语言用法、搜索和偏好。不得不说,这个世界上像她这么了解你的人已经不多了。
一、迷人之花盛开——语音技术的优势
语音技术既是时代产物也是大势所趋。老生常谈,回到语音应用场景无可比拟的优点。
第一,是开篇所提到的,“耍嘴皮子”般的便捷——解放双手。比起繁琐的手动输入随时会因为手头的不便而恼人,语音优秀之处便不再只是时间上的优势了。设想这样一个场景:你做饭的时候,只想知道食谱的下一步是什么,结果你的手上沾满了油(此时内心一定极其抓马);你自然不会去触碰你的iPad或者手机,骂骂咧咧两句后,显然Siri和小度就派上了用场。
第二,效率狠抓。解放双手、一心多用,多管齐下。保险公司State Farm的数据显示,在美国有29%的司机承认他们边开车边上网。而语音技术的应用则可以在很大程度上帮助减轻这种潜在安全隐患(当然,核心还是要遵守交通规则),当你在开车的时候借助语音技术说话则更有意义。去年,语音识别公司Nuance帮助曼彻斯特附件达金菲尔德的一家医生诊所里的6名医生建立了语音系统。这就意味着,他们可以摆脱以前在键盘上打字的方式,转而通过语音填写病人的信息,并由智慧助手辅助。成本更低、延误概率更低、医生也能将时间花在刀刃上,更费心地为病人诊断病情。各行各业均是如此,亦可借助语音技术的东风,节约更多宝贵时间以投入有效的生产。
**第三,服务特殊社会群体。**在这个世界上有很多人不是靠眼睛认识世界,而是耳朵。 如果你不会阅读,书写形式的在线内容有什么用?年迈的老人老眼昏花早已看不清眼前的一团模糊,所谓老年模式不过是杯水车薪仍是艰难;盲人和弱视群体又何尝不是受困于文本的桎梏,几十年来,文本语音转换器在他们的生活中至关重要。
**看不懂、看不清、看不到........**同这个滚滚向前的世界接轨,或许有人比想象中更困难。语音技术的发展,带来的不仅是资本家的利益,也是特殊群体更美好的生活。
第四,打造人性化温暖科技。语音互动感觉会比老式的上网方式亲密得多,冷冰冰的文字不及有人气的语音,因为它既可能导致情绪上的误解,也缺乏时效性。而且,语音助手的非正式语气有利于建立情感依恋。在你无聊枯燥的生活中,语音助手或许也能提供一定的情绪价值,无论是找点乐子还是找个帮手。事实证明,科技达到一定高度,也可以拥有温度。
**第五,造福广大打工者。有需求的地方就有市场。有市场自然需要打工仔!**语音技术应用场景极其广泛,可以说是已经渗透进了生活的方方面面。从医疗卫生、智能家居、无人驾驶、到教育领域等等,都不乏语音技术的身影,且仍在试图突破自己的极限。至于提供给自然语言处理技术人才的岗位,自然是水涨船高。
二、荆棘之路难走——建构发展的困难
拥有如此强势的优势,大家不少人都下注:语音很快就会**取代打字和点击成为在线互动的主要方式。**不可否认,这确实会出现在未来,但未来有多远就不得而知了......目前看,向“语音网络”转变还面临着棘手的挑战。
第一、技术难度不容小觑。**建立语音网络——由网络到语音和由语音到网络——并非易事。**计算机助手能够回答简单问题,但任何类似于广泛的人类对话的事情都要花费几十年的时间。把个人的声音转换成文本——自动语音识别——也是最难解决的问题之一,毕竟地球上有多少人就有多少发音方法。人类生活中的一小步,却是技术领域的一大步,毕竟强人工智能还仅仅存在于理想中。
第二、隐私问题。人总是不知足且难以满足:既担心人工智能不够智能,又担心它太过智能。例如,手机一直在我们身边,一直在收集关于我们的数据,在它面前我们可谓毫无隐私可言,某种程度上,手机本身就是我们的隐私。数字化助手制造了来自黑客的隐私威胁,当然,夸张点设想,我们可能需要幻想强人工智能到来的时代,语音助手思想的觉醒(不过这倒是后话)。
三、企业实例——国内领军企业的开拓与进军
科大讯飞作为国内语音技术的领头羊,拥有该领域的先进技术。近期,针对电视发展中爆发出的痛点,科大讯飞给出的AI解法是,一方面简化遥控器操作按键;另一方面,提高语音交互操控技术,简化语音命令步骤。目前科大语音遥控器支持粤语、四川话等24种方言,还支持普通话&方言混合识别能力。为老年群体提供了极大的便捷性,同时为语音技术行业的发展提供了更多启发。
总结:
快餐式社会太过浮躁,文字振聋发聩的力量或许太过微弱,语音与时俱进的时效可能更得人心。(恰如屏幕前的你能静下心来认真看完这篇文章已实属不易,如果用个听书APP可能你的耐心会多一点)
这个时代风起云涌,我们期待创新者勇立潮头。语音技术的发展是势不可挡的,语音网络的建立需要技术、需要时间、需要创新者的前仆后继。但要走的路还很长,而路上既是玫瑰遍野亦是荆棘丛生,让我们一起拭目以待吧~
参考资料
2023年6月四级英语”Spoken web“
mbd.baidu.com/ma/s/x38c