从7万年前开始,人类就开始以前所未有的方式进行思考和表达,进而发展出一套人类特有的语音系统。或许也正是因为人类掌握了语言的能力,才能在物种间的竞争中脱颖而出。
使用语言,真的是人类最自然最快捷的交流方式。当下我们进入了“人工智能”时代,万物互联、万物智能、人机交互变得越来越频繁。所以,教会机器从“听到”到“听懂”就变得格外重要,而这项技术便是“语音识别”技术。
对于人类而言,语音识别像是一种本能,我们甚至不需要教,就会通过自主地倾听周围的声音,从而习得辨别不同人的声音,不同生物的动静。然而,对于机器而言,就并非易事了。
首先机器要将语言输入之后进行计算,然后识别再到理解,接着转化成文本或者命令,可以说,这是一个艰巨复杂的过程。为了让机器能够更好地配合人类,让机器学会听懂人类的语言似乎是唯一选择。
只有给机器打造出这样一套听觉系统,让机器和人类一样,自然的将语言转化成执行的命令,人工智能才能起到真正的作用。
2012年在天津举行的“21世纪计算大会”上就首次通过机器完成了同声传译,让机器听懂人类的语言可以发展出更多的可能性,比如翻译,不管是口译还是笔译,这些工作毫无疑问都会被机器所替代。
可以说,“语音识别”是人工智能发展旅程中必须克服的障碍,也是必须攻下的难关。