手记

好气!又是被人工智(zhang)能,搞崩溃的一天!

用语音导航开车的人,一定遇到过机器听不懂人话的情况。


分分钟血压飙升,路怒症都被激发出来。

人工智能不愧被调侃为人工智障。不过咧,这都是站在人类视角上来评判的。

机器跟人类交流需要通过一套系统:自动语音识别系统(ASR),机器通过ASR来识别并理解人类语言,然后做出语音反馈。

无非就是听和说嘛,听起来很简单对不对?但是这个能力对一个健康人类来讲就是标配!然而,机器表示:


机器跟人类交流的难点,主要集中在[听]上


难点1:转换声波

声音是靠声波来传递,当你对机器说话的时候,机器接受到的首先是声波,机器需要把声波转化成数字来识别内容。


难点2:区分噪音

站在机器的角度,它除了接收到你的声音,还有关门的声音、骑车按喇叭的声音、周围人交谈的声音等等。它需要从混乱嘈杂的噪音中,识别你的声音和内容。


难点3:音色辨识

人说话的音色是多种多样的,男人、女人、老人、小孩的发音不同,难度更大的还有方言口音。这都是机器面临的挑战。


难点4:适应语速

机器还需要适应语速。语速过慢的情况下,机器需要识别完整的句子结构,判断人是否讲完。

例子:

A:这瓶酒多少钱

B:8万

A:开….

(B把酒开了)

A:...开….开什么玩笑!


难点5:无意义词汇

我们人在说话的时候,会用很多过渡性的语气助词,例如“嗯”“啊”“昂”等。


难点6:同音异意

语言中有很多同音词,机器需要联系上下文,判定说话者的意图。请细品以下例子。

例子:你方便吗?你在方便吗?你吃方便面吗?


看吧,还是不简单,如果能够让机器学会跟人类正常交流,那也是一件超酷的事儿。AIOC有AI方面的学习课程哦~


0人推荐
随时随地看视频
慕课网APP