继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

好气!又是被人工智(zhang)能,搞崩溃的一天!

慕婉清1281782
关注TA
已关注
手记 10
粉丝 2
获赞 6

用语音导航开车的人,一定遇到过机器听不懂人话的情况。


分分钟血压飙升,路怒症都被激发出来。

http://img1.mukewang.com/623c2f390001d99b07940397.jpg

人工智能不愧被调侃为人工智障。不过咧,这都是站在人类视角上来评判的。

机器跟人类交流需要通过一套系统:自动语音识别系统(ASR),机器通过ASR来识别并理解人类语言,然后做出语音反馈。

http://img1.mukewang.com/623c2f4e0001d43d05540189.jpg

无非就是听和说嘛,听起来很简单对不对?但是这个能力对一个健康人类来讲就是标配!然而,机器表示:

http://img1.mukewang.com/623c2f940001256e02700254.jpg


机器跟人类交流的难点,主要集中在[听]上


难点1:转换声波

声音是靠声波来传递,当你对机器说话的时候,机器接受到的首先是声波,机器需要把声波转化成数字来识别内容。


难点2:区分噪音

站在机器的角度,它除了接收到你的声音,还有关门的声音、骑车按喇叭的声音、周围人交谈的声音等等。它需要从混乱嘈杂的噪音中,识别你的声音和内容。


难点3:音色辨识

人说话的音色是多种多样的,男人、女人、老人、小孩的发音不同,难度更大的还有方言口音。这都是机器面临的挑战。


难点4:适应语速

机器还需要适应语速。语速过慢的情况下,机器需要识别完整的句子结构,判断人是否讲完。

例子:

A:这瓶酒多少钱

B:8万

A:开….

(B把酒开了)

A:...开….开什么玩笑!


难点5:无意义词汇

我们人在说话的时候,会用很多过渡性的语气助词,例如“嗯”“啊”“昂”等。


难点6:同音异意

语言中有很多同音词,机器需要联系上下文,判定说话者的意图。请细品以下例子。

例子:你方便吗?你在方便吗?你吃方便面吗?


看吧,还是不简单,如果能够让机器学会跟人类正常交流,那也是一件超酷的事儿。AIOC有AI方面的学习课程哦~


打开App,阅读手记
0人推荐
发表评论
随时随地看视频慕课网APP