我最亲爱的妈妈,该做晚饭了

我最亲爱的妈,我晚饭想吃饺子

我最亲爱的妈,饺子里不要香菜

我最亲爱的妈….


试想一下,如果每次对话之前都需要带一个昵称对方才能接收得到,是不是感觉有点荒诞?日常生活当中人和人进行交流的时候,不会每说一句话都叫一次对方的名字,但当我们使用智能音箱时,却经常会被唤醒词绊住。在为大家介绍了搭载了 DuerOS2.0 的 raven H 智能音箱后,有同学反馈说……


01.png


嗯……说时迟那时快,新的更新说来这就来了!


用过语音助手的你一定有过这样的体验,感觉每次跟机器对话的节奏都特别卡顿,因为每抛出一个问题都要喊一遍它的名字,也就是“唤醒词”。有时候“聊”的正开心呢,却发现手机或者音箱根本没有在听你说话。不少用户都对类似的状况印象深刻。



 更“自然”的人机交互方式 


那么有没有更“聪明”的人机交互方式呢,请看百度董事长兼CEO李彦宏为大家打个样:




正如李彦宏在百度世界大会上说的:“日常生活当中人和人进行交流的时候,不会拉着手才能说话,也不会每说一句话都叫一次对方的名字。”不难想见,去掉唤醒词之后的人机交流体验会自然得多。


 免唤醒词语音交互 


如视频所见,一旦进入语音交互环节,手机就不再需要“唤醒词”,也就是说,手机一直“醒着”,听你说话。百度AI免唤醒词语音交互技术,具体来说是“tts播报场景下的全双工语音交互技术”会不间断地聆听用户的语音输入信号,并进行语音识别,在此步骤中利用VAD技术判断当前语音输入是否结束,关键点为聆听和识别并发进行,且聆听不会停止,防止遗漏用户的语音请求。


 听清你,听懂你 


所谓“听话要听音”,收听语音指令就需要具备两个硬本领,一是“听清”、一是“听懂”。日常使用语音助手的时候难免会遇到嘈杂的环境音干扰,比如视频中的食堂就餐就是一个经典场景。本套系统利用回声抵消技术去除智能设备本身输出的声音,利用噪声抑制技术来减少环境噪声影响。做到“听清”用户说话的基本要求。


04.gif


一方面不能太“灵敏”,一有“风吹草动”就被干扰、做出动作;另一方面,又不能太“迟钝”,需要听清主人说的很多句话里到底哪句话才是“指令”。


后端服务对语音识别出来的内容进行语义分析,并根据智能设备当前上下文信息进行意图分析,判断是否为有效的语言交互数据。同时根据上线设备当前状态和上下文信息,利用用户输入的语音信息,利用声纹等技术判断当前语音输入信号是否为有效输入。


05.gif


 李彦宏同款语音交互?

 百度APP抢先体验 


这么聪明的语音交互技术,还不赶紧上线?!想问哪里可以get到李彦宏同款的,其实视频中已经露出了一些线索……


06.gif


没错,无需唤醒词的语音交互已经可以在百度APP(语音版)App体验到啦。


07.jpg


在这里,你可以无间断地发出语音指令,比如“下一条”:


08.jpg


“大一点声”调大语音播报的音量:


09.jpg


“介绍一下XXX”,用更自然的语言交流,获取更多信息:


10.jpg


抛开唤醒词的束缚,更自然地与机器进行对话,让“冷冰冰”的语音助手像真人一样聆听你、理解你,让我们共同创造一个更加智能、更加懂你的未来世界!“当你的眼睛需要看别的地方,当你的手需要做别的事情的时候,你仍然可以自然地和机器、和手机、和各种各样的设备进行自然语言的对话,这是AI带给大家的方便。”

846764a4d69e3d3f2115c0368.jpg