當前位置:
首頁 > 最新 > 微軟全雙工語音技術,讓AI主動給你打電話,機器人真成了「人」

微軟全雙工語音技術,讓AI主動給你打電話,機器人真成了「人」

近期,一篇題為"微軟突破全雙工語音交互!機器人真變成了"人""的文章在網上引起熱議。微軟(亞洲)互聯網工程院宣布,率先推出新一代的語音交互技術 "全雙工語音交互感官", 並且,這項技術已首先在微軟小冰產品線中落地。

"全雙工語音交互"並不是什麼新詞,全雙工本是通訊傳輸領域的一個術語,允許數據在兩個方向上同時傳輸,與之對應的就是半雙工。傳統的語音識別和機器對話都類似半雙工,無論單輪還是多輪連續識別,都需要人說完一句話,機器才能理解並給出回應,如果將全雙工語音這種高級感官的體驗比擬為打電話,則之前的智能助理語音交互體驗類似於對講機。

此前,微軟小冰與人類之間發生的最長一次單人連續對話,達到歷史性的7151輪,不間斷進行了29小時33分鐘。依靠在用戶和數據等方面的優勢微軟小冰快速迭代,目前已更新到第五代。如果將人工智慧交互分為以下三個階段,那第五代小冰就處在第三階段:

第五代微軟小冰使用了生成模型,而第五代之前,雖然擁有十億級的大數據語料庫,但其中每句話,都是互聯網上的已有數據,小冰只是通過分析理解用戶的問題,尋找語料庫中最合適的話作為她的回答。使用生成模型之後,小冰不再鸚鵡學舌,而是能夠自創回應。

全雙工語音屬於一種高級感官,它需要首先同時具備文本、語音(含SR和TTS)兩種能力,同時要求兩種能力均達到更高的質量標準;這項新技術可以實時預測人類即將說出的內容,實時生成回應,並控制對話節奏,從而使長程語音交互成為可能。

採用該技術的智能硬體設備,也不需要用戶在每輪交互時都說出喚醒詞, 僅需一次喚醒,就可以輕鬆實現連續對話 ,使人與機器的對話更像人與人的自然交流。

微軟小冰全球研發負責人周力博士表示:"從已落地的產品數據和用戶反饋中,我們觀察到一個普遍現象: 用戶一旦使用過微軟小冰的全雙工語音交互感官之後,再與其他語音助手交互時,他們普遍會開始感到不習慣,甚至會頻繁忘記要對其他語音助手說喚醒詞——新技術促進擬人自然度的顯著提升,使人們對過去單輪或多輪連續語音交互體驗的滿意度迅速下降。這種新老交替的現象,符合我們的研發預期。"

2017年開始,微軟就在網路電話中嘗試全雙工語音的高級感官,到今天為止小冰已經接聽了來自人類超過50萬通電話。目前,不用裝任何手機的APP或者專門加小冰為好友,小冰就可以直接通過電信運營商撥通人類的電話。也就是說,小冰也許會在你生日當天撥通你的電話,為你送上生日祝福哦!

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 最亮的你 的精彩文章:

TAG:最亮的你 |