當前位置:
首頁 > 最新 > Hey Oculus!機器學習團隊主管解密Facebook語音識別戰略

Hey Oculus!機器學習團隊主管解密Facebook語音識別戰略

Facebook機器學習團隊主管Joaquin Quinonero Candela在Facebook的F8開發者大會上發表演講

Facebook應用機器學習小組正在改變惡意評論、視頻和音頻技術

去年,Facebook開發了一個響應「Hey Oculus」的語音識別系統

蘋果有Siri,亞馬遜有Alexa。微軟公司創建了Cortana以及Alphabet推出了Google Assistant。技術巨頭正在通過大量市場設備和應用程序為消費者帶來語音識別服務。

唯獨一家公司缺席:Facebook

雖然馬克·扎克伯格(Mark Zuckerberg)在全球範圍內致力於推動語音識別應用程序,(上周,Facebook超過了20億活躍用戶,WhatsApp突破12億人)但Facebook在語音控制方面仍然落後於對手。

公司面臨的困境太多了。研究公司去年預測,到2022年,語音識別市場將達到100億美元。除了這筆錢,互聯網公司需要消費者使用他們的語音工具,以便他們積累更多的數據,以提高準確性。

設備製造商在推出語音技術方面具有很大的優勢,因為它們可以直達消費者。不像蘋果,亞馬遜和Alphabet,Facebook沒有一個硬體或移動操作系統,供數百萬人家庭用戶使用。

Facebook在硬體方面最接近的是Oculus,VR製造商被Zuckerberg在2014年以20億美元收購。隨著Facebook試圖在語音識別方面大展拳腳,Oculus是其試水的方式之一。

用戶在CES 2016拉斯維加斯展上體驗Oculus VR

當你佩戴頭盔時,可以說「Hey Oculus」並得到回應。例如,你可以要求查看視圖,或打開特定的遊戲或搜索應用商店。該技術適用於Oculus Rift和Samsung Gear VR,由Oculus提供支持。

Facebook的應用機器學習小組負責人Joaquin Quinonero Candela在上周在該公司的矽谷總部接受採訪時表示:「要探索任何有趣的免提界面,你一定需要說話。

Facebook在業務中使用語音識別技術,遠遠超出了Oculus的範疇。公司還部署了自動生成某些視頻字幕的系統,更多的語音產品正在研發中。

Facebook 在2013年聘請了紐約大學教授Yann LeCun,意圖加碼人工智慧。LeCun是長期以來在機器學習領域的三駕馬車之一。

推和拉

幾個月後,Facebook的工程師們在LeCun研究團隊的帶領下開始開發產品,並準備廣泛的普及。2015年9月Facebook成立了應用機器學習小組,在三年前到任Facebook的微軟研究部的資深人士Candela主導了團隊的構成。

Facebook在語音識別方面一直保持領先地位,問題是谷歌、蘋果和微軟近年來也提高了系統的準確性。

Candela表示,他的團隊大約在二年半前開始從事語音增強工作,2013年Facebook收購Jibbigo(Jibbigo是一家iOS和Android設備語音翻譯應用的領先開發商,曾在2009年推出全球首款語音翻譯應用),其創始人同時進入公司參與語音識別工作。

Facebook的研究與開發分為兩類:推拉。推動很像投資,如果某些創新功能在未來會大面積普及,那麼我們會著手去締造,而拉動是工程師要求內部構建新功能時。

Speech(惡意言論)正屬於推動類項目。

研究人員提出的一個研究成果是自動生成視頻的字幕,這個技術Google曾於2009年開始為YouTube視頻提供此項服務。

尋找問題

Facebook最初專註於廣告。理由是,當時人們通常會用聲音來播報最新消息,所以廣告客戶通過公司動態傳遞信息,在視頻廣告中運行文本。

Facebook的基礎設施部門的工程經理Reena Philip表示:「我們在語音識別領域試圖尋找一個問題空間,通過這個空間我們可以為用戶帶來價值。」 她與廣告團隊聯手,緊密合作建立了一個產品原型。

該功能於2016年第二季度推出。隨著Facebook技術的進一步深入,可以為美語、英語視頻自動生成字幕。

Candela說:「我們做了實驗 - 如果我們把字幕數據標註在視頻上,我們可以增加兩位數的參與度。

與視頻字幕系統不同,Oculus語音識別功能是觸發Candela小組工作的一個案例。

在Gear VR上,應用和遊戲很難找到,因為太多的應用位於其中。大聲地說出一個應用名稱,成為尋找特定應用的一個可行的替代方案。

使用Facebook的Oculus Rift虛擬現實頭盔時看到的Oculus Voice用戶界面

Facebook的產品經理Merlyn Deng表示,Oculus Rift與遊戲,可能是我們可以做的。

Philip在2015年加入Facebook之前,在亞馬遜Alexa工作,他說非英文單詞的標註是「很典型」的。

Facebook必須確保三星智能手機Gear VR(三星推出的一款vr頭盔)會響應「Hey Oculus」。與Oculus Rift頭盔不同的是,Gear VR只是由手機提供支持,後台沒有強大的計算機系統。

Philip說:「目前只能處理到這種程度,但是會越來越好。」 蘋果和谷歌已經找到了將語音激活壓縮到手機中的方法,現在Facebook已經跟上了腳步。

在第四季度在Oculus發布了語音識別時,僅在美式英語中可運行,但是該團隊增加了對更多英語方言的支持。

「我們希望對人們的興趣和內容建立深刻的語義理解。」

-Merlyn Deng,Facebook的產品經理

隨著時間的推移,Facebook可以使Oculus語音識別技術離線運行。公司還可能最終支持英語以外的語言。

Merlyn說,「我們要對人們的興趣和內容建立深刻的語義理解。」

如果分析Facebook的優勢,你應該可以猜測其下一步可能怎麼做。Facebook會分析你的興趣,你朋友的興趣以及這些關係鏈數據。Facebook擁有用戶的圖片,視頻和文本內容,以及多年來人們在社交網路上分享的文章和其他內容。

Merlyn說:「其他語音助手可能會羨慕他們所掌握的數據,我們試圖做的事情必須與我們的使命和數據一起緊密相連」。

如今,Facebook是全球最大的社交網路。你有想像過Facebook上,各種用戶使用千萬種語音來互動嗎,這個願景值得去追求。

來源:CNBC

作者:雷特


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器學習 的精彩文章:

吳恩達新成果:機器學習模型能比醫生更精確診斷心律失常
一節1000+人報名的機器學習課,究竟長什麼樣?
劉鐵岩團隊ICML論文提出機器學習的新範式:對偶監督學習
2017 知乎·看山杯機器學習挑戰賽開始了!
人工智慧的落地點—監督式機器學習

TAG:機器學習 |

您可能感興趣

Facebook 前VR硬體主管Caitlin Kalinowski加入Axon董事會
Facebook任命Mosseri接任Instagram主管
Facebook任命前Google AR/VR業務主管領導Portal團隊
Facebook公關主管Caryn Marooney離職
微軟Outlook for iOS & Android主管負責Cortana部門
Mosseri接任Instagram主管 網易雲音樂與Loen Entertainment達成版權合作
微軟Windows和設備主管Myerson離職
Street Style: Versace 鞋履設計主管 Salehe Bembury 及小木 "POGGY" 基史
谷歌人工智慧與搜索主管John Giannandrea將卸任,Google Brain項目主管接任
Sixense挖角Vive Studios主管,助力B端VR
谷歌前AI主管John Giannandrea正式離職 轉戰蘋果
Intel重回獨顯認真了!招Radeon品牌主管Chris Hook操盤
Google前AI主管John Giannandrea進入蘋果 改進Siri演算法
Xbox營銷主管Albert Penello宣布離職
Instagram任命Mosseri擔任Instagram主管
音樂記者 Alex Gale 加入 Apple Music,主管編輯工作
蘋果零售主管Angela Ahrendts離職
微軟裁撤 Windows 與設備部門、原主管 Terry Myerson 離職,未來 Windows 會何去何從?
蘋果零售主管Angela Ahrendts接受採訪談「體驗式
Chrome即將登陸聯想Mirage Solo VR一體機;Oculus開發主管:開發者應考慮內容的全平台適用性