Facebook 開源 ConvNet AI:重新定義在線翻譯!
Facebook已選定ConvNet作為未來翻譯工作的基礎。毫無疑問,ConvNet將在用戶在Facebook社交網路上進行交流這方面發揮積極的作用。
Facebook的ConvNet AI翻譯方法比目前使用循環神經網路(RNN)的領先的AI方法快9倍、更準確,而且能夠更好地本地化翻譯。
據Facebook AI研究中心(FAIR)聲稱,語言翻譯對於支持Facebook打造更開放、更互聯的世界這一使命而言很重要。對於每個月使用媒體和營銷翻譯的8億Facebook用戶來說,這完全是個好消息。正是由於ConvNet的研發工作,與世界各地的親朋好友共享內容變得容易了許多。
卷積神經網路與循環神經網路
早在2014年Facebook選派紐約大學的雅恩?樂坤(Yann LeCun)教授掌管其新的AI實驗室FAIR時,就在語言識別AI技術方面走上了一條不同的道路。樂坤在卷積神經網路(ConvNet或CNN)領域頗見功底,繼續潛心研究這種網路應用於諸多AI場景的方式,而業內其他許多人士認為他們未能兌現更快速地處理視覺信息這個承諾。
雖然Facebook和樂坤致力於開發ConvNet,但這個技術垂直領域的其他許多人將精力投入於人工循環神經網路(RNN),這種AI使用內部記憶(internal memory)來處理任意序列的輸入。由於這種序列的輸入,在語言翻譯方面,RNN的AI系統每次處理一個句子中的一個單詞。它先翻譯好句子中的第一個單詞,之後再翻譯或預測目標語言的下一個單詞。
該系統最初被認為是語言識別和市場營銷翻譯的更佳選擇,因為其準確性高於未充分發展起來的同類技術:ConvNet。
ConvNet:更適合GPU
ConvNet充分利用了計算機的GPU(計算機系統的一部分,它是速度更快、功能更強的主力計算部件),因為它可以並行處理許多不同的任務。這使得GPU成為了ConvNet AI翻譯的最佳搭檔,可以同時處理句子中的所有單詞。這使得它能夠捕獲數據中的複雜關係,這裡的數據是指自然語音和輸入的消息。
由於RNN依賴以線性方式工作:從左到右,或從右到左,每次翻譯一個單詞,所以它無法充分利用GPU並行化機制。相反,它更依賴你的CPU:計算機中速度較慢,但「更聰明」的部件。
由於採用了更好地管理數據處理的這種方法,Facebook和樂坤研發的ConvNet對於改進語言之間的翻譯、處理全世界所有6909種語言而言極其出色。
ConvNet:翻譯的未來
不難明白為什麼Facebook選擇ConvNet作為未來翻譯工作的基礎。毫無疑問,ConvNet將在用戶在Facebook社交網路上進行交流這方面發揮積極的作用,還有可能影響對翻譯有興趣的其他公司:WhatsApp、Instagram甚至可能Oculus VR。
ConvNet翻譯對Facebook來說的另一個好處是,它能夠實時研究語言。每當你要求翻譯講西班牙語的朋友所發的帖子,你都
在教演算法如何更準確地翻譯,並幫助演算法了解目前的語言使用情況。
由於Facebook傾向於分享其AI研究成果,他們已完成的ConvNet語言翻譯研究成果已經通過其開源代碼網站給其他人享用。這讓不同的用戶得以充分利用Facebook在AI翻譯領域的這些突破性發現。


※9 行代碼招致 8800000000 美元的賠償……
※谷歌雲採用 P4Runtime 打造智能網路
TAG:雲頭條 |