當前位置:
首頁 > 最新 > 微軟來了!進軍中國搶佔人工智慧翻譯市場蛋糕

微軟來了!進軍中國搶佔人工智慧翻譯市場蛋糕

——雙猴科技攜手微軟推出第三代全語通翻譯機

得益於近兩年深度神經網路的發展,誕生於1954年的機器翻譯進階到人工智慧階段並取得了很多實質性的進展。人工智慧翻譯相比以往的統計機器翻譯,翻譯結果更加的自然流暢、準確練達。而在全球的人工智慧翻譯行業之中,微軟、谷歌、亞馬遜可以算得上是三足鼎立。

在過去的2017年,全球人工智慧機器翻譯市場風起雲湧,越來越多的人工智慧翻譯服務面向大眾,具體落地為手機翻譯APP、翻譯機等。現在,微軟也把目光瞄準了人工智慧翻譯機,它將和國內人工智慧語言服務行業領先者雙猴科技達成戰略合作,為雙猴科技的魔腦翻譯機提供核心的語音識別技術。

微軟AI翻譯媲美人類水平

多年以來,微軟在機器翻譯方面的實力一直表現不俗。在1993年,微軟成立語音小組(Speech Group),希望能夠讓人與設備之間的語音交流成為主流。一開始,微軟的語音對話識別的詞錯率高達80%。然而,到了2016年9月,微軟語音團隊在產業標準Switchboard語音識別基準測試中,實現了詞錯率低至6.3%的技術突破,達到當時語音識別領域詞錯率最低的水平。而僅僅一個月後,微軟進一步將詞錯率降低至5.9%,首次與專業速記員持平。

近日,微軟又宣布它最新研發的人工智慧翻譯系統在通用新聞報道的中譯英測試集上,翻譯質量和準確率達到了人類專業譯者的水平。對於此次機器翻譯的技術突破,微軟技術院士黃學東表示:「在機器翻譯方面達到與人類相同的水平是所有人的夢想,雖然我們沒有想到這麼快就能實現。消除語言障礙、幫助人們更好地溝通,這是一件非常有意義的事,值得我們多年來為此付出的努力。」不過,雖然此次突破意義非凡,但微軟也提醒大家,「這並不代表人類已經完全解決了機器翻譯的問題,只能說明我們離終極目標又更近了一步」。

四大技術加持微軟AI翻譯

為了能夠取得中-英翻譯里程碑式的突破,來自微軟亞洲研究院和雷德蒙研究院的三個研究組,進行了跨越中美時區、跨越研究領域的聯合創新。其中,機器學習組從人類的做事方式得到靈感,研發出了兩項最新技術:對偶學習(Dual Learning)和推敲網路(Deliberation Network)。自然語言計算組則增加了另外兩項新技術:聯合訓練(Joint Training)和一致性規範(Agreement Regularization),以提高翻譯的準確性。這也正是微軟此次翻譯系統中所創新運用的四大技術。

對偶學習利用的是人工智慧任務的天然對稱性。在翻譯領域,我們關心從英文翻譯到中文,也同樣關心從中文翻譯回英文。由於存在這樣的對偶結構,兩個任務可以互相提供反饋信息,而這些反饋信息可以用來訓練深度學習模型。也就是說,即便沒有人為標註的數據,有了對偶結構也可以做深度學習。另一方面,兩個對偶任務可以互相充當對方的環境,這樣就不必與真實的環境做交互,兩個對偶任務之間的交互就可以產生有效的反饋信號。

推敲網路類似於人們寫文章時不斷推敲、修改的過程。微軟亞洲研究院機器學習組將這個過程沿用到了機器學習中。推敲網路具有兩段解碼器,其中第一階段解碼器用於解碼生成原始序列,第二階段解碼器通過推敲的過程打磨和潤色原始語句。後者了解全局信息,在機器翻譯中看,它可以基於第一階段生成的語句,通過多輪翻譯,不斷地檢查、完善翻譯的結果,從而使翻譯的質量得到大幅提升。

聯合訓練可以認為是從源語言到目標語言翻譯(Source to Target)的學習與從目標語言到源語言翻譯(Target to Source)的學習的結合。中英翻譯和英中翻譯都使用初始並行數據來訓練,在每次訓練的迭代過程中,中英翻譯系統將中文句子翻譯成英文句子,從而獲得新的句對,而該句對又可以反過來補充到英中翻譯系統的數據集中。同理,這個過程也可以反向進行。這樣雙向融合不僅使得兩個系統的訓練數據集大大增加,而且準確率也會大幅提高。

一致性規範即翻譯結果可以從左到右按順序產生,也可以從右到左進行生成。該規範對從左到右和從右到左的翻譯結果進行約束。如果這兩個過程生成的翻譯結果一樣,一般而言比結果不一樣的翻譯更加可信。將約束應用於神經機器翻譯訓練過程中,以鼓勵系統基於這兩個相反的過程生成一致的翻譯結果。

谷歌、亞馬遜的AI翻譯

再來看看另外兩家人工智慧翻譯巨頭谷歌、亞馬遜在機器翻譯上的表現。谷歌在機器翻譯方面的代表產品是谷歌翻譯APP,在去年3月29日對中國大陸地區開放。由於可以翻譯103種語言以及大力宣傳,用的人越來越多,在知乎上「出國旅遊有什麼好的攜帶型翻譯機或App可用?」這一問題中,得贊最多的回答首推谷歌翻譯App。不過,谷歌翻譯最新的基於深度學習的版本目前僅適用於9種語言。

至於亞馬遜,據外媒最新消息,亞馬遜正在嘗試為語音助手Alexa加入實時翻譯功能,讓使用不同語言的用戶面對面時能聽懂對方說的內容。除了語言之外,Alexa也將做到強大的跨文化翻譯,能夠幫助用戶融入到其他國家的風俗文化當中。但是,在實時翻譯領域,已經有多家公司在進行研究開發,亞馬遜已經是一個遲到的公司。

相比谷歌、亞馬遜,微軟在中國深耕多年,不斷傾聽並適應中國市場的本土化需求。相信這次和大聖魔腦的強強聯手,能打造出最了解中國市場的人工智慧翻譯機。據可靠消息,這個全新的合作款翻譯機會在近期舉行發布會揭曉,屆時雙猴科技將發布商務、旅遊兩條全新的產品線。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 科技匯 的精彩文章:

DORM兒童禮服亮相迪拜,讓世界了解中國設計

TAG:科技匯 |