谷歌Transformer解決了機器翻譯中的一個難題
北京時間9月1日上午消息,機器學習已經成為一種非常有用的翻譯工具,但它還存在一些弱點,翻譯模式傾向於逐詞翻譯是其中之一,可導致嚴重錯誤。谷歌在iResearch博客上發表了一篇有趣的帖子,詳細說明了這個問題的性質以及解決方案。該公司自然語言處理部門雅克布·烏茲考瑞特(Jakob Uszkoreit)給出了很好的解釋。請思考以下兩個句子:
我過了馬路就到了銀行(bank)。
我過了河就到了岸邊(bank)。
顯然,每句話中的「bank」指代不同的東西,但是,逐字翻譯的演算法可能很可能挑選錯誤的含義——因為它不知道哪一個「bank」是正確的,除非它能看到句子結尾。你稍加留意就能發現,這種歧義隨處可見。
我會改寫句子,當然,翻譯系統不會選擇這樣走。如果為了這種簡單的句子而修改神經網路,那將是非常低效的。
谷歌的解決方案是所謂的關注機制(attention mechanism),也就是說在翻譯軟體中內置一個名為「變壓器」(Transformaer)的系統。它將句子中的單詞逐一進行比較,以確定它們之間是否以某種關鍵方式相互影響——例如,看「他」或「她」是否在說話,或者像「銀行」這樣的詞是否以特定的方式表示。
當翻譯句子被構建時,關注機制將每個詞與其他詞進行比較,就像下面GIF所演示的那樣。
如果這一切聽起來很熟悉,那可能是因為本周早些時候你讀過一篇報道:谷歌翻譯的競爭對手DeepL也在使用一種關注機制。該公司的聯合創始人提到了這個問題,他們正在為此而努力工作,他甚至提到那篇報道谷歌的文章,但顯而易見,他們的產品與谷歌有所區別,非常有效,甚至好於後者的版本。
有趣的是,谷歌的方法讓人們有機會看到系統的運作原理,因為Transformer給每個詞提供一個與其他單詞相關程度的得分,你可以看到它認為是相關的詞,或者潛在的相關詞:
很酷,對吧?嗯,我想是的。但也存在另一種類型的歧義,因為在英文里,「它」可以指代街道或動物,必須看到最後一個字才能確定bank的含義。人腦可以自動計算和分辨,但機器仍然必須有人教。


※蘋果APFS文件系統專門為SSD優化,不兼容機械硬碟
※TCL:全黑版黑莓KEYone將全球發售
※美國保險公司利用無人機評估颶風「哈維」理賠額
※垃圾郵件機器人意外泄露了7億郵件地址和部分密碼
※Instagif:一台可以出產GIF動圖的「拍立得相機」
TAG:電腦報APP新聞客戶端 |
※「安卓手機非常卡頓」扔進谷歌翻譯,Android Phone is very fast
※谷歌翻譯「安卓機卡頓」,Android is fast
※Please翻譯一下your English
※唯美英文翻譯句:I love you for my life past
※谷歌的機器翻譯模型 Transformer,現在可以用來做任何事了
※谷歌的Translatotron將翻譯提升到新的水平
※「走狗」是翻譯成「running dogs」
※「I am a confidence man」不能翻譯為「我是自信的人」!
※南書房行走被譯成「South study walking」,機器翻譯靠譜嗎?
※翻譯糾錯!誰不是Person on the luna?
※谷歌將AutoML應用於Transformer架構,翻譯結果飆升,已開源
※Facebook Messenger 將提供聊天翻譯功能
※LG 的最新耳機支持一鍵啟用 Google Assistant 和翻譯功能
※學界 | 谷歌的機器翻譯模型 Transformer,現在可以用來做任何事了
※《sequence to sequence:video to text》視頻描述的全文翻譯
※Facebook Messenger迎來全新AR功能和M翻譯器
※RaoTips翻譯 有關Batch Brew
※Timekettle時空壺翻譯耳機WT2 Plus使用評測
※Deep Voice Report個人翻譯
※「白酒」竟然是Chinese spirits?翻譯為「中國靈魂」?