當前位置:
首頁 > 科技 > 谷歌Transformer解決了機器翻譯中的一個難題

谷歌Transformer解決了機器翻譯中的一個難題

北京時間9月1日上午消息,機器學習已經成為一種非常有用的翻譯工具,但它還存在一些弱點,翻譯模式傾向於逐詞翻譯是其中之一,可導致嚴重錯誤。谷歌在iResearch博客上發表了一篇有趣的帖子,詳細說明了這個問題的性質以及解決方案。該公司自然語言處理部門雅克布·烏茲考瑞特(Jakob Uszkoreit)給出了很好的解釋。請思考以下兩個句子:

谷歌Transformer解決了機器翻譯中的一個難題

我過了馬路就到了銀行(bank)。

我過了河就到了岸邊(bank)。

顯然,每句話中的「bank」指代不同的東西,但是,逐字翻譯的演算法可能很可能挑選錯誤的含義——因為它不知道哪一個「bank」是正確的,除非它能看到句子結尾。你稍加留意就能發現,這種歧義隨處可見。

我會改寫句子,當然,翻譯系統不會選擇這樣走。如果為了這種簡單的句子而修改神經網路,那將是非常低效的。

谷歌的解決方案是所謂的關注機制(attention mechanism),也就是說在翻譯軟體中內置一個名為「變壓器」(Transformaer)的系統。它將句子中的單詞逐一進行比較,以確定它們之間是否以某種關鍵方式相互影響——例如,看「他」或「她」是否在說話,或者像「銀行」這樣的詞是否以特定的方式表示。

當翻譯句子被構建時,關注機制將每個詞與其他詞進行比較,就像下面GIF所演示的那樣。

如果這一切聽起來很熟悉,那可能是因為本周早些時候你讀過一篇報道:谷歌翻譯的競爭對手DeepL也在使用一種關注機制。該公司的聯合創始人提到了這個問題,他們正在為此而努力工作,他甚至提到那篇報道谷歌的文章,但顯而易見,他們的產品與谷歌有所區別,非常有效,甚至好於後者的版本。

有趣的是,谷歌的方法讓人們有機會看到系統的運作原理,因為Transformer給每個詞提供一個與其他單詞相關程度的得分,你可以看到它認為是相關的詞,或者潛在的相關詞:

很酷,對吧?嗯,我想是的。但也存在另一種類型的歧義,因為在英文里,「它」可以指代街道或動物,必須看到最後一個字才能確定bank的含義。人腦可以自動計算和分辨,但機器仍然必須有人教。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 電腦報APP新聞客戶端 的精彩文章:

蘋果APFS文件系統專門為SSD優化,不兼容機械硬碟
TCL:全黑版黑莓KEYone將全球發售
美國保險公司利用無人機評估颶風「哈維」理賠額
垃圾郵件機器人意外泄露了7億郵件地址和部分密碼
Instagif:一台可以出產GIF動圖的「拍立得相機」

TAG:電腦報APP新聞客戶端 |

您可能感興趣

「安卓手機非常卡頓」扔進谷歌翻譯,Android Phone is very fast
谷歌翻譯「安卓機卡頓」,Android is fast
Please翻譯一下your English
唯美英文翻譯句:I love you for my life past
谷歌的機器翻譯模型 Transformer,現在可以用來做任何事了
谷歌的Translatotron將翻譯提升到新的水平
「走狗」是翻譯成「running dogs」
「I am a confidence man」不能翻譯為「我是自信的人」!
南書房行走被譯成「South study walking」,機器翻譯靠譜嗎?
翻譯糾錯!誰不是Person on the luna?
谷歌將AutoML應用於Transformer架構,翻譯結果飆升,已開源
Facebook Messenger 將提供聊天翻譯功能
LG 的最新耳機支持一鍵啟用 Google Assistant 和翻譯功能
學界 | 谷歌的機器翻譯模型 Transformer,現在可以用來做任何事了
《sequence to sequence:video to text》視頻描述的全文翻譯
Facebook Messenger迎來全新AR功能和M翻譯器
RaoTips翻譯 有關Batch Brew
Timekettle時空壺翻譯耳機WT2 Plus使用評測
Deep Voice Report個人翻譯
「白酒」竟然是Chinese spirits?翻譯為「中國靈魂」?