當前位置:
首頁 > 知識 > 如何評價「谷歌用神經機器系統把漢語翻譯成英語,錯誤率最高下降85%」?

如何評價「谷歌用神經機器系統把漢語翻譯成英語,錯誤率最高下降85%」?

最近兩天最令我反感的一個中國科技新聞就是「谷歌神經機器翻譯取得了顛覆性的突破」。感覺集盡標題黨之能事,分分鐘想靠標題獲取點擊量~ 谷歌發了篇journal性質的「集成」式論文,探討了神經機器翻譯在良好的工程實現下,和統計機器翻譯的對比。然後,中國新聞用了誇張的手法,描述了這一成果。


我想說:大廈永遠不是一天建成的,這85%的錯誤率的下降是最近兩三年來,機器翻譯學者日以繼日的研究實現的。Seq2Seq+Attention讓錯誤率下降了X個點,Stack LSTM+系統領域谷歌N篇扛鼎製作讓錯誤率下降Y個點,之後直接Minimize Sentence loss(BLEU等)而不是Maximum Likelihood又讓錯誤率下降了Z個點。現在到好,卧槽,我看著標題以為以為這篇論文又讓NMT提高了百分之八十五,直接先看中文新聞再看Arxiv,最後發現是中國記者的筆讓機器翻譯系統顛覆式的飛躍了。秉著一個嚴謹的態度,應該說明這篇論文沒有方法學的提升,而是google以及其他學者之前的工作讓神經機器翻譯有了突破。


谷歌這篇論文:論文是已有模型的拼湊,工程味道很濃,是過去幾年自然語言處理領域好方法的集成,集成了Seq2Seq + Attention + Stack LSTM + Minimize Sentence Loss ,方法學上的貢獻不多,實驗經驗的貢獻比較多。從頭到尾,雖然我不是做機器翻譯的,我也可以光看他的圖和公式和簡單的符號解釋看明白論文。這個機器翻譯系統仍然基於Seq2Seq框架。Seq2Seq框架,這篇兩年前的NIPS論文可謂是重劍無鋒,大巧不工,為機器翻譯甚至是自然語言生成另闢蹊徑,讓很多已經做不下去的領域迎來了新的希望。之後又有Attention機制讓Seq2Seq模型更加優雅更加有效。再加上最近發現訓練時候,直接優化句子或者語料庫一級的目標,例如直接優化BLEU會讓模型訓練的更加有效。

最後吐槽一下錯誤率這個非常擅長造大新聞的指標,滿分6,原來3.694 現在4.263,這個數據並不讓人十分興奮。但是60%錯誤率的提升確是個大新聞!!!國內媒體在23頁論文中,其他都不看,就看了這個指標(而且只有一個語言是85%的提升)寫到了標題,說的嚴重些:其心可誅~ 如果按照錯誤率這個指標的下降,例如原來錯誤率3%,現在1.5%(我不知道這是下降了50%還是100%),提高了1.5個點在很多數據集上這1.5個點的提升是過不了統計學的顯著性檢驗~


總之,我是不怎麼信有什麼 奇點 理論的,磚要一塊一塊搬,機器翻譯要一行一行代碼寫,每篇論文提高一小步。人工智慧大家不要相信今天,但一定要相信明天

請您繼續閱讀更多來自 知乎 的精彩文章:

地質、植物、動物等科研工作者,在野外考察時是否會配槍?
如何評價雙流機場等地採用 X 射線透射人體的「弱光子人體安檢儀」?且不設置明顯電離輻射標誌的違法行為?
日本原來的那些大名後代現在都混的怎麼樣?
如何評價金庸筆下的周伯通?
在風投基金管理中,LP與GP 的關係如何?曾在某些基金中的 LP 「妻管嚴」現象是否已逐漸消失?

TAG:知乎 |

您可能感興趣

「深度」AI 入侵翻譯,神經機器翻譯進化讓巴別塔7年內成真
阿里雲PAI將神經機器翻譯訓練效率提升5倍
神經機器翻譯的六大挑戰以及基於短語統計機器翻譯的不足與改進
將科幻變成現實,谷歌百度用神經機器翻譯踐行人類「巴別塔之夢」
將科幻變成現實,谷歌百度用神經機器翻譯踐行人類巴別塔之夢
谷歌翻譯高勤:神經網路技術將主導機器翻譯的未來
萬字「全文」詳解谷歌神經網路機器翻譯NMT
第29期直播預告:神經系統異常機械張力評估
從剪枝法到低秩分解,手機端語言模型的神經網路壓縮
成功才是成功之母,「勝利者效應」的神經機制首次被發現
評蘋果A11神經網路引擎:AI加速將成為高端手機晶元標配
單場35分神經刀空降火箭?莫雷欲出三將做籌碼,哈登迎來頂級替補
庫里三分最不準的一年:命中率跌破40% 變神經刀式射手
用上神經網路的谷歌翻譯評測效果的確不錯,可它居然威脅要吃了我?
神經機器翻譯再立新功:實時機器翻譯取得重大進展
「脆弱的AI」神經網路存在後門,特定觸發器攻擊準確率超90%
突發性耳聾:指的是3天之內連續3個聲音頻率大於30分貝感音神經性聽力減退的癥狀
吳克群左耳神經毀損! 確診失聰「像聽機器人說話」
分分鐘能讓你笑成神經病!十部堪稱解壓神器的喜劇