Salesforce 開發出可同時執行 10 種任務的自然語言處理模型！

科技 06-21

就在幾年前，向你的手機提一個在網上查找信息的問題可以說幾乎是不可能的，因為計算機在理解短語（除了個別短語）方面的能力根本不是很出色。

現在，由於機器學習方面的進步，我們認為谷歌或Siri相當準確地回答我們提出的問題不足為奇。但是這方面的進展一直很緩慢，需要針對非常具體的自然語言處理（NLP）任務進行密集的訓練，比如將文本轉換成語音、分析情感或理解代詞指代等任務。

這是Salesforce.com公司的研究人員認為他們已開始解決的問題。今天，該公司發布了一篇論文（見文末），概述了使用一個模型就能同時處理10項不同的NLP任務的方法。這篇論文實際上是一項挑戰，名為《自然語言十項全能》（簡稱decaNLP），輔以一種「多任務問題回答網路」即MQAN模型，該模型可以同時學習10項任務。

Salesforce的首席科學家理查德?索赫爾（Richard Socher）在接受採訪時說：「我們的模型好比是NLP領域的瑞士軍刀。」換句話說，研究人員和開發人員實際上只需使用一種工具，而不必為那些任務中的每一項使用一種工具，那些任務需要無法用於其他任何任務的超級定製的模型。

比如說，最終，結果可能會獲得功能強大得多的聊天機器人，可以更自然地與人交談。

索赫爾與ImageNet作了一個類比，ImageNet是他幫助開發的標籤圖像資料庫，被廣泛認為開啟了深度學習領域的革命，促使圖像識別領域取得了突破。但是沒有一種任務以相似的方式定義自然語言處理，自然語言處理包括機器翻譯、自然語言推理、目標導向對話和代詞消解等方面。索赫爾說：「在NLP領域，其實不存在所有研究人員都認為：如果你在這個方面取得進展，它就會整體上改善NLP的單一任務。」

Salesforce的研究人員還包括布賴恩?麥卡恩（Bryan McCann）、尼蒂什?舍里什?凱斯卡（Nitish Shirish Keskar）和熊蔡明（Caiming Xiong），他們提出的方法就是將這每一項任務都視作一個回答問題的問題。索赫爾解釋：「問題回答非常廣泛，你實際上可以問任何問題――它相當於為你提供了處理幾種任務的單一模型。」

MQAN支持所謂的「零樣本」（zero-shot）學習，這意味著模型可以處理它之前未見過的任務或未經過相應訓練的任務。麥卡恩說：「你可以運用模型處理一種全新的任務，之前從未處理過的任務。遇到換個方式來表述或意義上略有變化，大多數模型就無能為力。我們的模型處理得了。即使它之前從未見過類似的任務，照樣可以處理。」

他補充說，具體到實際應用，面對並不完全是已經學會的短語，聊天機器人可以做出極準確的答覆，更像是人們平常交談那樣。

麥卡恩表示，Salesforce開源了模型，那樣「人們可以完成我們未竟的工作。」

Salesforce搬出了著名的AI研究人員約舒華?本吉奧（Yoshua Bengio）的觀點，他是蒙特利爾大學計算機科學與運籌學系教授，他與索赫爾在密切相關的機器學習領域共過事。

他說：「自從大約二十年前我開始致力於表示自然語言的辭彙嵌入以來，我的目標就是，同樣的表示法應該可用於所有自然語言任務。這篇論文中將所有這些任務表示為回答問題的想法至關重要，但這還不夠。論文作者搞出了自然語言十項全能，為這個目標定義一個基準，並引入了最終使這個夢想有可能實現的架構上的創新。」

論文全文：