對話 Salesforce 首席科學家 Richard Socher:選擇 ML 是出於對數學和語言的熱愛
雷鋒網 AI 科技評論按: 2018 年開始,NeuroAscent 聯合創始人、數據科學家 Sanyam Bhutani 相繼對 AI 領域一些優秀的從業者、研究者以及 kagglers 進行了採訪,並在其博客中推出了系列文章,大家可前往以下地址查看 Sanyam Bhutani 的採訪系列文:
https://hackernoon.com/interviews-with-machine-learning-heroes-504762ba5dd6
近日,Sanyam Bhutani 採訪到了 Salesforce 的首席科學家 Richard Socher 教授。在採訪中,Richard 根據自己當年的機器學習經歷分享了自己的學習經驗,並針對機器學習的研究成果、行業現狀、面臨的問題以及未來的發展表達了自己的見解。雷鋒網 AI 科技評論編譯如下。
今天,我很榮幸能採訪到 Richard Socher 教授。Richard 是 Salesforce 的首席科學家,於斯坦福大學博士畢業,師從吳恩達和 Chris Channing 學習機器學習和 NLP。他曾是斯坦福大學深度學習與自然語言處理課程的講師,現在則擔任 NLP 標準公開課 CS224N 的慕課講師。
以下為採訪實錄:
Sanyam Bhutani:Richard 您好,很感謝您能接受我的採訪。
Dr. Richard Socher:我也要謝謝您選擇採訪我。
Sanyam Bhutani:現在,您在 Salesforce 擔任首席科學家一職。您也曾是 NLP 領域最好、最有名的課程之一——斯坦福大學深度學習與自然語言處理課程的講師,並擁有機器學習方向的博士學位。您能跟讀者分享一下您是怎樣開始學習機器學習的嗎?是什麼讓您對深度學習產生了興趣呢?
Dr. Richard Socher:從小到大我都對數學非常感興趣,同時我也熱愛語言,並堅信它們是人類智慧最有趣的產物以及將我們人類從本質上與動物區別開來。AI 能夠讓我將這些熱愛都結合起來,並創造一些能改變這個世界的東西。我在德國開啟我的求學生涯,之後來到美國攻讀博士學位。
Sanyam Bhutani:剛剛博士畢業,您就選擇了創立 MetaMind,而不是加入「科技巨頭」,當時您是出於怎樣的考量選擇這條道路,為什麼您認為這一選擇是必然的?
Dr. Richard Socher:當我從斯坦福大學博士畢業時,我希望能夠創造些什麼,能夠將深度學習所有的潛能都通通利用起來,而不僅僅是通過某個特定的應用來利用它很小的一部分。我在 2014 年創立 MetaMind,將它定義為對圖像和文本數據進行分析、標註和預測的 AI 平台,來幫助企業做出更明智、更快速和更準確的決策。在 2016 年,MetaMind 被 Salesforce 收購,不過 Salesforce 允許我們這個小團隊繼續作為「愛因斯坦」項目的一部分,將 AI 能力賦予數百萬位用戶。
Sanyam Bhutani:到現在,您已經在最前沿的研究領域工作了十年左右,這些年工業界和學界的哪些發展成果是您最喜歡的?
Dr. Richard Socher:對於我團隊在自然語言十項全能(Natural Language Decathlon,簡稱 decaNLP)上取得的最新成果,我感到無比興奮和自豪。decaNLP 是一個學習可同時執行十項複雜的自然語言任務的通用 NLP 模型的新基準。工業界在 AI 模擬人類語言的能力上取得巨大進展的同時,decaNLP 將重新定義語言理解成功與否的基準,並為 AI 模型所能回答的問題類型開拓了新的可能性。在零樣本學習技術的幫助下,decaNLP 擁有了一項人類獨有的能力:模型對於從未見過的輸入也可以進行推理
Sanyam Bhutani:可以說,自然語言處理的發展要落後於計算機視覺。您對於當前這種情況有什麼看法?現在是開始成為一位 NLP 從業者的好時期嗎?
Dr. Richard Socher:計算機視覺和語言理解面臨著非常不同的挑戰。在計算機視覺領域,我們憑藉廣泛到足以囊括大量圖像類目的 ImageNet,取得了很多成果。結合了神經網路的 ImageNet,是能很好地處理許多不同視覺問題的默認模型。不過,NLP 與計算機視覺所面臨的問題各不相同。語言理解要微妙得多,並且單個 NLP 任務或數據集無法應對語言理解整體的複雜性。
從很多方面來說,decaNLP 對於 NLP 的作用就相當於 ImageNet 對於計算機視覺的作用。由於問答太過廣泛,並且你可以詢問任意問題,因而我們可以將任意一個 NLP 問題視作一個問題——有什麼看法?這句話翻譯過來是什麼?等等,——同時訓練一個模型去同時執行幾項任務。
Sanyam Bhutani:對於有志於從事自然語言處理工作的讀者以及初學者,您最想給他們提出的建議是什麼?
Dr. Richard Socher:對於初步接觸到這一領域的學子,我推薦他們利用好網上的資源。例如我之前的斯坦福課程(cs224n.stanford.edu)就在網上對外開放了,並且 Salesforce 最近也在 Trailhead(Salesforce 的免費線上學習平台)上發布了一些 NLP 深度學習相關的不錯的內容(內容查看地址:https://trailhead.salesforce.com/content/learn/trails/explore-deep-learning-for-nlp)。
Sanyam Bhutani:目前這一領域的研究呈現爆髮式的增長,您是怎樣跟上最前沿的發展步伐的?
Dr. Richard Socher:我通常使用 Twitter 了解研究的最新動態,同時與該領域的其他人保持聯繫。
Sanyam Bhutani:得益於互聯網,我能夠有機會收聽您精彩的主旨演講以及講座(我是您的粉絲)。
針對怎樣有效地表達科技觀點,您能分享一些技巧嗎?
Dr. Richard Socher:我認為最好是簡單地表達觀點,並嘗試去探討 AI 在與人類相關的方面對他們所帶來的影響。
Sanyam Bhutani:您是 AI 倫理的支持者,您能指出某些領域是我們即便在 AI 早期階段也必須加以關注的嗎?
Dr. Richard Socher:沒有事實依據的擔憂和實際發生的威脅之間是有區別的,AI 偏見是我們需要應對的即將到來的擔憂,然而「世界末日論」則是一種危險的干擾。人們需要開始密切注意確保 AI 訓練數據集的多樣性和無偏見性以及團隊要從多樣的視角來創建這些 AI 系統。
Sanyam Bhutani:decaNLP 帶來了一些非常有趣的成果。您怎樣看待多任務學習?那麼 NLP 以外的多任務學習呢?
Dr. Richard Socher:多任務學習對於讓 AI 擁有更好的語境理解能力和直覺力至關重要。多任務學習能夠讓我們從相關的任務中收益,並最終獲得更好的性能,而不會僅僅是專註於單任務的性能,從而可能導致丟失能夠提升我們所關注的度量標準的重要信息。
Sanyam Bhutani:對於 AI 未來的發展,最讓您激動的是什麼?
您認為 Siri 有朝一日能幫我完成 CS224n 課程的作業嗎?
Dr. Richard Socher:AI 在醫療領域具備一些潛力——可以讓放射學和病理學更高效,同時可以幫助醫生診斷人類肉眼可能發現不了的疾病。作為一位研究者,我很高興看到 NLP 的突破性成果走出了實驗室,並實現了產品化。在不久的將來,我認為將會有更自然和更具有直覺力的聊天機器人出現,它們能夠對客戶的服務電話進行恰當的回復,完成各類任務甚至向人類表達同情心。
Sanyam Bhutani:您是否有「機器學習被過度炒作」的感受?
Dr. Richard Socher:從人工智慧出現開始,圍繞 AI 的炒作就不斷。從上世紀 50 年代開始,人們就一直在談論像人類一樣說話、走路和運動的 AI,但是現在我們也還是只能說——那是在接下來的幾年時間裡可以實現的未來。
AI 周圍充斥著興奮感是好的,並且作為一位研究者,我當然也很興奮,但我們需要注意的是,不要在它們的實際能力以外去推算這一領域的突破,否則就會給人類帶來困惑和誤解。
Sanyam Bhutani:再次感謝您接受本次採訪。
關於我的採訪系列文:
最近,我開始推進我的機器學習自學之旅。但是說實話,如果沒有這些出色的線上社區以及那些幫助過我的優秀的人,我無法取得這些進步。
在這個博客系列文中,我與那些真正對我起到了激勵作用並被我當做人生導師的人進行了對話。
而我做這件事情背後的動力,你或許可以從這些我有機會學習的優秀的人身上找到答案,也希望你能從他們身上學到點什麼。
大家如果對機器學習感興趣,可以加入我一起自學機器學習(https://hackernoon.com/launching-my-company-a-scholarship-and-a-webinar-277e3b66e351)。我的 Twitter 地址是http://twitter.com/bhutanisanyam1。
via:https://hackernoon.com/interview-with-chief-scientist-at-salesforce-dr-richard-socher-c982b9edcd12雷鋒網雷鋒網


TAG:雷鋒網 |