對話艾倫人工智慧CEO Oren Etzioni
Oren Etzioni, 艾倫人工智慧機構 CEO,Farecast創始人, 華盛頓大學教授。本文是 Quora 上,他回答人工智慧相關問題的匯總。
你看到了深度學習的哪些缺點?
深度學習已經成為了近些年最耀眼的成就,但是它仍然僅僅作為分類(或非線性回歸)的工具。
我們已經看到了人工智慧在圖像、語音片段、甚至棋盤布局上越發精確的分類結果,但是它需要擺脫分類和回歸的局限。讓我們來討論一下 AlphaGo 吧,它是 DeepMind 團隊的一個引人注目的技術成就。
但是,對於 AlphaGo 成功的大肆吹捧,無異於一個人爬到了樹頂就宣稱「我馬上就能登上月球了!」
當然,下面就是我要給出的原因:
AlphaGo 是基於海量的標籤化數據,這在遊戲中是可以輕易實現的,但在其他的環境下很難做到。例如, 在 Semantic Scholar 網頁中將所有引述分類為「具有影響力」以及「不具有」——未標籤化的數據實在太多——標籤化數據難以實現。
我們不知道如何在深度學習系統內植入複雜的背景知識或邏輯推導能力。
AlphaGo 基於一套手動的神經網路,並且各個應用之間需要轉換。
AlphaGo 依賴人類去指定輸入表徵以及輸出目標類別——它不能自我指定。
在許多情況下,僅僅是指定適合的類別也會由於對象的細微和模糊性,變得十分困難。
我們底線在於:當我們成功的定義了一個目標方程,並將現實任務降維成一個優化問題的時候——我們的計算機科學 「肌肉」會高速運轉,然後通過足夠的數據和(遲早都會)成功的表徵,我們可以解決這個任務。然而,許多問題並非結構良好的,僅僅將它們形式化就可能需要額外的分析。例如,我們該如何才能以正式的方式寫出一個句子的含義?
大部分這些評論都不僅僅針對 AlphaGo 或深度學習,而是適用於所有監督式學習程序。正如 Alan Newell 所說:「你無法和大自然進行智力競猜然後獲得勝利!」
多虧了偉大的 Geoff Hinton ——思維並不是一個向量,人工智慧也並不是一個統計學問題。
艾倫人工智慧機構是一個怎樣的機構?你關注的核心又是什麼?
位於西雅圖的艾倫人工智慧機構(AI2)是一家非盈利研究機構。我們的任務是通過具有高影響的人工智慧研究與工程去造福人類。或者更加簡潔點:創造服務社會的人工智慧。AI2 由 Paul Allen 在 2014 年創立,現在有 50 位研究人員與工程師,並還在迅速增長之中。
因為我們將長期的研究,同目標驅動並以團隊為核心的創業思維相結合,來解決一些大學沒有足夠資源支撐的項目。我們沒有申請研究資金來完成研究的壓力,也不用擔心要為風投機構或股東們創造利潤的問題。
Jeff Hammerbacher 曾經說過一句著名的話:「我們這一代人最聰明的人都在絞盡腦汁地思考怎麼讓人們點擊廣告,這糟透了。」
相反地,我們有研究員和工程師肩並肩去奮鬥在類似 Semantic Scholar 這樣的項目上,它有潛力通過最精尖的人工智慧和工程來造福人類。
這個項目的長期願景是:
「說不定有一個不可治癒的癌症的治癒方法,就隱藏在上千篇乏味的臨床醫學研究報告中呢?在 20 年之後,人工智慧將可以閱讀——更加重要的是去理解——科學文章。這些人工智慧讀者將會連接起不同研究的關鍵點,識別出新奇的假設,並從而提出一些可能會被錯過的實驗建議。」
「人工智慧為基礎的探索引擎將會幫助找到科學界最複雜的問題的答案。」
你怎樣看待 OpenAI ?
OpenAI 對於人工智慧生態系統來說是一個強力的輔助,並且擁有著 Deep Learning 相關研究者組成的優秀團隊。我希望我們能夠達成合作,並希望他們不需要放棄非盈利的最初願望。
讓我很高興的是,他們啟用了由艾倫人工智慧機構所激發的使命宣言,也就是「為了人類共同利益的人工智慧」。
對於 Elon Musk 針對人工智慧所稱的「釋放了惡魔」,但依然在許多人工智慧公司,諸如 OpenMind、Vicarious、以及現在的 OpenAI 人工智慧研究這一事實,我其實非常困惑。接著,又有了特斯拉公司....
人工智慧對於人類是存在意義上的威脅嗎?
Andrew Ng 曾經說過有名的一句話:「擔心人工智慧會變成邪惡的事物,就像擔心火星將會人滿為患一樣,為時過早」。
好萊塢(以及媒體)一直都沉浸在「人工智慧的存在威脅」,但忽視了下面的事實:
產生一個「真正」的人工智慧系統——而不是像 AlphaGo 和深藍這樣狹隘意義上的「學者」——所面對的技術挑戰是難以想像的。
人工智慧在預防車輛事故、醫療誤診等等方面給社會帶來的巨大潛力。
實際上,沉浸在對不切實際的遙遠未來的擔心,導致人們忽略了人工智慧可能在近期帶來的真正問題:它對於就業或武器制度的影響。
此外,要記住,未來不會只單獨出現一個人工智慧——多個人工智慧系統可以實現「相互制衡」。
除了語言+視覺之外,艾倫人工智慧機構是否對於純粹的計算機視覺問題也很感興趣?
沒錯,我們正在 AI2 積極地研究幾個核心的計算機視覺問題,並且有厲害的 Ali Farhadi 指導我們。
除了我們在科學問題的視覺化理解上的努力之外,我們還在關注許多其它的視覺問題,諸如常識的獲取、物理學知識、高效的深度學習解決方案、場景理解以及目標探測。
我們研究的一個重點就是理解場景內目標的物理特徵。能夠理解作用力與物體之間的互動,是視覺邏輯推導的一個重要組成部分。
最近,我們提出了一個二叉(binary)的深度學習框架,將網路的規模降低了接近32倍,提供了在有限容量的可移動設備載入深度學習網路的可能性。
我們在目標探測和場景理解上有許多研究。例如,就在最近的一個研究中,我們以每秒155幀的速度處理場景,同時仍然維持了超出其他實時目標探測器的兩倍的優秀表現。
你最期待看到了哪一個工業被人工智慧所影響?
人工智慧能夠在下面幾個行業中挽救人們的生命:
交通業:人工智慧會預防許多許多的事故。
醫療健康:人工智慧可以幫助醫療診斷的錯誤,幫助創造新的革新性的治療手段。
礦業與消防行業:機器人將會有一天接手這些危險的職業。
當然,我們現在必須要問一下自己:這對於人類的職業會又怎樣的影響?我們如何確保這些行業中被取代的人們不會成為人工智慧成功的犧牲品。
為什麼相比於深度學習,艾倫人工智慧機構更加關注 GOFAI(Good Old-Fashioned Artificial Intelligence,有效的老式人工智慧)?
GOFAI 由一套問題和一套技術解決方案組成。領域的基礎問題並沒有改變,仍需要被解決。GOFAI 技術解決方案並沒有被證明有擴展性,因此我們希望用包括深度學習、其他形式的機器學習,ILP 以及更多的現代化的方案取代它們。
在建立 Semantic Scholar 上有哪些特殊的人工智慧問題需要被解決?
Semantic Scholar 利用 NLP(自然語言處理)、文本挖掘、信息提取和視覺技術去幫助科學家對抗過度載荷的信息,將更多精力放在核心論文與重要的結果上。通過這些方法,我們能夠提供下列獨一無二的特徵:
為論文識別最具影響力的引用——可以超過10倍的數量減少你需要的考慮的論文。
自動生成因子去過濾論文結果,包括所利用的資料庫、關鍵詞與論文元數據例如作者與會議。
我們可以自動獲取與一篇論文有關的數字與圖表。
所有這些問題都具有挑戰性,因為我們從處理論文的 PDF 版本,這意味著要展示出論文,但通常不包含關鍵的語義信息。
四年級或八年級的科學測驗對如今的人工智慧來說,難道不是一個成功率極低的嘗試嗎?為什麼不從一些簡單的任務開始,比如說從視頻里的對世界的基本理解?
科學問題十分具有挑戰性,因為它們涵蓋了巨大種類的話題,常常從商業運作跨度到科學知識,也頻繁的充斥著各種圖標及其文字。
舉個例子,一個小學四年級的問題如下:
四年級的同學們正打算舉行一場滑旱冰比賽。下列哪一種表面最適合比賽?
(A) 石子路(B) 沙子路(C) 柏油路(D) 草坪
這道題要求你掌握關於滑旱冰和不同材料的基本知識,還有關於運動的科學知識。
從我們在 AI2 的實際操作來看,四年級科學確實看起來可以觸及。我們的 Aristo 系統現今能在紐約校務委員會的四年級科學測驗中得到接近 50% 的得分,並繼續提高著(65% 算及格),而我們的工作包括解決問題上的進步:對解決一些需要簡單的道理論證和圖像理解(對某些種類圖像)的提升。基礎科學十分適合作為發展人工智慧的一個領域,因為它可以被清晰的計量,並且為各種任務——從一些簡單的到一些需求深度理解的——提供循序漸進的推進。這之前已經有幾個人工智慧帶來巨大進步的例子了:它通過選取那個正好的問題來進行專攻。我們相信基礎科學很適合被運用在這件事上。
八年級科學比四年級科學難了許多。問題更長、包含了更多複雜的圖表、還對更深層的推理有要求。然而就算這樣,也有證據表明我們可以達到進步。舉個例子,在 2015 年的艾倫人工智慧八年級科學挑戰上,最優秀的系統在無圖表、多選問題上取得了 60%的成績,而能夠運用更高等數學和幾何來進行推理的系統也取得了良好的表現。不論需要花多長時間才能及格,這些挑戰為激發在這一領域的顯著的、新新的進步創造了一個美好的背景。
要深度閱讀請見論文:http://www.allenai.org/papers.html我們的公共資料庫:: http://www.allenai.org/data.html
在運用神經網路來達到信息提取的過程中,有什麼有趣的研究問題和方向嗎?
許多的信息提取的核心有一套概念學習方法。舉個例子,TextRunner (在 Open Information Extraction 可以看到相關演示)依賴於一個 CRF 從一句話里提取各類關係。我們很自然的會考慮:如果我們用一種 LSTM 為基礎的解決方法來代替 CRF 會怎麼樣?
具體實例請見論文:Semantic Scholar (https://www.semanticscholar.org/paper/End-to-end-Relation-Extraction-using-LSTMs-on-Miwa-Bansal/23d1e3436ec530185be1fd067eba150fd9802be9)
一個巨大的問題則變成:我們如何去生成股走數量的被標記了的數據。
當然了,我們就會想到「遠程監控」(distant supervision),而遠程監控(它生成各類嘈雜的標籤)和深度學習(它合理而強大的對應雜訊)的結合也變得十分有趣......對於一個初級研究者來說,為艾倫學院工作和為一個大學實驗室工作不同嗎?
在 AI2 工作意味著你不需要寫那些宏大的提議(因為我們有全額的資助),你也不需要教書。相反,你能夠全身心地專註於前沿的研究上。除此之外,你將會近距離的與頂尖的工程師、研究人員們一起團隊協作。人們熱愛 AI2 里要解決的難題、團隊的熱情、還有進展速度。
見:在艾倫人工智慧機構工作( Working at Allen Institute for Artificial Intelligence)見:什麼事艾倫學院?你的專攻是什麼?(What is the Allen Instiute? What are you focused on?)
怎麼用平常人的話來描述「Semantic Scholar」?
這是一個通過人工智慧實現高級篩選的用於科學論文搜索的搜索引擎。
見:為了建造「Semantic Scholar」,有哪些具體的人工智慧問題必須被解決?( What are some specific AI problems that had to be solved to build semantic scholar? )
「Semantic Scholar」怎樣是使用機器學習的?
見:為了建造「Semantic Scholar」,有哪些具體的人工智慧問題必須被解決?( What are some specific AI problems that had to be solved to build semantic scholar?)






※對話,GoogleX創始人Sebastian Thrun與李開復對談人工智慧
※芭莎獨家對話Dior新任創意總監Maria Grazia Chiuri
※對話 Dior 首位女性創意總監 Maria Grazia Chiuri
※Kim Taylor Bennett 對話女性音樂人:和 Shirley Manson 聊女性外貌、90後文化及 Beyoncé的才華
※Kim Taylor Bennett 對話女性音樂人:Tegan and Sara談LGBTQ、Drake 和對刻板觀念說不
※TheFifthSense#對話《The Gentlewoman》主編 Penny Martin
※【對話ZACK】攝影師Juergen Teller
※空想家的勝利,唐霜對話Berluti創意總監Haider Ackermann
※對話Twitter大中華區總經理Alan Lan:中國手游如何利用Twitter出海
※Richard Rogers+張軻+K.Michael Hays隔空對話:建築學的社會性
※與 Emilie Moutard-Martin 對話,關於Piaget的羽毛手錶,她最有發言權
※Ermenegildo Zegna,年輕新紳士間的對話
※Kim Taylor Bennett 對話女性音樂人:Bat for Lashes 聊現代愛情、虎狼之年和死藤水體驗
※【情景對話替換練習】第3期:At The Restaurant-Ordering
※對話PlayStation遊戲品牌塑造者 SIE全球工作室總裁吉田修平專訪
※Collector Guide | 深度對話影像上海總監Georgia Griffiths,攝影收藏二三事
※對話Google產品經理Lily Peng:AI不會讓醫生失業
※Facebook加入爭奪中國AI人才,LeCun對話AI領袖
※吳甘沙對話Tom Mitchell:人工智慧如何顛覆我們的城市 | GMIC 2017