「周志華8問 AAAI 前主席」機器學習研究三大挑戰與超級智能威脅

新聞 06-24

新智元編譯

採訪原文發表在 National Science Review （《國家科學評論》），2017年5月2日刊發。

「周志華8問 AAAI 前主席」機器學習研究三大挑戰與超級智能威脅

為什麼機器學習如此重要？

周志華：為什麼機器學習有用？

Dietterich：機器學習為創造高性能的軟體提供了新的方法。在傳統的軟體工程中，我們需要與用戶溝通，制定用戶需求，然後為這些需求設計、實現和測試演算法。通過機器學習，我們雖然仍需要制定軟體系統總體的目標，但不是設計自己的演算法，而是收集訓練示例（通常是人工標註的數據點），然後應用機器學習演算法去自動學習所需的功能。

這種新的方法使我們能夠為許多問題創建軟體，這些問題是使用以前的軟體工程方法無法解決的。具體來說，以前的方法實現的視覺對象檢測和識別，語音識別和語言翻譯的性能都不夠好，不足以說是可以使用的。但是隨著機器學習的最新進展，我們現在有了能夠很好地執行這些任務的系統，性能甚至可以與人類相媲美。

因此，機器學習提供了一種關鍵的技術，讓自動駕駛車輛，實時駕駛指令，跨語言用戶界面和支持語音的用戶界面等應用得以實現。機器學習對互聯網搜索引擎，推薦系統和個性化廣告也很有價值。許多人認為機器學習方法將導致醫療領域的革命，特別是在醫學影像的自動化收集和分析方面。機器學習也是許多現代化公司在運營方面的有前途的工具。比如說，機器學習可以幫助預測客戶需求並優化供應鏈。它也是訓練機器人靈活地執行製造任務的關鍵技術。

周志華：為什麼機器學習對科學界和社會都很重要？

Dietterich：機器學習方法有助於數據收集和分析。例如，機器學習方法被應用於分析大型強子對撞機收集的大量數據，而且機器學習技術對分析天文學數據至關重要。機器學習技術通過設計實驗來幫助科學家決定要收集哪些數據點，然後，機器人系統可以在實驗室或現實世界中自動地執行這些實驗。例如，有一個由羅斯·金（Ross King）開發的機器人科學家，能夠自己設計，實施並分析自己的實驗。還有由AI系統控制的遠洋滑翔機器人。機器學習技術也開始應用於控制在生態系統以及在城市中收集數據的無人機。

我自己的研究重點是應用機器學習來改善我們對地球生態系統的管理。例如，在俄勒岡州，經常因雷電造成森林火災。這些火災可能摧毀瀕危物種的棲息地，燒毀可能用於建造房屋的樹木。這些大火的一個原因是，美國長年來不允許任何燒火。這是非常昂貴的，它讓燃料堆積在森林裡，當有新的火災時，燃燒是非常猛烈的，更具破壞性。我們正在運用機器學習（強化學習）方法，找到好的規則來決定應該禁止哪些火，哪些火應該被允許燃燒。這些規則能夠節省金錢，並且能幫助保護瀕危物種。

機器學習方法也可以用於繪製例如熊貓等瀕危物種的位置和數量。在美國，我們開發了新的機器學習方法來預測和理解鳥類的遷徙。類似的問題例如新疾病的傳播，空氣污染和交通流量等。

在商業和金融方面，機器學習方法可以幫助識別欺詐和盜竊。我的小組一直在研究用於異常檢測的演算法，可以識別出異常的交易，並將它們呈現給人類分析師進行法律處理。

機器學習方法也有助於「智慧城市」的發展。我前面提到交通管理和污染的測繪。不僅如此，機器學習技術也可以應用來確定在哪個地方需要新的基礎設施（例如供水設施，電力，互聯網）。在美國，機器學習已被應用於繪製20世紀時的舊建築物中使用的含鉛塗料的分布。

關於深度學習

「周志華8問 AAAI 前主席」機器學習研究三大挑戰與超級智能威脅

AAAI前主席 Thomas Dietterich

周志華：您能評論一下深度學習的強項和不足嗎？

Dietterich：最近的發展中最激動人心的莫過於深度學習方法的研究熱潮。大多數機器學習方法要求數據科學家定義一組「特徵」來描述每個輸入。例如，為了識別圖像中的對象，數據科學家首先需要從圖像中提取諸如邊緣，點和紋理區域等特徵。然後這些特徵被作為輸入饋送給機器學習演算法來識別對象。深度學習允許我們將原始圖像（像素）提供給學習演算法，而無需事先定義和提取特徵。我們已經發現，深度學習能夠學習正確的特徵，並且比我們人工給這些特徵編碼更好。因此，在輸入（例如圖像，語音信號等）和輸出（例如對象，句子等）之間存在較大差異的問題中，深度學習能夠比以前的機器學習方法好得多。

但是，也有許多問題，其特徵是很容易獲得的。例如，在欺詐檢測中，我們可能會檢查信用卡交易的次數，交易的時間地點，等等。這些已經在高水平的特徵中表現出來，而在這樣的應用中，深度學習並沒有提供太大的好處。深度學習演算法也難以訓練，需要大量的計算時間，因此在大多數問題中，它們不是首選方法。

深度學習是機器學習的一種特殊方法。它的使用相當困難，因此在有可用的特徵的問題中，使用諸如隨機森林或boosted tree之類的方法通常更好。這些方法容易使用，不需要很多的經驗。這些方法也比深度學習方法快許多個數量級，因此可以在筆記本或智能手機上運行，而不需要GPU超級計算機。機器學習研究的一個重要目標是使機器學習技術可以讓很少或沒有正式培訓過的人員使用。

將深度學習與一般的AI技術相結合也是很有趣的方法。最好的例子是AlphaGo，它結合了深度學習（分析圍棋棋盤上的棋子模式）和蒙特卡羅樹搜索（搜索未來的遊戲來決定落子的後果）。同樣，自動駕駛車輛將頂級的軟體（用於安全，控制和用戶界面）與計算機視覺和動作識別的深度學習方法相結合。

機器學習研究的挑戰

周志華：請談談機器學習研究的挑戰。

Dietterich：機器學習的研究有許多重要的挑戰。第一個挑戰是改進無監督學習和強化學習的方法。最近的幾乎所有進展都是「監督學習」的，其中「教師」會告訴計算機每個示例訓練的正確答案。但是，我們要解決的問題太多而教師太少，但我們擁有大量的數據。舉個例子，比如說我們要檢測異常或欺詐交易。在開發「異常檢測」演算法時，可以讓演算法從大量的數據學習，而無需教師。有許多類別的「無監督」學習演算法可以在不需要教師的情況下學習。

另一個具有挑戰性的領域是強化學習。強化學習涉及通過給予獎勵或懲罰教計算機學習複雜任務。在許多問題中，計算機可以自己計算獎勵，這樣就可以讓計算機通過反覆試驗而不是教師的示範來學習。強化學習在控制問題（例如自動駕駛，機器人和前面提到的火災管理等問題）方面特別有價值。強化學習的方法目前仍然很慢，難以適用，所以加速其過程是一個挑戰。此外，現有的強化學習演算法只在單一時間尺度上運行，這使得這些方法難以在包含非常不同的時間尺度的問題中工作。例如，將車輛保持在行車道內來駕駛汽車的強化學習演算法不能學習為從一個位置到另一個位置規劃路線，因為這些決策是在非常不同的時間尺度上發生的。分層強化學習（hierarchical reinforcement learning）的研究正在試圖解決這個問題。

機器學習的第二個主要的研究問題是檢查，驗證和信任。傳統的軟體系統通常包含bug，但由於軟體工程師可以讀懂程序代碼，因此可以設計好的測試來檢查軟體是否正常工作。但機器學習的結果是一個「黑盒子」系統，它接受輸入然後產生輸出，但是很難驗證。因此，機器學習研究中非常活躍的課題是開發使機器學習系統更加可解釋的方法（例如，通過提供解釋或將其結果轉化為易於理解的形式），以及對黑盒系統進行檢查和驗證的自動化方法的研究。最有趣的新方向之一是創建自動化的「敵人」（adversaries），試圖去破壞機器學習系統。這些方法經常可以發現導致學習程序失敗的輸入。

一個相關的研究領域是「穩健的機器學習」（robust machine learning）。我們尋找即使它們的假設被違反也能很好地工作的機器學習演算法。機器學習中最大的一個假設是，訓練數據被假定是獨立分布的，並且是對將來的輸入的有代表性的示例。有研究人員正在探索如何使機器學習系統對這種假設的失敗更加穩健。

機器學習的第三個主要的挑戰是有關偏見的問題。收集數據的方式常常是有偏見的。例如，關於新葯有效性的實驗可能只對男性進行。機器學習系統可能會得出結論說新葯只能對35歲以上的老年人生效。但對女性來說，藥物的效果可能會完全不同。在一家公司，數據可以從現有的客戶那裡收集，但是這些數據對於預測新客戶的行為方式可能並不適用，因為新客戶可能會在一些重要的特徵（年齡，互聯網知識等）上有差異。目前的研究正在開發用於檢測這種偏見並創建可以從這些偏見中恢復的學習演算法。

關於高級AI的威脅

周志華：隨著機器學習快速發展，人類的工作會受到機器的威脅嗎？你可以談一下「奇點論」和高級AI的威脅的觀點嗎？

Dietterich：像所有新技術一樣，機器學習肯定會改變就業市場。簡單的重複性的工作——無論是重複的體力勞動（例如工廠工人和卡車司機）還是重複的腦力勞動（例如法律、會計和醫療方面的許多工作）——可能至少部分會被軟體和機器人取代。與工業革命一樣，伴隨著這些新技術的發展，經濟可能會出現大的中斷。一個重要的問題是機器學習和AI是否也能創造新的工作。工業革命創造了新的工作，我認為這會在AI革命中再次發生。我們很難預測這些新的工作是什麼。

我們可以回顧一下互聯網發展的過程。20世紀80年代初，網路協議（Internet Protocols）被開發出來以及部署時，我還是一名研究生。網路協議使文件可以從一台計算機移動到另一台計算機，或者從本地計算機登錄到遠程計算機。我們那時對萬維網，搜索引擎，電子商務以及社交網路這些概念一無所知！也就是說，我們當時也沒有預測到新的工作（網頁設計師，用戶體驗工程師，數字廣告從業者，推薦系統設計師，網路安全工程師等等）。

我認為我們今天預測未來的工作也是非常困難的。一定會出現的工作，例如創造AI系統的工作，教它們、定製和修補它們的工作。我認為將現在的工作完全自動化不具有成本效益。但是，每樣工作都可能80%被自動化，然後需要人類去做剩下的20％。因此，人類的價值將會更高，得到的報酬也會更高。

我認為人類工作很難完全自動化的一個方面是同理心（empathy）。機器人和AI系統的體驗與人類完全不同。它們不會「將心比心」，不能理解或同情別人。反之，他們需要被教導，就像外星人或《星際迷航》中的Data指揮官那樣，利用預測來理解人類的情感。相比之下，人類自然就能做這些事情，因為我們都知道「人之為人的感覺」。因此，涉及同理心的工作（例如諮詢，輔導，管理，客戶服務等）最不可能完全自動化，只要人類客戶認為「真實的人際交互」有價值，而不是接受與機器人或自動化系統交互。

如果大多數工業和農業生產變得自動化了（假設由此產生的財富在社會中平均分配），那麼人類很可能會發現他們富餘的時間可以做其他事情。去旅行了解其他國家和其他文化，可能會比今天更受歡迎。體育，遊戲，音樂和藝術也可能變得更受歡迎。試想，100年前，人類還很難有機會去按摩或修腳。現在這些幾乎隨處可見。誰知道100年後人類想要做什麼，想要擁有什麼經驗呢？

對於「奇點」（singularity），有兩種不同的流行觀點。讓我們分別談談。第一個觀點來自Ray Kurzweil的著作，提出由於許多技術指數級的進步，我們很難看到未來的發展。這就是「技術奇點」的觀點，認為技術發展將會在很短的時間內發生極大而接近於無限的進步。但這是不可能的，因為所有的技術都有極限（儘管我們不知道這些極限是什麼）。Herbert Stein有一個著名的經濟學法則：「如果一樣東西不能永以為繼，它就將消停。」摩爾定律也是如此，所有的AI技術都是如此。然而，即使真正的數學奇點不可能存在，我們目前的AI系統的能力仍在呈指數級地增長，所以它們未來的能力將與目前的能力非常不同。所以我相信Kurzweil是正確的，我們無法對變化無常的未來看得很遠。

「奇點」的第二個觀點是指所謂的超級智能的出現。該觀點首先由 I.J.Good 在 1965 年的一篇文章中提出，說在某種程度上，人工智慧技術將會跨越一個臨界點，它將能夠遞歸地自我提升，然後將非常迅速地提高，並且變得比人類聰明許多倍。這將是人類的「最後一項發明」。通常，這個臨界點被認為是「人類水平的AI」（human-level AI），即 AI 系統與人類的智能一致。我不贊同這個論點，原因有下面幾個。首先，機器學習的整體目標是創建可以自主學習的計算機系統。這是一種自我改進的形式（通常被用於改進學習系統本身，因此是一種遞歸的自我改進）。但是，這樣的系統的自我提高從來沒能超出一次迭代，也就是說，它們可以提升自己，但是提升後的系統不能自我提高了。我認為原因是我們將問題表示為一個函數優化的問題，一旦找到該函數的最優值，就無法進一步優化了。為了保持指數級的提升，每種技術都需要有反覆的突破。例如，摩爾定律不是一個單一的過程，它實際上是一個階梯式的改進，每登一級「階梯」都包含不同的突破。我認為這讓我們回到了 Kurzweil 式的技術奇點論，而不是超級智能。

其次，有關超級智能的觀點設定了一個人類智慧的臨界點，這是非常令人質疑的。這給我的感覺就像哥白尼和達爾文受到的攻擊一樣。對於計算機可以獲得的智能來說，人類可能不是特別的。人類智慧的限制是由許多因素決定的，包括人的腦容量和計算能力，人的生命長度，以及我們每個人都必須自我學習（而不是並行和分布式計算）的事實。計算機已經能在許多任務上比人類更加智能，包括車間作業調度，路線規劃，飛機控制，複雜系統（如大氣）模擬，網路搜索，記憶，數學計算，某些形式的定理證明等。但是，這些超過人類的能力並沒有導致 I.J.Good 所描述的超級智慧。

第三，我們在人類中觀察到，智能往往涉及廣度而不是深度。像史蒂芬·霍金這樣偉大的物理學家比我更了解宇宙學，但我比他在機器學習方面的知識更多。此外，實驗表明，一個領域的專家在其他領域並不比平均水平高。這表明，作為遞歸自我提升論證的基礎，將智能比喻為「梯級」是不準確的。相反，我們應該考慮「液體灑在桌子表面」或「生物多樣性」的比喻，即每個知識分支都是人類智慧的雨林里的一個生態位。這個比喻並不是說存在一些「臨界點」，一旦超越，就會導致超級智能。

我贊同 Kurzweil 對奇點的觀點，但這並不意味著 AI 技術本質上是安全的，我們沒有什麼可擔心的。相反，隨著計算機變得更加智能，我們把駕駛車輛，管理電網或打擊戰爭（自主武器系統）等高風險的決策交給了計算機。如上所述，今天的機器學習技術還不夠可靠，也不夠強大，不足以被交付這樣危險的決策。我非常擔心，只要機器學習組件中存在一點錯誤，AI技術的過早部署都可能導致重大的生命損失。像《2001，太空漫遊》電影的 HAL 9000 那樣，計算機可能「接管世界」，因為我們給了他們重要的系統的控制權，卻出現編程錯誤或機器學習故障。我不相信計算機會自發地「決定」接管世界，那只是科幻小說里的故事。我也不相信計算機會「想變得像人類一樣」，這是另外的故事。

人們在做決策時可能不如計算機那麼準確或快速，但是我們對世界的無法預測的方面更加在行，從而能夠更好地識別和應對計算機系統的故障。因此，我認為人類應該參與所有這些有關高風險決策的應用。

機器學習人才流失的影響

周志華：在美國，有很多機器學習學術界的教授選擇去大公司。你能評論一下嗎？

Dietterich：是的，機器學習教授去企業已經造成了大量的「人才流失」。我可以談一下它的原因和影響。有幾個原因：首先，許多公司正在開發新的AI產品，他們向教授提供非常高的薪資。第二，由於許多機器學習技術（特別是深度學習）需要大量的數據，而大公司能夠收集大量的數據，所以利用大公司的「大數據」進行深度學習研究比在大學裡搞研究要容易得多。第三，企業還有能力購買或開發深度學習的專用計算機，例如如GPU計算機或Google的張量處理器（TPU）。這也是很難在大學做的事情。

這會造成什麼樣的影響呢？主要的影響是大學可能不再像過去那樣可以教出同樣多的AI和機器學習學生，因為他們缺乏教授和研究導師。大學也缺乏大型數據集和專用計算機。工業界和政府可以通過提供資金收集數據以及購買專門的計算機來解決這些問題。我不知道政府如何解決人才流失問題，但他們可以解決數據量和計算力的問題。

除了大數據和深度學習的工作外，所有其他形式的機器學習（以及上面列出的所有挑戰）都容易在大學實驗室里進行。例如，我們在俄勒岡州立大學的實驗室正在研究異常檢測，強化學習和穩健的機器學習。

周志華：你能評論一下在這個領域裡來自中國的貢獻和影響嗎？你認為中國的研究人員要創造更大的影響力有什麼障礙嗎？

Dietterich：中國的科學家（不管是在國內還是國外工作）為機器學習和AI技術的發展做出了巨大貢獻。中國在語言識別和自然語言翻譯的深度學習方面是領先的，我期待中國研究人員有更多的貢獻。我認為最大的障礙是溝通。大多數計算機科學研究都是用英文出版的，而且由於英語對於中國學習者來說很難，這使得中國科學家更難撰寫論文或提出具有重大影響的研究發現。中國現在是AI研究的主要陣營（我想至少佔25％）。西方不懂中文的人也慢慢了解到中國的進步。我希望語言翻譯的持續改進有助於降低語言障礙。

給中國年輕研究者的建議

周志華：請您給想要進入這一領域的年輕的研究人員提一些建議。

Dietterich：我的第一個建議是，學生要儘可能地學好數學。數學是機器學習的核心，數學也很難自學。所以我建議所有大學生都應該學數學。我的第二個建議是儘可能多地閱讀文獻。不要只讀深度學習論文，而是要學習機器學習，AI和演算法的理論。新的學習演算法源於對數學和優化問題的結構的深刻理解。也不要忘記其他知識分支（例如統計學，運籌學，信息理論，經濟學，博弈理論，科學哲學，神經科學，心理學等等），這些學科的思想對機器學習和人工智慧的發展也非常重要。獲取團隊合作經驗會很有價值。今天的大多數研究是合作的，所以你應該在團隊中工作，並學習如何解決衝突。最後，鍛煉編程和溝通技巧很重要。要學習編程，掌握最新的軟體工程工具。還要學好寫作和口語，這不只是說學好英語語法和辭彙，你還要學習如何令人信服地講述你的研究，並提煉出關鍵想法。

原文鏈接：https://academic.oup.com/nsr/article-lookup/doi/10.1093/nsr/nwx045

點擊閱讀原文查看新智元招聘信息

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 新智元 的精彩文章:

※神威太湖之光TOP500三連冠，"NPU「雲腦時代軟硬體生態系統要」活起來"
※大陸學者首獲 DAC 最佳論文獎；阿里注資中國 CPU 豪賭；Facebook 改變使命宣言
※伯克利：模塊化神經網路學習複雜推理（論文下載）
※有道周楓：未來三年，神經網路翻譯將滿足90%以上的翻譯需求
※「谷歌招聘」推出，垂直搜索AI篩選，迥異百度招聘

TAG:新智元 |

您可能感興趣

※搜狗CEO王小川GAITC大會暢談語言的AI之路與挑戰
※挑戰蘋果與三星拍照權威，小米MIX2S黑科技現身
※外媒力薦HUAWEI Mate 10 Pro：一舉攻克智能手機兩大挑戰
※IARPA發起「水星挑戰賽」，尋求預測中東事件的創新技術
※挑戰華為海思，雲端宣戰GPU！礦機界扛把子比特大陸轉戰AI市場
※「DARPA加入爭霸賽」用量子計算解決機器學習問題，發布四大挑戰！
※AITech 專場回顧：學界、產界、政策三方解讀超高清與VR技術的機遇與挑戰
※BLG讓二追三失敗RW晉級四強挑戰EDG！
※軍工級手機CAT S41極限暴力挑戰：比諾基亞還強壯
※英國讀醫必經的挑戰：UKCAT還是BMAT？
※韓國綜藝《無限挑戰》主持人大換血！劉在石、HAHA等全員下車
※ADA深度解讀——EOS的最強挑戰者
※碼隆科技出席AITech極智未來盛會探討AI商業落地的挑戰與對策
※林遲青、機器人加盟Team CC 征戰守望先鋒挑戰者系列賽
※科大訊飛機器閱讀理解技術登頂SQuAD挑戰賽，車載系統或為率先落地應用
※小蟻科技推智能追蹤，體感操控4K無人機挑戰DJI Spark？
※空間中心模擬室學生團隊赴澳參加ICRA人工智慧挑戰賽
※國產廠商抱團發展AMOLED屏：挑戰三星老大地位
※UNB成員Chan特別出演KBS周末劇首次挑戰演技
※中國欲結合AI推新型機器人挑戰機器人界「四大家族」