經濟學人：揭秘谷歌旗下最有影響力的AI公司

新聞 04-18

全世界最著名的人工智慧公司是哪一家？答案是，DeepMind。如果這個名字還有一些陌生的話，那麼，你想必聽說過AlphaGo。這個人工智慧應用程序在2016年戰勝了韓國圍棋國手李世石，讓人類一下子警醒到了人工智慧的能力。DeepMind就是AlphaGo的開發者。DeepMind的早期投資人包括埃隆·馬斯克、彼得·泰爾等矽谷名人。2014年時，谷歌收購了DeepMind。

《經濟學人》旗下的雜誌《1843》，在三四月合刊中，發表了一篇寫DeepMind公司的深度報道。報道通過對25個內部人士的採訪，講述了這家公司開發通用人工智慧的想法和挑戰，以及它如何努力保持在谷歌內的獨立地位。

首先是這家公司的創始人和他開發通用人工智慧的思路。

DeepMind的創始人叫哈薩比斯(Demis Hassabis)。他16歲時就考入劍橋大學計算機系，22歲時創辦了自己的電腦遊戲公司。29歲時，哈薩比斯回到倫敦大學讀認知神經學博士。之後，他關於大腦海馬體與情景記憶關係的研究，被《科學》雜誌評選為2007年「年度突破」。2011年，哈薩比斯創立了DeepMind。他的想法是，找到開發通用人工智慧技術的方法。

過往科學家開發通用人工智慧的路徑有兩條。第一條路徑基於規則，科學家試圖搞清楚人類思考的所有規則，然後通過程序把這套規則寫出來。這種方法一度非常流行，但卻始終沒有產生出好的成果。第二條路徑想做的，是用數字形式複製大腦的物理網路結構。但是，研究人員發現，這項任務同樣難以完成。因為大腦中有非常多的神經元，要想完全複製幾乎不可能。

哈薩比斯的方法接近於中間立場，具體就是：參照大腦處理信息的宏觀方法來開發通用人工智慧。功能型磁共振成像技術，已經可以讓腦科學家觀察大腦活動時的狀態。通過這種技術，科學家發現，大腦會在睡眠時，通過回放經驗來學習，以便總結出一個通用原則。人工智慧開發者可以效仿這種方法。

這就是DeepMind在開發人工智慧時採用的機器學習技術：強化學習。使用了強化學習技術的程序，可以收集有關環境的信息，然後通過不斷重複經驗來學習進化。具體到圍棋來看，程序在熟悉了圍棋的規則之後，通過不斷重複下棋來學習。如果程序走錯了一步，輸掉了比賽，下一次它就知道不該這麼做。程序可以如此反覆訓練自己。AlphaGo就是在這個邏輯下開發出來的。

其次，我們再來看下DeepMind和谷歌之間的關係。這家公司在被收購之後，也努力保持獨立，並且採用了至少三個方法。

谷歌收購了AlphaGo之後，DeepMind的創始人哈薩比斯，並沒有像很多賣掉公司的創業者那樣，用更多時間去享受生活。他繼續執著於開發通用人工智慧的願景。

不過他首先要解決的問題是，怎麼在谷歌內部還能保持自己的獨立自主。報道說，2013年大部分時間裡，哈薩比斯都在跟谷歌談判交易條款。他想要達到的目的是：獨立於母公司運營，獲得谷歌提供的所有好處，比如錢和計算能力，但要保持控制權。用他的話說，「它將擁有創業公司的動力、最偉大大學的智慧，以及世界上最有價值的公司之一提供的雄厚財力。」

哈薩比斯為了保持獨立做的工作包括，同谷歌簽訂了一份由倫敦資深律師起草的合同，名為「道德與安全審查協議」。這份合同規定，DeepMind的通用人工智慧核心技術，開發出來後，會被交給一個叫道德委員會的管理小組。DeepMind的三位創始人都是這個小組的成員。這樣做，可以防止谷歌公司單方面控制這項技術的知識產權。

此外，還有DeepMind員工對哈薩比斯的忠誠度。哈薩比斯設定的研究議程，吸引了全世界許多科學家加入這家公司工作。此前就有關於牛津大學和劍橋大學的科學家被DeepMind吸引走的報道。對這家人工智慧公司的很多員工來說，他們更喜歡DeepMind，而不是谷歌。

然後，是DeepMind的公眾影響力。經過AlphaGo一戰，這家公司已經成為人工智慧領域最著名的公司。谷歌數據中心的大量伺服器產生的熱量需要降溫。DeepMind還用演算法算出了最高效率方法，從而節省下能源。它號稱在2016年已經把谷歌的能源費用降低了40%。這些都讓DeepMind始終受人關注。不過，這需要DeepMind不斷製造出大新聞。

這家公司目前還處在虧損狀態。報道說，公司在2017年虧損了2.82億英鎊，約為25億人民幣。谷歌母公司的CFO波拉特，已經在對公司里的一些需要長時間投入的業務進行盤點，哪怕它們很酷。因此，自然有人會擔心DeepMind還能不能長久保持獨立的地位。

而且，已經有不詳的前兆發生了。2018年11月，谷歌成立了醫療保健部門，隨後就把DeepMind的醫療部門併到母公司的部門中。這樣做的邏輯是：可以把整個公司的相關研發資源集中起來。道理很對，但報道拋出了一個問題：在開發通用人工智慧這個問題上，谷歌會不會使用同樣的邏輯？

最後，報道也指出了DeepMind目前技術的局限性。

這種局限包括：首先，DeepMind開發的人工智慧程序，能夠在給定的環境下飛速進化，但是，卻不能對環境的微小變化做出調試。而外部世界其實是非常多變和不同的。比如，拿醫療人工智慧來說，沒有兩個身體器官是完全一樣的。

第二個局限是，目前DeepMind開發的人工智慧程序，它的成功，取決於非常快速即時的反饋和獎勵功能，反饋和獎勵的信號還必須單一併且清晰。這種反饋與獎勵，可以讓程序知道自己做對或做錯了什麼，進度怎麼樣。但是，「現實世界並不提供簡單的回報，進步很少用單一標準來衡量。」現實世界的反饋往往信號很薄弱、經常會被延遲等。包括人腦也是這樣。人腦很少會收到任務完成的明確反饋。

科技有溫度，點擊下方，關注「酷玩兒」帶您發現新奇、好玩的科技！

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 酷玩兒 的精彩文章:

※任正非：華為的定價策略變化
※人工智慧：未來AI會越來越像人類大腦

TAG:酷玩兒 |