當前位置:
首頁 > 新聞 > 經濟學人:揭秘谷歌旗下最有影響力的AI公司

經濟學人:揭秘谷歌旗下最有影響力的AI公司

全世界最著名的人工智慧公司是哪一家?答案是,DeepMind。如果這個名字還有一些陌生的話,那麼,你想必聽說過AlphaGo。這個人工智慧應用程序在2016年戰勝了韓國圍棋國手李世石,讓人類一下子警醒到了人工智慧的能力。DeepMind就是AlphaGo的開發者。DeepMind的早期投資人包括埃隆·馬斯克、彼得·泰爾等矽谷名人。2014年時,谷歌收購了DeepMind。

《經濟學人》旗下的雜誌《1843》,在三四月合刊中,發表了一篇寫DeepMind公司的深度報道。報道通過對25個內部人士的採訪,講述了這家公司開發通用人工智慧的想法和挑戰,以及它如何努力保持在谷歌內的獨立地位。

首先是這家公司的創始人和他開發通用人工智慧的思路。

DeepMind的創始人叫哈薩比斯(Demis Hassabis)。他16歲時就考入劍橋大學計算機系,22歲時創辦了自己的電腦遊戲公司。29歲時,哈薩比斯回到倫敦大學讀認知神經學博士。之後,他關於大腦海馬體與情景記憶關係的研究,被《科學》雜誌評選為2007年「年度突破」。2011年,哈薩比斯創立了DeepMind。他的想法是,找到開發通用人工智慧技術的方法。

過往科學家開發通用人工智慧的路徑有兩條。第一條路徑基於規則,科學家試圖搞清楚人類思考的所有規則,然後通過程序把這套規則寫出來。這種方法一度非常流行,但卻始終沒有產生出好的成果。第二條路徑想做的,是用數字形式複製大腦的物理網路結構。但是,研究人員發現,這項任務同樣難以完成。因為大腦中有非常多的神經元,要想完全複製幾乎不可能。

哈薩比斯的方法接近於中間立場,具體就是:參照大腦處理信息的宏觀方法來開發通用人工智慧。功能型磁共振成像技術,已經可以讓腦科學家觀察大腦活動時的狀態。通過這種技術,科學家發現,大腦會在睡眠時,通過回放經驗來學習,以便總結出一個通用原則。人工智慧開發者可以效仿這種方法。

這就是DeepMind在開發人工智慧時採用的機器學習技術:強化學習。使用了強化學習技術的程序,可以收集有關環境的信息,然後通過不斷重複經驗來學習進化。具體到圍棋來看,程序在熟悉了圍棋的規則之後,通過不斷重複下棋來學習。如果程序走錯了一步,輸掉了比賽,下一次它就知道不該這麼做。程序可以如此反覆訓練自己。AlphaGo就是在這個邏輯下開發出來的。

其次,我們再來看下DeepMind和谷歌之間的關係。這家公司在被收購之後,也努力保持獨立,並且採用了至少三個方法。

谷歌收購了AlphaGo之後,DeepMind的創始人哈薩比斯,並沒有像很多賣掉公司的創業者那樣,用更多時間去享受生活。他繼續執著於開發通用人工智慧的願景。

不過他首先要解決的問題是,怎麼在谷歌內部還能保持自己的獨立自主。報道說,2013年大部分時間裡,哈薩比斯都在跟谷歌談判交易條款。他想要達到的目的是:獨立於母公司運營,獲得谷歌提供的所有好處,比如錢和計算能力,但要保持控制權。用他的話說,「它將擁有創業公司的動力、最偉大大學的智慧,以及世界上最有價值的公司之一提供的雄厚財力。」

哈薩比斯為了保持獨立做的工作包括,同谷歌簽訂了一份由倫敦資深律師起草的合同,名為「道德與安全審查協議」。這份合同規定,DeepMind的通用人工智慧核心技術,開發出來後,會被交給一個叫道德委員會的管理小組。DeepMind的三位創始人都是這個小組的成員。這樣做,可以防止谷歌公司單方面控制這項技術的知識產權。

此外,還有DeepMind員工對哈薩比斯的忠誠度。哈薩比斯設定的研究議程,吸引了全世界許多科學家加入這家公司工作。此前就有關於牛津大學和劍橋大學的科學家被DeepMind吸引走的報道。對這家人工智慧公司的很多員工來說,他們更喜歡DeepMind,而不是谷歌。

然後,是DeepMind的公眾影響力。經過AlphaGo一戰,這家公司已經成為人工智慧領域最著名的公司。谷歌數據中心的大量伺服器產生的熱量需要降溫。DeepMind還用演算法算出了最高效率方法,從而節省下能源。它號稱在2016年已經把谷歌的能源費用降低了40%。這些都讓DeepMind始終受人關注。不過,這需要DeepMind不斷製造出大新聞。

這家公司目前還處在虧損狀態。報道說,公司在2017年虧損了2.82億英鎊,約為25億人民幣。谷歌母公司的CFO波拉特,已經在對公司里的一些需要長時間投入的業務進行盤點,哪怕它們很酷。因此,自然有人會擔心DeepMind還能不能長久保持獨立的地位。

而且,已經有不詳的前兆發生了。2018年11月,谷歌成立了醫療保健部門,隨後就把DeepMind的醫療部門併到母公司的部門中。這樣做的邏輯是:可以把整個公司的相關研發資源集中起來。道理很對,但報道拋出了一個問題:在開發通用人工智慧這個問題上,谷歌會不會使用同樣的邏輯?

最後,報道也指出了DeepMind目前技術的局限性。

這種局限包括:首先,DeepMind開發的人工智慧程序,能夠在給定的環境下飛速進化,但是,卻不能對環境的微小變化做出調試。而外部世界其實是非常多變和不同的。比如,拿醫療人工智慧來說,沒有兩個身體器官是完全一樣的。

第二個局限是,目前DeepMind開發的人工智慧程序,它的成功,取決於非常快速即時的反饋和獎勵功能,反饋和獎勵的信號還必須單一併且清晰。這種反饋與獎勵,可以讓程序知道自己做對或做錯了什麼,進度怎麼樣。但是,「現實世界並不提供簡單的回報,進步很少用單一標準來衡量。」現實世界的反饋往往信號很薄弱、經常會被延遲等。包括人腦也是這樣。人腦很少會收到任務完成的明確反饋。

科技有溫度,點擊下方,關注「酷玩兒」帶您發現新奇、好玩的科技!


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 酷玩兒 的精彩文章:

任正非:華為的定價策略變化
人工智慧:未來AI會越來越像人類大腦

TAG:酷玩兒 |