當前位置:
首頁 > 最新 > AlphaGo進化:3天100:0碾壓舊版 不使用人類知識

AlphaGo進化:3天100:0碾壓舊版 不使用人類知識

當地時間10月18日,谷歌人工智慧團隊DeepMind團隊在在國際學術期刊《自然》(Nature)上發表論文,宣布新版AlphaGo——AlphaGo Zero可以在沒有人類指導的情況下學習,其水平超過此前所有AlphaGo(阿爾法狗),僅用3天就碾壓了此前擊敗李世石的舊阿爾法狗。

AlphaGo Zero僅擁有4個TPU,零人類經驗,所以,它的名字叫作零(Zero),Nature這篇論文——《Mastering the game of Go without human knowledge》中,Deepmind展示新版本圍棋程序AlphaGo Zero在數百萬局自我對弈後,隨著程序訓練的進行,獨立發現了人類用幾千年才總結出來的圍棋規則,還建立了新的戰略。《自然》為該論文配發兩篇評論文章,一篇來自計算機科學家,一篇來自圍棋選手。

強大的圍棋程序:可通過與自己對弈學習

今年5月烏鎮大會上,中國棋手、世界冠軍柯潔9段以0:3不敵AlphaGo。隨後Deepmind創始人Hassabis宣布,AlphaGo將永久退出競技舞台,不再進行比賽。

同時Hassbis表示:「我們計劃在今年稍晚時候發布最後一篇學術論文,詳細介紹我們在演算法效率上所取得的一系列進展,以及應用在其他更全面領域中的可能性。就像第一篇 AlphaGo 論文一樣,我們希望更多的開發者能夠接過接力棒,利用這些全新的進展開發出屬於自己的強大圍棋程序。」

Deepmind如約在Nature發布了這篇論文《Mastering the game of Go without human knowledge》。

論文中,Deepmind展示了AlphaGo Zero一種新的強化學習方式,通過自我對弈學習AlphaGo Zero 成為自己的老師。這個學習系統從一個對圍棋遊戲完全沒有任何知識的神經網路開始。然後,通過將這個神經網路與一種強大的搜索演算法相結合,它就可以自己和自己下棋了。

在它自我對弈的過程中,神經網路被調整、更新,以預測下一個落子位置以及對局的最終贏家。這個更新後的神經網路又將與搜索演算法重新組合,進而創建一個新的、更強大的 AlphaGo Zero 版本,再次重複這個過程。在每一次迭代中,系統的性能都得到一點兒的提高,自我對弈的質量也在提高,這就使得神經網路的預測越來越準確,得到更加強大的 AlphaGo Zero 版本。

這種技術比上一版本的 AlphaGo 更強大,因為它不再受限於人類知識的局限。在進行了3天的自我訓練後,AlphaGo Zero 在100局比賽中以100:0擊敗了上一版本的 AlphaGo——而上一版本的 AlphaGo 擊敗了曾18次獲得圍棋世界冠軍的韓國九段棋士李世石。經過 40 天的自我訓練後,AlphaGo Zero 變得更加強大,超越了「Master」版本的 AlphaGo——Master 曾擊敗世界上最優秀的棋士、世界第一的柯潔。

人工智慧的探索無止境

圍棋起源於中國,已經流傳了近3000年。2016年春天,AlphaGo與世界圍棋選手李世石的一場世紀人機大戰,標誌著人工智慧取得了歷史性的突破,更引發了一波人工智慧創業熱。一年之後,高智能的機器來到中國,打敗了中國的頂尖選手。

AlphaGo的誕生驚艷了世人,現在AlphaGo Zero又將機器能做到的極限往後推了幾個量級。

DeepMind的CEO得米斯·哈薩比斯( DemisHassabis)表示,「對我們來說,AlphaGo不僅限於在圍棋對弈中獲勝,這也是我們開發通用演算法的一大進步。」大多數AI被認為「用途有限」,因為它們只能執行單一任務,例如,翻譯、識別面孔。但通用型AI在許多不同任務上擁有超越人類的潛能。哈薩比斯認為,在接下來十年,AlphaGo的迭代產品將成為科學家和醫學專家,與人類並肩工作。

DeepMind團隊現在正在研究如何將與AlphaGo Zero相同的演算法應用到真正的科學挑戰中,比如蛋白質摺疊、降低能耗、尋找新材料或發現新葯。哈薩比斯表示:「我們正在努力建立通用學習演算法,而這只是向前邁出的一步,但它的確令人感到興奮不已。AlphaGo團隊許多成員現在正在開發其他項目,並試圖將這項技術應用到其他領域。」

當被問及DeepMind使用了多少資金開發AlphaGo時,哈薩比斯表示,這個數字「可能相當可怕」,很難量化。大約有15名DeepMind頂級員工年薪在六位甚至七位數以上,他們已經全職研發AlphaGo很長時間,而且該公司使用了大量的谷歌計算能力。

人機大戰已經落幕,但人類圍繞人工智慧的探索才剛剛起步。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 第一財經 的精彩文章:

大眾汽車再度轉型 告別集權式家族管理
想讓孩子像小小春一樣乖,學會應采兒這一招就夠了
我負責生,你們負責養嗎?
寶寶多大斷奶最好?選擇哪種方式斷奶最合適?你可能搞錯了

TAG:第一財經 |