當前位置:
首頁 > 科技 > AlphaGo Zero讓人類多餘?理性看待圍棋之神

AlphaGo Zero讓人類多餘?理性看待圍棋之神

作者丨郭寶婷

微信公眾號ID|Xtecher

10月18日,Deepmind在《Nature》發表的論文Mastering the Game of Go without Human Knowledge中介紹了AlphaGo Zero,一款新版的AlphaGo。根據DeepMind透露,AlphaGo Zero不但拋棄了人類棋譜,實現了從零開始學習,連以前使用的人類設計的特徵也拋棄,直接用棋盤上的黑白棋作為輸入。除了圍棋規則外,不使用人類的任何數據和知識,僅通過3天訓練,就以100:0的戰績戰勝了和李世乭下棋時的AlphaGo,經過40天的訓練後,則可以打敗與柯潔下棋時的AlphaGo。

2016年3月,AlphaGo大戰李世乭

論文介紹了AlphaGo Zero是從零開始學習,人類的輸入僅限於棋盤和棋子,在學習開始階段無需先學習人類選手的走法,單純基於與自己的對弈就無師自通。新的程序僅用到一張神經網路,這張網路經過訓練,專門預測程序自身的棋步和棋局的贏家,在每次自我對弈中進步,過程只使用一台機器和4個TPU。在訓練過程最開始,AI落子完全是隨機的,AlphaGo團隊的負責人David Silver透露,它一開始甚至會把開局第一手下在1-1。在和自己對弈的過程中,演算法才逐漸掌握了勝利的秘訣。

通過幾天的訓練和包括近500萬局自我對弈,AlphaGo Zero便能超越人類,並打敗所有之前的AlphaGo版本。隨著程序訓練的進行,它獨立發現了人類用幾千年才總結出來的圍棋規則,還建立了新的戰略,為這個古老的遊戲帶來新見解。

人工智慧的最大挑戰是研發一種能從零開始、以超人類的水平學習複雜概念的演算法。正是由於這個原因,AlphaGo Zero的出現引起了巨大的關注。這是否是人工智慧發展的又一里程碑?是否意味著人工智慧奇點的到來又近了一步?AI從此是否可以完爆人類?

但是,不少計算機專家看來,雖然AlphaGo Zero在演算法上比前幾個版本進步很大,但並沒乍看之下那麼偉大。

曠視科技首席科學家孫劍、AlphaGo Zero裡面最核心使用的技術ResNet的發明者,在接受採訪時表示,AlphaGo Zero的無師自通能力,「偉大與局限並存」。孫劍認為,說它是」無監督學習「有點不對。「如果仔細看這個系統,它還是有監督的。不是來自棋譜,而是圍棋規則所決定的最後誰輸誰贏這個信號。」

所以,從這個意義上說,AlphaGo Zero不是百分之百絕對的無師自通,而是通過這個規則所帶來的監督信號,是一種非常弱監督的增強學習。孫劍還進一步強調:「但是同時這種無師自通在很多AI落地上也存在一些局限,因為嚴格意義上講,圍棋規則和判定棋局輸贏也是一種監督信號,所以有人說人類無用、或者說機器可以自己產生認知,都是對AlphaGo Zero錯誤理解。」

南京大學計算機教授周志華也公開發表類似觀點稱:「別幻想什麼無監督學習,監督信息來自精準規則,非常強的監督信息。……目前並非普適,只適用於狀態空間探索幾乎零成本且探索過程不影響假設空間的任務。」

但AlphaGo Zero的局限性並不影響它成為一篇經典的論文。正如創新工場AI工程院副院長王詠剛評價,這篇論文「沒有提出任何新的方法和模型,但是徹底地實現了一個簡單有效的想法「,可謂是「大道至簡」。這種簡化,一方面體現在把原來的策略網路和價值網路合併成一個網路,簡化了搜索過程;另一方面體現在用深度殘差網路(ResNet)來對輸入進行簡化,以前需要人工設計棋盤的輸入,體現「這個子下過幾次、周圍有幾個黑子幾個白子」這樣的信息,而現在是「把黑白子二值的圖直接送進來,相當於可以理解成對著棋盤拍照片,把照片送給神經網路,讓神經網路看著棋盤照片做決策」。

這意味著,深度神經網路的特徵提取能力以及尋找更優解的能力更進一步,類似的深度強化學習演算法,或許能更廣泛地應用到其他人類缺乏了解或是缺乏大量標註數據的領域。這一次,演算法贏了大數據,,證明了在理論上理解深度學習演算法的重要性,強化學習是未來的方向。

那麼人類呢?真如柯潔發博所稱:「對於alphago的自我進步來講,人類太多餘了。」人類從此無用嗎?

Xtecher相信,在人工智慧以前所未有的速度發展的今日,人類依舊可以利用AI科技帶來一個更好的未來。別忘了,即使有天AI完爆人類,AI演算法依舊是人類智慧的產物。

━━━━━

封面來源:網路 排版:Forest 校對:Forest

━━━━━

如果您有國內外科技行業新鮮資訊或獨到見解,歡迎與Xtecher聯繫

Xtecher官網平台現開通認證作者,

(添加好友請註明公司、職位、事由)


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 Xtecher 的精彩文章:

第三期CSIG圖像圖形學科前沿講習班即將開講,附詳細日程

TAG:Xtecher |