AlphaGo大戰柯潔,是這麼一回事
5月23日,千年水鄉烏鎮將迎來一場舉世矚目的圍棋峰會。在為期一周的峰會中,「世界第一圍棋AI」AlphaGo將與中國圍棋職業九段棋手柯潔對弈三場。並與其他知名中國棋手一起進行團隊賽和配對賽。AlphaGo是什麼?為什麼這場對決會如此受人關注?這篇文章會為你梳理事情的全貌。
AlphaGo是什麼?
AlphaGo是由英國Google DeepMind公司開發的圍棋人工智慧程序。它可能是有史以來最強大的圍棋棋手。
圖片來源:deepmind.com
DeepMind公司於2010年由傑米斯·哈薩比斯(Demis Hassabis)博士、沙恩·萊吉(Shane Legg)博士和穆斯塔法·蘇雷曼(Mustafa Suleyman)共同創立。其中,哈薩比斯和萊吉相識於倫敦大學學院蓋茨比計算神經科學組。
與其說是一間創業公司,DeepMind看起來更像是一家致力於新技術的實驗室。他們的項目包括創造一個能夠以和人類一樣的方式「學習」如何玩遊戲並達到高水平的人工智慧。在只用原始像素和遊戲得分作為輸入數據的情況下,他們的程序學會了包括《乓》(Pong)和《打磚塊》(Breakout)在內的多種遊戲的玩法,並達到了超人的水平。
2014年,DeepMind被谷歌以4億美元收購。同年,AlphaGo項目誕生,開始一步步向圍棋遊戲的巔峰發起挑戰。
「在『深藍』戰勝卡斯帕羅夫之後,圍棋就成了遊戲AI最後的聖杯。」哈薩比斯說。圖片來源:blog.google
AlphaGo和人下圍棋戰績如何?
在已公開的賽事中,AlphaGo與人類圍棋選手較量的戰績是——69勝1負。
2015年10月,AlphaGo在沒有任何讓子的情況下,以5:0的懸殊比分擊潰歐洲圍棋冠軍樊麾二段。
2016年3月,韓國職業棋手李世石九段迎戰AlphaGo,以1:4不幸敗北。此戰之初,柯潔曾斷言李會以5:0的比分大勝,AlphaGo毫無勝算。但在李世石輸掉第三盤後,柯潔也不得不承認計算機的實力強大。表示「跟AlphaGo下的話,同樣的條件下,我輸的可能性非常大」。
2016年12月,神秘棋手「Master」登錄中國弈城圍棋網,以每天十盤的速度接連擊敗中外各大頂尖棋手,取得了空前絕後的60連勝。人們耳熟能詳的職業棋手如古力、常昊等紛紛被斬落馬下,柯潔也不幸成為它的手下敗將。在輸給Master後,柯潔身體抱恙住院。2017年1月4日,AlphaGo團隊公布「Master」背後正是升級版AlphaGo的這一事實。
柯潔用「震撼」來形容AlphaGo帶給圍棋界的感受,但同時也表示人類還會變得更強。
在烏鎮的圍棋峰會上,柯潔將在5月23日、5月25日和5月27日三天各與AlphaGo交鋒一局。這三番棋的勝負將會如何呢?
大家怎麼看AlphaGo這次對決柯潔?
考慮到人工智慧在網路快棋中的先天優勢,目前人們仍未能斷言AlphaGo在允許人類思考更長時間的慢棋中表現同樣良好。不過,談及烏鎮圍棋峰會上柯潔對陣AlphaGo的可能結果,人類棋手表現得非常悲觀。
中國「棋聖」聶衛平表示,他認為柯潔會被0:3擊潰。古力九段認為,如果柯潔發揮出100%的狀態,那麼他也許有5%的勝率。而曾經狂傲地認為「阿爾法狗戰勝不了我」的柯潔,也謙虛地表示:「這次能代表人類出戰是我的榮幸,我將盡全力去爭勝,一決勝負,抱有必勝的信念和必死的決心,不輕易言敗。」
古力(左一)、樊麾(左三)、聶衛平(右二)、柯潔(右一)與谷歌CEO桑德爾·皮蔡(左二)一起探討AlphaGo的棋藝。圖片來源:deepmind.com
哈薩比斯則在博客中期待柯潔能將AlphaGo的表現逼到極限,乃至超越極限。同時,由陳耀燁九段、周睿羊九段、羋昱廷九段、時越九段和唐韋星九段組成的團隊也會與AlphaGo進行一場較量。哈薩比斯希望他們能夠測試AlphaGo的創造力和適應能力到底在什麼水平。
AlphaGo到底是怎麼下棋的?
在一局圍棋中,平均每一步的下法大約有200種可能。棋盤上可能出現的局面總數到了遠大於宇宙中原子總數的地步。因此,通過暴力窮舉手段預測所有的可能情況並從中篩選中最優勢走法的思路,並不適用於圍棋AI。
圍棋棋盤上出現的可能局面數遠大於宇宙中的原子數量。圖片來源:Deepmind
AlphaGo選擇了別的下棋方式。支撐AlphaGo提高棋力、打敗人類選手的「秘訣」 有三個:深度神經網路、監督/強化學習、蒙特卡羅樹搜索。
深度神經網路是包含超過一個認知層的計算機神經網路。對於人工智慧而言,世界是被用數字的方式呈現的。人們將人工智慧設計出不同的「層」,來解決不同層級的認知任務。這種具備許多「層」的神經網路,被稱為深度神經網路。AlphaGo包含兩種深度神經網路:價值網路和策略網路。價值網路使得AlphaGo能夠明晰局勢的判斷,左右全局「戰略」,拋棄不合適的路線;策略網路使得AlphaGo能夠優化每一步落子,左右局部「戰術」,減少失誤。兩者結合在一起,使得AlphaGo不需要過於龐大的計算也能夠走出精妙的棋局,就像人類一樣。
監督學習和強化學習是機器學習方式的不同種類。監督學習是指機器通過人類輸入的信息進行學習,而加強學習是指機器自身收集環境中的相關信息作出判斷,並綜合成自己的「經驗」。在初始階段,AlphaGo收集研究者輸入的大量棋局數據,學習人類棋手的下法,形成自己獨特的判斷方式。之後,在不計其數的自己與自己模擬對弈,以及每一次與人類棋手對弈中,AlphaGo都能並根據結果來總結並生成新的範式,實現自我提高。
最後,蒙特卡洛樹是一種搜索演算法。AI在利用它進行決策判斷時,會從根結點開始不斷選擇分支子結點,通過不斷的決策使得遊戲局勢向AI預測的最優點移動,直到模擬遊戲勝利。AI每一次的選擇都會同時產生多個可能性,它會進行模擬運算,推斷出可能的結果再做出決定。
AlphaGo中的蒙特卡羅樹搜索流程。圖片來源:Nature
除了AlphaGo,圍棋AI哪家強?
依賴於上述三大「武器」,AlphaGo成為了目前人類製造出來的最為優秀的圍棋AI。連敗人類棋手的勝績就是明證。但除了它之外,世界各國也開發過不同的遊戲AI,向圍棋這一智力上的「絕對領域」發起挑戰。
法國研發的Crazy Stone(狂石),日本研發的Zen(天頂)都曾是這一領域的翹楚。它們都曾經給人類造成過威脅,但從未像AlphaGo一樣將最頂級的人類棋手打的一敗塗地。在AlphaGo一舉走紅之後,人工智慧界對圍棋AI的研發熱情空前高漲。
Zen的改良版DeepZenGO在2017年3月參加了日本舉辦的「世界最強棋手決定戰」,先後負於中國棋手羋昱廷九段和韓國棋手朴廷桓九段後,戰勝日本棋手井山裕太九段,取得第三名的成績。
由中國騰訊公司研發的圍棋AI「絕藝」(Fine Art)於2016年3月後完成,同年8月23日首次戰勝職業棋手。11月2日,絕藝戰勝世界冠軍江維傑九段。11月19日,絕藝與柯潔九段交手,取得了一勝一負的成績。如今,絕藝對世界冠軍和全國冠軍的勝率,已經能夠維持在90%以上了。
弄一個誰都打不過的圍棋AI,有什麼用?
在多年的嘔心瀝血後,AlphaGo和一系列崛起的圍棋AI一起成為了圍棋界新的高峰。毋庸置疑,它們的下棋方式會改變人們目前對圍棋下法的觀念。許多曾經的定勢將會被打破,新的格局即將開始。也許在若干年後的圍棋教科書上,流傳多年顛撲不破的真理將會被改寫。可是,花了那麼多人力物力,研究者們想做的,就只是這樣一個能夠下贏人類的AI嗎?
當然不是。
AlphaGo是一個標誌。它的誕生,意味著人們對人工智慧的探索已經到達了一個新的階段。造就AlphaGo的學習模式,將被推廣到各種領域,譬如面孔識別,語音識別等等。造就AlphaGo的核心技術,也許還能在其他領域同樣的幫助我們。
儘管不如AlphaGo那麼有名,但DeepMind研製的AI已經在為谷歌公司服務了。他們出品的人工智慧幫助谷歌減少了40%在機房冷卻系統上的花費。他們還希望能夠與英國國家電網合作,利用人工智慧將英國的能耗減少10%。
AlphaGo和它的同伴們能走多遠?這件事,可能還要時間給我們答案。不管你願不願意承認,人工智慧的時代已經慢慢到來了。在國際象棋、在圍棋、在你所知道的任何一個領域,都會慢慢湧現出能過代替人類的人工智慧。
柯潔在比賽前夜談及人工智慧。圖片來源:新浪微博
這是好事還是壞事?沒有人能夠預測。但無論人們是不是喜歡這個事實,新的時代已經降臨了。(編輯:姜Zn)
來源:


※為了吞下有毒毛毛蟲,大杜鵑連雞胗子都吐出來了!
※現在你可以和綾波麗並肩作戰了!試試用VR開EVA
※別再妄自菲薄了!人類的嗅覺可沒那麼差
※狗子為什麼對著人嗷嗷叫?因為我們真的懂!
※不用墨水,就能列印出精細的色彩!
TAG:果殼網 |
※人工智慧AlphaGo Zero是一個突破,那它呢?
※柯潔和AlphaGo曾經的對戰前瞻
※實現通用人工智慧還要多久?Hinton與AlphaGo之父這樣回答
※馬庫斯再談AlphaGo Zero不是從零開始,AGI可能需要這十大先天機制
※詳解AlphaGo到AlphaGo Zero!
※想當AlphaGo的 Open AI,玩刀塔時為何又慘敗給人類了?
※AlphaGo「兄弟」AlphaFold出世,DeepMind再創記錄
※打敗柯潔的AlphaGo有了繼任者AlphaZero 國際象棋/圍棋/將棋通殺
※AlphaGo之父DeepMind再出神作,PrediNet原理詳解
※最小化類 AlphaGo Zero 引擎——Nochi
※AlphaGo後再出神作!DeepMind打造AlphaFold擊敗人類,精度碾壓人類專家!
※受AlphaGo啟發,AI重建量子系統新方法登上Nature Physics
※AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
※如何評價 AlphaGo Zero?
※與前輩Alphago相比,openAI現在還只是個弟弟
※生物界「AlphaGo」來了!蛋白結構預測AlphaFold大勝傳統人類模型
※Tomaso Poggio解析下個「AlphaGo」線索,再談「深度學習鍊金術」
※一天出道職業哥100次 OpenAI要做打遊戲界的AlphaGo
※為什麼AlphaGo會掀起AI浪潮
※AlphaGo Zero代碼遲遲不開源,TF等不及自己推了一個