最強對決：谷歌AlphaGo 5月決戰柯潔

新聞 04-10

機器之心報道

參與：李亞洲、李澤南、吳攀

4月10日下午，谷歌在北京的中國棋院召開新聞發布會，正式宣布AlphaGo將於今年5月23日在浙江烏鎮對決以柯潔為代表的中國頂尖棋手。

最強對決：谷歌AlphaGo 5月決戰柯潔

據機器之心現場了解，中國圍棋協會和浙江省體育局攜手谷歌三方將聯合主辦「中國烏鎮·圍棋峰會」。本次峰會將從5月23日至27日在浙江烏鎮展開，除AlphaGo與柯潔的三番棋對戰之外，還將舉辦配對賽和團體賽兩場形式不同的交流比賽。

配對賽中，兩位棋手將分別與AlphaGo組隊，挑戰棋手如何去理解AlphaGo的獨特風格並與之合作；在團隊賽中，將有五位中國頂尖棋手合作，建立棋手「神經網路」，降低心理因素的影響，從而做出更加客觀的判斷。

在發布會現場，柯潔表示，「能與 AlphaGo 對陣是我的榮幸，但我一定會擊敗 AlphaGo」。據悉，此次比賽的獲勝獎金為 150 萬美元。

最強對決：谷歌AlphaGo 5月決戰柯潔

離AlphaGo和李世乭的「人機大戰」已經過去了一年，AlphaGo與柯潔的對弈是業內期待已久的一場對決。去年AlphaGo與世界圍棋冠軍李世乭的比賽引起了極大的關注，人機對戰成為人工智慧領域的熱門話題。不久之前，斬獲UEC杯計算機圍棋大賽冠軍的騰訊人工智慧系統「絕藝」，在東京舉行的第五屆「電聖戰」世界人機大戰中戰勝了日本圍棋界的新銳棋手一力遼七段（世界排名第44位，日本第2）。

谷歌和DeepMind對於圍棋的探索並未隨著去年和今年初的兩次「亮相」而結束，由於圍棋近乎無窮的變化，人類棋手在千百年戰術發展的過程中似乎並未觸及圍棋的本質，DeepMind的研究者一直將目標定為探索圍棋的極限。DeepMind 官方發布的 2016 年度總結中寫道，「最激動人心的莫過於 AlphaGo 博弈過程中所呈現出來的創造力，有時，它的棋招甚至挑戰了古老的圍棋智慧。圍棋，這一古往今來最富深謀遠慮的遊戲之一，AlphaGo 可以識別並分享其中洞見。」

此前，AlphaGo在2016年3月與前圍棋世界冠軍，韓國棋手李世乭九段在韓國首爾進行了五次對決，並4比1獲勝，第一次在正式比賽環境中戰勝了人類頂尖棋手。AlphaGo因此而獲得了韓國棋院頒發的「名譽九段」證書。在沉寂了一段時間後，去年末，AlphaGo以「Master」為名出現在騰訊野狐網上圍棋平台中，與中日韓三國頂尖棋手進行了一系列網上快棋對決，並實現了60勝0負的完美戰績。

顯然，AlphaGo並不滿足於線上圍棋平台的勝利，谷歌方面很早就與中國棋院達成了一致，準備於今年舉行新一輪的圍棋人機大戰。去年12月，谷歌聯合創始人、Alphabet總裁謝爾蓋·布林和谷歌CEO皮查伊（Sundar Pichai）一同造訪中國棋院，觀摩了棋手訓練，並與「棋聖」聶衛平九段及中國圍棋隊總教練俞斌九段進行了交流。

2016年12月31日，柯潔在微博上表示：

「我從（2016年）3月份開始到現在研究了大半年的棋軟，無數次的理論、實踐，就是想知道計算機究竟強在哪裡。昨晚輾轉反側，不想竟一夜無眠。人類數千年的實戰演練進化，計算機卻告訴我們人類全都是錯的。我覺得，甚至沒有一個人沾到圍棋真理的邊。但是我想說，從現在開始，我們棋手將會結合計算機，邁進全新的領域達到全新的境界。新的風暴即將來襲，我將盡我所有的智慧終極一戰！」

AlphaGo升級版

去年1月28日，Nature雜誌以封面論文的形式介紹了DeepMind團隊開發的人工智慧程序AlphaGo，這也就是後來擊敗韓國棋手李世乭的AlphaGo版本。據此次發布會提供的信息，今年年初席捲中國圍棋界的「Master／Magister」是AlphaGo的升級版本，但它下的是快棋，與此次對決的規則不同。

AlphaGo結合了監督學習與強化學習的優勢。通過訓練形成一個策略網路，將棋盤上的局勢作為輸入信息，並對有所可行的落子位置形成一個概率分布。然後，訓練一個價值網路對自我對弈進行預測，以-1（對手的絕對勝利）到1（AlphaGo的絕對勝利）的標準，預測所有可行落子位置的結果。AlphaGo將這兩種網路整合進基於概率的蒙特卡羅樹搜索（MCTS）中，實現了它真正的優勢。

最強對決：谷歌AlphaGo 5月決戰柯潔

在獲取棋局信息後，AlphaGo會根據策略網路（policy network）探索哪個位置同時具備高潛在價值和高可能性，進而決定最佳落子位置。在分配的搜索時間結束時，模擬過程中被系統最繁瑣考察的位置將成為AlphaGo的最終選擇。在經過先期的全盤探索和過程中對最佳落子的不斷揣摩後，AlphaGo的探索演算法就能在其計算能力之上加入近似人類的直覺判斷。

最強對決：谷歌AlphaGo 5月決戰柯潔

據了解，新版的AlphaGo產生大量自我對弈棋局，為下一代版本提供了訓練數據，此過程循環往複。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 機器之心 的精彩文章:

※深度學習和量子物理的共同點，或可用物理學打開深度學習黑箱
※解讀｜合成梯度，不需反向傳播的深度學習
※將多代理路徑尋找推廣到真實世界應用：四大研究方向概覽
※解讀｜藝術家如何藉助神經網路進行創作？
※機器學習和深度學習引用量最高的20篇論文：2014-2017

TAG:機器之心 |

您可能感興趣

※從最強棋手柯潔決戰AlphaGo說起，開扒AI的前世今生
※終極人機大戰：「最強棋手」柯潔明天對戰 AlphaGo
※「最強棋手」柯潔明天對戰AlphaGo：贏了獎金1000萬！
※誰最強？小米6、華為P10、iPhone 7Plus最佳雙攝對比！
※LOL最強中單對決來了！Faker和Dopa最強英雄誰更牛？
※最強X399主板！華碩曝玩家國度Zenith Extreme：AMD 16核心絕配
※Computex 2017：華碩展示最強ROG筆記本
※soccersouls：歐聯杯決賽最強4-3-3陣容預測
※2017年格萊美「最強Diva」決戰倒計時！是一開嗓就淪陷的Adele，還是唱跳俱佳的孕媽Beyonce？
※MacBook Pro 2016 最強補完－Satechi 最新 Type-C Pro Hub 設計
※「最強棋手」柯潔明天對戰AlphaGo：獎金高達1000多萬
※Apple Watch 3或亮相秋季發布會，成蘋果8最強配角
※SKE48的最強body
※「Metallic Gold」配色發售鎖定，夏日Air Foamposite Pro 最強期待
※三星S8今年最強競爭對手不是蘋果iPhone 8？
※《Running Man》Last最強者戰：再現7012的感動
※擊敗最強棋手的AlphaGo究竟是什麼
※E-Class 最強－全新 Mercedes-AMG E63 S 正式發售
※9699元！NVIDIA Titan Xp國內開訂：地表最強「核彈」