柯潔與AlphaGo今日首戰:不輕易妥協、不輕易言敗
5月23日-27日,在中國最負盛名的水鄉古鎮、世界互聯網大會永久會址——浙江桐鄉烏鎮,中國圍棋協會和浙江省體育局將攜手谷歌共同舉辦「中國烏鎮圍棋峰會」。人工智慧和人類棋手的對決將作為峰會的一個重要環節亮相,谷歌AlphaGo今日將對決圍棋世界冠軍中國棋手柯潔。
比賽的賽制
從23號開始,圍繞人機對戰將舉辦五場賽事,採用三種賽制。
一、AlphaGo VS 柯潔的三番棋賽制:
無論輸贏雙方必須要下滿三局,每方將有3小時時間,用時結束後將有5次1分鐘讀秒。
二、人機配對賽:
2位中國棋手將分別與AlphaGo組隊,每方1小時,用時結束後將有1次1分鐘讀秒。
出戰棋手:連笑八段,古力九段
三、團隊賽:
五位中國棋手將組成團隊,對決AlphaGo,每方2.5小時。用時結束後將有3次1分鐘讀秒。出戰棋手:羋昱廷九段,時越九段,唐韋星九段,周睿羊九段,陳耀燁九段。
賽事的獎金
根據主辦方披露,如果柯潔獲勝將獲得150萬美金,出場費是30萬美金。
在AlphaGo去年戰勝李世石九段之後,今年年初,阿爾法圍棋的「替身」——Master(大師)在網上快棋對戰中日韓高手,竟取得了「60連勝」的驚人戰績。這一次人們將希望寄托在賽制上,「60連勝」採用的是快棋戰,而此次烏鎮對決採用的每方3小時的慢棋對戰。據稱,這種賽制將有利於人類發現AI的弱點,從而實現逆轉。
實際上,進入五月,柯潔九段先後參加了新奧杯世界賽和中國圍甲聯賽進行賽前備戰。柯潔在這兩項大賽中共下了8盤棋,成績是6勝2負。在這8盤棋中,柯潔九段嘗試了幾種對付阿爾法圍棋的新戰法。
自人機大戰第一季以來,AlphaGo已經為圍棋這個古老的遊戲開啟了新紀元。對局中,AlphaGo顯示了獨特的創造性,使用了一些前所未有的招法。這甚至促使職業棋手和圍棋愛好者在對局中嘗試人工智慧曾使用的招法和戰術。千百年來的圍棋常識,在新的思考中被更新。
人機大戰第二季,柯潔九段表示:「我站在歷史變革的節點,很幸運能見證AlphaGo這樣強大的對手,我會盡最大努力下好自己的棋,不會輕易妥協,不會說輸了無所謂。我抱有必勝心態、必死信念,不會輕易言敗。作為棋手,從來只有輸和贏。輸棋痛苦外人無法想像,只有勝利是唯一真諦,所以我會不惜一切手段去爭取勝利,不惜我的一切,真的,去拼了!」
AlphaGo為何如此兇猛?
1、AlphaGo如何進行訓練?
一直以來,圍棋就被認為是傳統遊戲中對人工智慧最具挑戰性的項目。這不僅僅是因為圍棋包含了龐大的搜索空間,更是因為對於落子位置的評估難度已遠遠超過了簡單的啟發式演算法。
為了應對圍棋的巨大複雜性,AlphaGo 採用了一種新穎的機器學習技術,結合了監督學習和強化學習的優勢。通過訓練形成一個策略網路(policy network),將棋盤上的局勢作為輸入信息,並對所有可行的落子位置生成一個概率分布。然後,訓練出一個價值網路(value network)對自我對弈進行預測,以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標準,預測所有可行落子位置的結果。這兩個網路自身都十分強大。而 AlphaGo將這兩種網路整合進基於概率的蒙特卡羅樹搜索(MCTS)中,實現了它真正的優勢。最後,新版的AlphaGo 產生大量自我對弈棋局,為下一代版本提供了訓練數據,此過程循環往複。
2、AlphaGo 如何決定落子?
在獲取棋局信息後,AlphaGo 會根據策略網路探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。在分配的搜索時間結束時,模擬過程中被系統最頻繁考察的位置將成為 AlphaGo 的最終選擇。在經過先期的全盤探索和過程中對最佳落子的不斷揣摩後,AlphaGo的搜索演算法就能在其計算能力之上加入近似人類的直覺判斷。
3、AlphaGo有怎樣的棋風?
AlphaGo最強大的地方,並不體現在具體某一手棋或者某個局部變化中,而是它在每一局棋里所展現出來的獨特視角。雖然AlphaGo的棋風本身並不容易總結,但是總體來說,AlphaGo更傾向於使用一種自由、開放式的行棋風格。
在它的世界裡,沒有什麼先入為主的概念,也沒有什麼必須要遵守的規則,這讓它得以打破常規,發現當前棋局中最高效的一手。在接下來的兩局棋里,AlphaGo這種獨特的對局哲學,常常讓它下出違反第一感、但卻極具威力的一手棋。
雖然圍棋是圍地盤的遊戲,但事實上最具決定性的部分在於如何平衡棋盤上的各個局部。在這一點上,AlphaGo展現出了卓越的能力。尤其值得一提的是,AlphaGo對於外勢的把控可以說達到了出神入化的地步。具體來說,它可以近乎準確地判斷棋盤上現有棋子能給周圍區域帶來多大的影響力。
雖說棋子的影響力本身很難衡量,但是AlphaGo強大的價值網路讓它能夠把棋盤上所有的棋子當作一個整體來考慮,因此它的判斷幾近精確。AlphaGo的這種能力,使得它能夠把局部棋子的影響力,轉變為全局的優勢。
對於這場比賽,柯潔於昨夜發微博長文《最後的對決》原文如下
《最後的對決》
決戰前夕,感慨萬千……
在這個特殊的時間,我有些話想和熱愛圍棋、關注圍棋、關注我的朋友們說:
無論輸贏,這都將是我與人工智慧最後的三盤對局。
很多人可能會問為什麼?
其實私底下我已經與朋友家人說了很多次這樣的想法,現在的AI進步之快遠超我們的想像。像國產的絕藝、日產的ZEN雖然和AlphaGo還有著較大差距,但已經表現出超強的實力了……我相信未來是屬於人工智慧的。
可它始終都是冷冰冰的機器,與人類相比,我感覺不到它對圍棋的熱情和熱愛。對它而言……它的熱情——也只不過是運轉速度過快導致CPU發熱罷了。
我會我用所有的熱情去與它做最後的對決,不管面對再強大的對手——我也絕不會後退!至少這……最後一次……
拼盡全力後,無論結果...管他口中是是非非,來一首《滄海一聲笑》……豈不美哉、快意?我淡然笑到……
不眠夜,且看且珍惜,請大家欣賞我最後的三盤人機大戰。
柯潔與AlphaGo 首戰結果競猜
本頁刊發內容及圖片整理自網路
※GMIC 北京 2017「小郵差看世界之文藝座談會」 對話之「教授張首晟:中國進入科學、文化復興時代」
TAG:長城會 |
※柯潔和AlphaGo曾經的對戰前瞻
※打敗柯潔的AlphaGo有了繼任者AlphaZero 國際象棋/圍棋/將棋通殺
※擊敗柯潔的「AlphaGo」登上今日Science:人工智慧除了創造新材料還能預測化學反應性能
※巔峰期的李昌鎬、李世石和柯潔,誰能擊敗第一代Alpha Go?
※華為Mate 20首銷火熱,AI智慧使柯潔瘋狂打Call
※柯潔對戰中國版AlphaGo 再次不敵AI;小米管理層變動 兩位聯合創始人辭職
※柯潔再次成為圍棋 AI的benchmark,這次讓二子也落敗
※柯潔再次成為圍棋 AI 的 benchmark,這次讓二子也落敗
※羅永浩語出驚人懟iPhone;人機大戰柯潔再敗|CSDN極客頭條
※早報:柯潔對戰中國AlphaGo,地平線推基於征程2.0的計算平台
※那個大戰AlphaGo的柯潔,將免試入讀清華大學工商管理專業
※AlphaGo會怒砸柯潔才是真正的智能?貝索斯說亞馬遜終將倒下;斯坦·李勸你遠離蠢貨
※柯潔再戰人工智慧 「食言」不戰AI言論!
※人機大戰柯潔不敵國產圍棋AI;亞馬遜Alexa智商重大升級
※柯潔:夢中才能戰勝AI 有時真不願醒來
※柯潔又一次輸了人機大戰:不敵國產AI 直言太無力
※【AI】柯潔坦承:AI計算和判斷全都在我之上 總是有無力感
※人機大戰又來了:柯潔再戰機器人,0:3負阿爾法狗稱再不跟AI下棋
※鬥不過AI要拜其為師 柯潔:現在學編程來得及嗎
※柯潔夢醒發文:夢中才能戰勝AI 有時真不願醒來