當前位置:
首頁 > 新聞 > 想贏「近乎上帝」的阿爾法狗,柯潔必須這樣

想贏「近乎上帝」的阿爾法狗,柯潔必須這樣

文/觀察者網專欄作者 陳經

2017年5月23日上午10:30,廣大棋迷與人工智慧愛好者非常關注的柯潔與AlphaGo的三番棋首局終於開打。經過4個小時的戰鬥,柯潔執黑以1/4子的最小差距負於AlphaGo,三番棋暫時以0:1落後。這盤棋有哪些看點?AlphaGo又展示了哪些新東西?

一個很受觀眾關注的問題是,與柯潔對弈的AlphaGo是不是從零開始訓練,沒有受人類棋譜「污染」的「純凈」版本?賽後發布會,Deepmind負責人哈薩比斯回答說,並不是!它是在年初快棋60:0戰勝人類高手的Master基礎上的升級版。而且,這次用的只是單機版,而非與李世石對戰的分布式版本。這個單機版由於有10塊黑科技TPU(據說一個TPU相當於15-30個GPU),所以這個「單機版」算力並不差。騰訊開發的絕藝,實力排圍棋AI第二,用的只是GPU,在硬體技術上和AlphaGo有差距。這次AlphaGo雖然是單機版,但以每步一分鐘的節奏下棋,比Master的思考時間要多十倍,計算力是足夠的。總的來說, 這次的AlphaGo從軟體硬架構上來說,應該就類似於Master,並沒有再次創新,但自我訓練實力有小的提升。但相對於去年與李世石對戰的版本,無論是演算法還是硬體都有巨大的創新,實力要強得多。

對局中AlphaGo的表現也確實和Master差不多,在局面領先後,它慢慢將差距送成了最小差距的1/4子(相當於1.5目 勝)。我在對局中看到AlphaGo的著法,就提前預測最後會是1-2目的差距,其實當時領先優勢應該是一個貼目(7目左右)。雖然最後柯潔顯得是以最小差距「憾負」,但職業棋手們認為,AlphaGo本局展現的實力,領先柯潔是有一先的(也就是一個貼目)。但這並不是說柯潔發揮不好,他發揮得其實不錯。對比去年李世石,面對實力要差得多的AlphaGo版本,本局柯潔的表現要好得多。

5月27日筆者將做客觀天下講壇「人工智慧革命,中國距離世界第一還有多遠」,希望有機會能跟大家更為深入地就「人機大戰」、「AlphaGo」、「人工智慧」進行探討。下面介紹本局的一些關鍵點。

一.開局

柯潔在與人類對手的實戰中,連續七八局試用了開局佔三三、點三三的手法,有相當的心得。本局我就發微博預測他會開局點三三,果然他在第3手佔三三,第七手對白星位點三三。

這幾手說明柯潔是有精心的準備的,而且提前演練了。以下是柯潔的預想圖:

柯潔的預想圖

這個變化實際是Master下出來的,黑棋奪掉了白星位一子的根據地,還能夠利用8位點的弱點,對白一串進行攻擊。面對柯潔的「以其人之道還治其人之身」,AlphaGo會如何應對呢?AlphaGo給出了答案。

AlphaGo針鋒相對的預想圖

AlphaGo沒有下在R5位扳,而是下在三角位,這是AlphaGo的預想圖,黑1位托3位頂這樣定型。與柯潔的理想圖相比,白棋的外勢更為完整,P6位很難說是弱點了。可以預期,以後碰到開局點三三,棋手都會用這招應對。柯潔在這個局部變了個次序,但並沒有得到好結果。

實戰結果

實戰柯潔11位先頂,再13位扳,遭到了白R2位(後來被吃)的反擊。最後19位的黑子被白22征掉了!碰巧的是,左上角黑三三一子,沒有引到征,而如果這個子在星位上,白就征不掉黑棋了。黑棋兩個三三的組合手段,換來這個局面,應該說沒有實現戰略意圖。黑占的角並不大,而白吃掉19這個子後外勢很厚,特別是24這手很有想法,注重中央的戰鬥。AlphaGo相對於人的優勢就是利用厚勢的能力,應該說開局黑的三三戰術落空了。

二.左上角的戰鬥AlphaGo可能虧了?

AlphaGo26位打入,28跳起再30位罩,這個手法人類棋手不太能想到。而白34粘,讓黑35位挺出,這個感覺相當異常。應該會有相當多的職業棋手不贊同AlphaGo的選擇,白兩塊被完全分斷,感覺黑棋主動。

AlphaGo選擇了吃角,中間四子基本被吃。這個局面白這四子是不敢跑的,因為黑有F18位左右的借用,白跑會被黑追殺得特別慘。行棋到此感覺黑應該是不落下風的,一些圍棋AI對此局面的勝率評估也認為此時黑並不落後,開局吃虧後,黑挽回了局勢。但是柯潔局後說,他本來是想「先撈後洗」(先搶佔實地,讓白做模樣,黑衝進去搗亂找機會),佔兩個三三就說明這個意圖非常明顯。但是這個局部下來,白棋反而吃掉了黑左上角。考慮到左上角本是黑的三三,三三被吃掉的局面極其罕見。所以這個局面白棋反而撈了實地,柯潔需要利用厚勢作戰,不是他的意圖。這就是Master的典型棋風,看著它是厚勢作戰,但一有機會它就變現轉實地,不會搞看不太清的寵大模樣。

三.柯潔非常可能的敗招與AlphaGo的勝招

AlphaGo沒有盲目動出四子,而是搶了48位大棋,黑49打入是眼見的好手。這時白下了50位騷擾。柯潔這時可能心理上稍有一點鬆勁,選擇了51位吃死消除不安定因素,而不是54位粘繼續緊繃局面。AlphaGo在52位尖頂後,下出了令柯潔本人在內的不少職業棋手佩服的好棋,54位斷!

這招棋本身是後手。白從F13扳動出跑不了,在B12跑也會被黑A12扳快一氣吃死。那這招的好處是什麼?讓柯潔局後非常佩服的是,這招棋韻味深長,雖然是後手,但是以靜制動,能發揮極大作用。有了54這手切斷,白在B9是先手能在左中部做一排厚勢支援左下部。另一方面,白也可以選擇在G10位跳,在靠近中央的地方做出一排厚勢。對白這四個死子的利用非常靈活。

柯潔意識到局面不利,怕白棋左下角實空太大(黑實空本來就不領先,中間的厚味又被白54限制住了),就急躁恨空地在55位打入了。白56位立,這一手就決定了白棋的優勢,其它AI的判斷也是白優勢了。因為白有中間的借用,黑活左下角以後,49、53兩子會被攻擊,很難有生路了。白棋彷彿所有子力都配合起來,讓黑這兩子異常困難。

四.AlphaGo優勢下的穩健運轉

面對難局,應該說柯潔表現不錯,使出了69靠、71扳的靈活手段。結果黑棄掉兩子,中間大塊通過83斷回家,維持住了局面。行棋至此,不少棋手和觀眾感覺局面還早,勝負在後面。

但是AlphaGo可能對局面評估更為準確。白下方與左上角的空是比較實在的,而黑右上角三子虛虛的形勢價值多少卻不好說。實際上,白84手的打入正擊中了黑棋的弱點,在白下面厚勢的影響下,黑棋在此圍不到多少空,落後的局面迅速就要明朗化。

左上角的結果,白棋又撈了十餘目實地擴大了實地優勢,黑只收穫了一道有缺陷的外勢。白84子在P15打後有餘位。柯潔97位令不少人感到奇怪,但其實是沒有辦法。不下在中間,白吊這裡,利用84的餘味以及白N5切斷黑三子的手段,黑中間會很慘。這時白悠然拆在98位,職業棋手應該基本看清了白必勝的局面。

98這手進得不深,黑如果L17拆二互圍,白左上能多圍不少,黑左上中間圍不到多少,白盤面都要好一些。實戰黑只好攻擊白98這一子。

黑99攻擊,白100拆一幾乎是勝利宣言,似乎在說吃不掉我就勝了。而且這兩個字活力很好確實吃不了,下到110逼黑111吃,這時白做眼與出逃都不難,應該說已經解決了問題。

行棋至此,從子效上來說,黑左邊一團當初以為的厚勢,雖然吃了五子,但全是干目沒圍到多少目。而白下面的厚勢吃三子卻圍得效率高不少。黑右上的厚勢其實也圍不了多少空。因此白棋盤面領先是可能的,後面收官白明顯手段多,黑到處欠目。

柯潔後面沒有放棄,收官撐得很厲害。但AlphaGo領先優勢夠多,早早進入了安全運轉模式,時不時地送出1目半目,送出去了6、7目,最後1/4子獲勝。如果熟悉Master的棋路就會知道,白不斷地送目,正是必勝的證明。所以後面柯潔雖然收官有收穫,其實早已心知肚明必敗了,表情痛苦。本局並非雙方差距微小,在官子爭奪中柯潔最小差距落敗,而是差距大到了一先。

五.全局綜述與展望

本局柯潔黑棋並沒有領先的時候,沒有勝機。黑棋開局兩個三三先撈後洗的戰術準備不算成功。白棋領先的局面出現在50多手,雖然優勢並不是太大。但是柯潔一直沒有崩潰,不斷地出招試圖化解困境或者翻盤,也逼出了白棋的一些好招,雙方的對戰招法頗有看點。柯潔的狀態應該說還不錯,但是一點點的鬆勁就導致局面落後無法挽回。柯潔本人對自己的發揮並不太滿意,應該是意識到了自己的問題。

AlphaGo本局的表現非常穩定,能夠領先發揮不差的柯潔一先,展示了強大的實力。AlphaGo本局的招法相對Master給人的震驚來說,容易理解多了。這個對局顯得很有邏輯,不象Master的某些棋局,人類莫明其妙就大大落後,輸了還不知道怎麼回事。本局AlphaGo也有一些令人驚艷的招法,但下出來棋手們能品出妙味,不致於茫然不知所措。這說明,人類棋手的水平也在進步。

柯潔說,想要贏AlphaGo,必須逼出它的bug。從本局來看,確實如此。如果只是局面選擇、打入、圍空、攻擊這些較為常規的局面,AlphaGo的局面判斷能力比人類棋手明顯要強。在雙方上百手的進程中,人類總是容易出錯。一旦進入AlphaGo小有優勢的控制流局面,它總是能簡化局面,找到簡明獲勝的分枝。

想要逼出AlphaGo的bug,柯潔必須把局面撐得很滿,讓雙方都不能退,不進入複雜變化就吃虧。從本局的局面來看,柯潔如果發揮得再好一些,可能會有這樣的機會。如逼使AlphaGo大吃柯潔一塊棋,而不是吃下面兩子就夠了。或者逼得AlphaGo進柯潔的模樣里艱難找生路,而不是象98與100兩子一樣一眼看去就能輕鬆做活。從AlphaGo的棋路選擇來看,它明顯在避免算不清的開放型複雜死活變化,因為那樣它有不少分枝是會被吃,或者被柯潔整體活出,不如控制流勝率高。

希望柯潔後兩局能將局勢引導得更為複雜、更為緊張,讓棋迷們看到更精彩的棋局。哈薩比斯也說要繼續開發提升,例如以後真的開發出「純凈」版的AlphaGo,與職業棋手們共同探索圍棋更多的奧秘。

觀天下講壇第5期報名鏈接

本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平台觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閱讀趣味文章。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 觀察者網 的精彩文章:

說哭四千小學生的「教育家」,奇葩言論不輸丁璇吶
對AI的研究和利用,國象領先中象一個車
《反家暴法》能不能防住家暴?
柯潔事件後聶衛平發聲被歪曲原意 斥責媒體添油加醋
年度大囧!崔永元不識微博CEO,稱他是新來的

TAG:觀察者網 |

您可能感興趣

若做不好防守,阿森納想贏熱刺怕是痴人說夢
波波維奇的噩夢,馬刺拼盡全力想贏下勇士,奈何還是過不了KD這關
都怪阿扎爾!想贏的克洛普輸了,「想輸」的薩里卻贏了
二戰的蘇聯究竟有多可怕?德國想贏,幾乎是沒有可能的
王治郅嘴上說對八一要求不高,私下卻要隊員像狼一樣,他還是想贏
克拉克森來勢洶洶,紅隊並非無人可針對,想贏球李楠必須用好他!
巴爾韋德:巴薩很想贏,但歐冠不是我們一家開的
圖赫爾談內馬爾賽後直接離場:這很正常,因為他想贏球
莫雷談哈登保羅摩擦:有些緊張是好事,這說明他們都想贏
二戰的蘇聯究竟有多可怕,德國想贏幾乎是沒有可能的
成也詹姆斯,敗也詹姆斯!騎士想贏下搶七,盧教練必須該發力了?
【訪談】威廉森:我可以去新奧爾良,不管去哪我就是想贏球
詹姆斯全明星賽為何這麼想贏?原來是為了貧困的孩子們!
這球不想贏啊!卡萊爾很無奈,今天為了讓公牛追上分差,他儘力了
科斯切爾尼:如果不能進球,那想贏就困難了
史蒂芬森:我想贏球,我太渴望拿下這場勝利了
金毛狗狗和泰迪比賽定力,金毛太想贏,上去直接給了泰迪一巴掌
3連敗不可怕,可怕的是喬治想贏球,如今,卻找不到贏球的方式
缺誰都不怕!這支凱爾特人隊不是你想贏就能贏得了的
鮑威爾:倫納德只想贏球,他是出色的領袖