當前位置:
首頁 > 新聞 > 柯潔為何說「輸得沒脾氣」!8個問題解讀人機大戰第一局

柯潔為何說「輸得沒脾氣」!8個問題解讀人機大戰第一局


導語:雷鋒網消息,經過四個多小時的對弈,柯潔以四分之一子之差敗給了Alphago。


本文作者:張馳



柯潔為何說「輸得沒脾氣」!8個問題解讀人機大戰第一局



雷鋒網(公眾號:雷鋒網)消息,經過四個多小時的對弈,柯潔以四分之一子之差敗給了AlphaGo。

比賽後,曾參與訓練AlphaGo的棋手樊麾,與圍棋九段常昊一同回顧了整個對弈過程。柯潔也與Deepmind創始人Demis Hassabis,以及AlphaGo的主程序員David Silver一同接受了媒體採訪,談及對比賽的感想。


AlphaGo注重整體局勢的發展


樊麾提到,在經過年初Master的60局比賽後,很多棋手也在嘗試用點三三這種下法。而柯潔也模仿了這種開局。


常昊在分析中表示,對整個棋局印象最深的,是白棋在開局後不久第24手的大飛,這顯示出AlphaGo更更注重中央勢力的發展,對厚薄和棋局的發展有更多注重,因為這一步在未來棋局中的效率會更高。


AlphaGo另一個令人印象深刻的也是在開局後不久,在棋局的左上方,採取了一步斷。在斷之前,黑棋(柯潔)看起來很厚,但之後白棋(AlphaGo)也變得厚了。常昊稱,「這是走的一步後手,但卻留下了很多餘味。」



柯潔為何說「輸得沒脾氣」!8個問題解讀人機大戰第一局



第24手「大飛」,第54手「斷」


「這一步帶給了我們新的想法,有些棋不是不能下,下了以後還會有新的思路。它提供了一種思路的創新,我們可以共同去研究,為圍棋的下法帶來更多發展。」


雖然被圍棋圍住的4個字看起來已經沒救了,但AlphaGo依然會更多利用這4個子,它會想把棋盤上所有子的價值都利用起來。

柯潔:輸得沒脾氣


柯潔在回顧比賽時也對第54手的斷,表示了肯定。他稱,「很震驚,這在人類的下法中是不能有的」。在斷之後,它把自己的腳步實地化,變得更厚,一石二鳥。


柯潔感嘆道,「實在下得太出色了,輸得沒什麼脾氣。」


Demis Hassabis在賽後表示,這是一場非常精彩的比賽,他非常尊敬柯潔,這一戰的表現令人佩服。他認為柯潔表現出了頑強與精彩的實力,在賽前也做了很多戰前的準備。


「柯潔同時做了戰略和戰術的準備,比如點三三(這種策略),這是他從年初Master的60場比賽中的總結。他有自己的戰略,有好幾手都是非常漂亮的。第24手是全盤皆活的一手。接下來還有很多場比賽,我非常尊敬柯潔,讓AlphaGo也必須用全力以赴對付你。」


比賽的結果雖然有了,但外界對AlphaGo和柯潔的好奇心沒有滿足。在採訪中,雙方也回答了很多大家關心的問題。


比賽後柯潔為什麼笑了?


柯潔稱,這是苦笑,不是很開心的笑。


「很早就知道自己會輸。AlphaGo的每一步棋都是勻速的,到最後時已經知道會輸多少了。」


對於自己的評價,柯潔稱,「AlphaGo下得很精彩,但我自己也盡了全力。它下得太好了,有很多地方值得棋手去學習和探索。它對圍棋的理念帶來了衝擊,在改變我們最初對圍棋的下法,沒什麼棋是不能下的。對AlphaGo的想法也有改變,我們可以大膽去創新,開拓自己的思維,可以自由地去下棋。今天也是大膽地開拓了自己的思維。」

柯潔還曾想用AlphaGo的策略來對付它。「我的印象中AlphaGo是會非常貪戀實地的,比如點三三的方法,今天我也是在使用這種策略。但這種意圖被AlphaGo打敗了,完全進入了它的調子中。它真的下得非常的好。」


柯潔認為,AlphaGo的棋與去年完全是兩個人。第一次時它很接近人的,但現在越來越像「上帝」。


AlphaGo有弱點嗎?


柯潔認為,弱點暫時沒有看見。以前還是有弱點的,但現在AlphaGo對棋的理解與判斷已經遠勝於我們人類了,贏的話只能找一些bug出來。


但他同時說,「對自己永遠要有信心。」


Hassabis稱,在李世石後再次參加比賽,就是希望棋手們能找到AlphaGo的弱點,找到它跟自己對弈時不知道的缺陷。


「李世石當時在第4局找到了這個缺口,後來我們改善了體系。當然還會有新的領域,我們和AlphaGo都不知道,所以才會參加比賽。」


David Silver解釋稱,AlphaGo的做法是將它的獲勝的概率最大化,而不是接近式贏得比賽。它會尋找一些確定的路線,實現少風險的獲勝機會。這也是一個取捨問題,要決定如何擴大勝利的比例。當然,它還有一些其它目標,比如將勝利的步伐邁得更大,如果重點只是放在獲勝上,它可能會降低風險,即使很小的風險也會去關注。


對圍棋的影響?


Hassabis認為,圍棋是一個非常有意思的主題,它有無限的可能性。通過比賽,可以改進對於圍棋的理解,這是我們可以用的工具,讓偉大的棋手發現更多圍棋的奧妙。

AlphaGo完全不依賴棋手的訓練嗎?


David Silver解釋稱,AlphaGo一開始就是跟人類來學習的,它通過自身對弈來學習時,也必須要跟人類專家對弈才行,因為與頂尖的棋手對決才能改善。新版本是更多與自身對弈來學習,實現自我的搜索,對人類數據的依賴更小了。而DeepMind的目標是讓它的規則超越圍棋,應用到其它領域。


戰勝位於圍棋頂端的柯潔後,AlphaGo是否就此隱退?


對這一問題,Hassabis沒有正面回應,只是表示,本周晚些時候會宣布下一步怎麼做。像第一版在學術期刊上發布了技術細節一樣,他們以後也會發布更多新版本的細節,會披露更多技術細節,讓其它團隊與實驗室做自己的版本。


技術細節?多少個TPU?單機版?


這次比賽的AlphaGo是新版本,它改善了新的演算法,主要進步是計算量少了十倍,自我對弈更強。


Hassabis稱,在比賽中程序是在一個單一的機器上運作的,這與去年不一樣,當時是分布式的。這次有更強大的演算法,運作起來更簡單也更好,獲得的速度更快。


Hassabis表示,計算力可以「在Google雲中獲得,用的是TPU,十個處理單位,少了十倍的計算量」。簡單點說,這次的AlphaGo是單機版。


柯潔再也不與人工智慧比了?


賽前,柯潔發微博表示,這次比賽是最後三場與人工智慧的比賽。賽後,他對這一決定再次做了確認。

「考慮了很久,AlphaGo進步太快了,每一步都是巨大的進步,在以後會更加完美,而人與它的差距不是靠自己的努力就能去彌補的。我相信科技的力量,未來是人工智慧的。對圍棋來說,我還是喜歡和人來下,因為機器與人的差距會越來越大,人贏的概率會越來越小,這樣下棋太痛苦了,一盤都贏不了。」


他表示,以後也不會去訓練機器了,這是最後的三盤棋。


「希望以後還是下人類的棋,對軟體把它當作一個老師,一個學習的對象去看待。」


他表示,對自己的表現也有點不滿意,覺得自己可以做得更好,但有時候無論怎麼努力都無法做到。所以這最後一次,他希望不留遺憾,下出讓自己滿意的棋局。


「令AlphaGo的主機發燙也好。」


那如果人類棋手不想和AlphaGo打了怎麼辦?


Hassabis表示,從他們的角度來說,想要AlphaGo作為圍棋的工具,能為人類所用,所以會有架構知識的分享,讓大家知道它。也希望它能走進尋常百姓家,在醫學與科學找到應用場景。


雷鋒網原創文章,網站轉載請至雷鋒網官網申請授權。但,歡迎轉發分享~

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 的精彩文章:

提精神,祛肥胖,濕重是標,脾虛是本
首戰失利,柯潔「輸得沒脾氣」:阿法狗就是圍棋上帝!
益氣補脾,山藥當仁不讓
如果家裡的薩摩耶養成不好的脾氣,你該怎麼做?

TAG: |

您可能感興趣

白話解讀為什麼說每個人都需要看八字,值得收藏!
專業解讀「裂果病」!夏季番茄容易裂果,做好這幾點很重要
「笑貧不笑娼」還有下一句,你知道嗎?如何正確解讀這句話呢?
孫悟空的七十二變原來還可以這樣解讀,換個視角看問題果然不一樣
話題 · 多一些個人空間,會被解讀成不愛對方嗎
屯卦解讀:成大事的人都讀懂了這一卦!
一天吃幾個雞蛋才最好?都別爭了,這裡有最權威的解讀讓你放心吃
解讀:「一級戰備」軍人什麼狀態?「臨戰」訓練,說出來別不信!
情感解讀:能為你做到這四件事的男人,真心愛你不用懷疑
人,為什麼會得白血病?這有一份深度解讀
哪些是讓人破產的風水環境?算命二十多年的命理師為你解讀!
林則徐臨終前為何要用儘力氣,三次大呼這三個字?專家如此解讀
吃多了為何會拉肚?這才是經典解讀,半生疑惑瞬間消解
解讀——無人機應該是什麼樣子?
喜歡一個人的說說解讀 總有一句能觸動你的心
不懂八字沒關係,看明白這兩個字也能解讀人生密碼!
婚姻解讀:頻繁對你說這四句話的女人,真心愛你不用懷疑
9個問題解讀雷軍文章:我是誰,我為什麼而奮鬥
大豬蹄子是指膠原蛋白很豐富?聶遠這個神解讀也是夠夠的!
為什麼痘痘會痛 為你詳細解讀肌膚問題