AlphaGo 是如何一步步接近成為圍棋「上帝」的?
正如賽前很多人預料的那樣,在與 AlphaGo 的第一場圍棋對戰中,柯潔輸了。
不過,也正如愛范兒(微信 ID:ifanr)在昨天比賽結束之後一分鐘內發布的總結文章所言,AlphaGo 已經今非昔比。確切地說,無論是 DeepMind 對它的命名,還是它背後的計算力量,乃至它自身的棋力,都發生了脫胎換骨的變化。
5 月 24 日,趕在第一局比賽結束之後,DeepMind CEO Demis Hassabis 在第二天舉行的中國烏鎮人工智慧高峰論壇中,專門談到了 AlphaGo 背後的研發過程和對戰故事,以及對這次比賽中 AlphaGo 的相關問題進行了解讀。
Hassabis 首先對 DeepMind 進行了簡單介紹,然後開始談起 AlphaGo 背後的複雜性。他表示,計算機下圍棋之所以異常困難,是因為圍棋的複雜程度讓窮舉搜索都難以解決;由此衍生出兩項難題:一是不可能寫出評估程序以決定誰贏,二是搜索空間太過龐大。
而在具體的 AlphaGo 研發過程中,DeepMind 更是要考慮直覺和計算的問題;因為圍棋是一種獨特的遊戲,它具有以下特徵:
圍棋不像象棋等遊戲靠計算,而是靠直覺。
圍棋中沒有等級概念,所有棋子都一樣。
圍棋是築防遊戲,因此需要盤算未來。
小小一子可撼全局。
「妙手」如受天啟,玄妙深奧。
2016 年 3 月,AlphaGo 與韓國圍棋選手李世乭九段進行了舉世矚目的「人機大戰」,最終以 4:1 的比分獲勝;其中,AlphaGo 在第二局中下出了令人驚嘆的第 37 步棋,不過在第四局中也被李世乭的「神之一手」所困擾。
Hassabis 介紹說,AlphaGo 與李世乭之間的對決,對圍棋本身的影響是多個層面的。首先是體現的圍棋的影響力上,這次對決擁有 2.8 億觀眾和 3.5 萬篇報道,並且推動圍棋棋盤的銷售量增加了 10 倍,讓不少西方人開始關注這項來自東方的古老技藝。
但 AlphaGo 給圍棋帶來的真正改變在於思維方式的啟發;李世乭在賽後表示:
我認為這給圍棋引入了新思路,我感覺找到了自己下棋的理由。
對於 DeepMind 團隊來說,AlphaGo 與李世乭的對戰也讓他們對 AlphaGo 有了新的判斷。Hassabis 表示,AlphaGo 在與李世乭的對決中,不僅僅表現出了它應有的認知能力,甚至已經表現出了一定的創造力,雖然是非常有限的。
在 2017 年元旦前後,AlphaGo 以 Master 的身份與包括柯潔在內的 60 名人類頂尖高手進行了對戰,並全部獲勝。Hassabis 表示,在這 60 場對決中,AlphaGo 表現出了更強的創造力,尤其是在它與辜梓豪和朴廷桓的對決中。
賽後,柯潔表示:
人類數千年的實戰演練進化,計算機卻告訴我們人類全部都是錯的,我覺得,甚至沒有一個人沾到圍棋真理的邊……我們棋手將會結合計算機,邁進全新的領域達到全新的境界……人和 AI 應該可以趨近圍棋真理。
在 Hassabis 的演講之後,AlphaGo 團隊負責人 Dave Silver 上台揭露了 AlphaGo 的更多細節。
Silver 表示,其實與李世乭對戰的版本的全名為 AlphaGo Lee,它在 Google Cloud 上使用了 50 個 TPU(全稱為TensorFlow Processing Unit,是Google為了加速深層神經網路運算能力而研發的晶元);而 Master 的全名為 AlphaGo Master,它實際上是運行在單個 TPU 機器上,它的強大之處在於能夠從自我對弈中強化學習,同時也使用了更強大的策略&價值網路。
實際上,在 AlphaGo 團隊的評估中,AlphaGo Lee 的等級分為已經在 3500 分和 4000 分中間,而 AlphaGo Master 的等級分已經超過 4500。作為對比,當今世界排名第一的柯潔在 GoRatings 的等級分為 3620。
(AlphaGo 各個版本的評估分)
(AlphaGo 已經被踢出評估體系)
至於這次與柯潔對戰的 AlphaGo 版本,Silver 表示此次 AlphaGo 使用了第一代的 TPU,並不是 Google 前不久公布的第二代;另外,今年升級版的 AlphaGo 是在單機上運行的,它的物理伺服器上部署了 4 個TPU。
由此可以想見的是,這一次柯潔將要面臨的是多麼可怕的對手。
值得一提的是,在 5 月 23 日的賽後發布會中,柯潔表示:
如果把 AlphaGo 當人的話,跟去年相比,它已經完全是兩個人;去年的時候,AlphaGo 所下的棋還是很接近人的,現在已經接近圍棋上帝了。
跟上帝交手是一種怎樣的體驗?柯潔九段也許是這個世界上唯一有資格回答這個問題的人。實際上,我們已經不太相信他會在接下來的兩局比賽中能夠贏上一局了,但是我們希望被打臉。
祝福柯潔。


※無敵的椅子:兒時玩的搶椅子遊戲,現在不用再憑屁股決勝負#Android
※無敵的椅子:兒時玩的搶椅子遊戲,現在不用再憑屁股決勝負 Android
※老司機轉行做直播還賺了 2 個億,陌陌你變了……
※科幻片成了現實,大疆發布的 Spark 是真的「自拍神器」
※兒童節特供:好孩子養成清單
TAG:愛范兒 |
※Wegame悄然上線交易市場:接近steam的又一步法寶?
※「貓接近你,只是想跟你上chuang。」
※iPhone X新機機身大小接近iPhone 8 Plus是真的嗎?
※一些碼數已接近 3 萬,Mars Yard Overshoe瞬間拿下 2 月炒賣榜冠軍
※完成度接近正式版,Google 推送 Android P Beta 3
※Facebook收購Oculus已經接近5年,扎克伯格的VR夢如何了?
※據說Android Q的手勢交互體驗更接近iPhone,絕了
※隨著世界末日時鐘接近午夜,它能否加速Cryptocurrency的採用?
※新iPhone售價接近萬元,四代Watch成了最大的亮點!
※三星摺疊屏Galaxy X更多爆料:續航與Note9接近?
※視頻丨更接近跑鞋設計:Under Armour Curry 6 開箱
※機器人馬上打Call:谷歌Assistant持續對話功能接近應用
※Supreme x Pearl 架子鼓定價出現,接近3萬元你還會搶嗎?
※接近完美的屏幕掛燈——明基ScreenBar Plus
※接近四個億!四成蘋果手機激活Apple Pay,還在持續增長
※世界盃接近了,Louis Vuitton 帶來了官方授權的特別系列
※羅技可能接近購買Plantronics
※新 AirPods 全球首拆,性能接近 iPhone 4
※iPhone9來襲!時間:接近一個月!
※最接近真實的華為P30 Pro,下巴堪比iPhone X,徠卡四攝成焦點