當前位置:
首頁 > 科技 > 柯潔第二局投子認負,獨家專訪AlphaGo開發者導師Martin Müller

柯潔第二局投子認負,獨家專訪AlphaGo開發者導師Martin Müller

機器之心原創

參與:李澤南、杜夏德

今天下午 13:37,「中國烏鎮·圍棋峰會」人機大戰的第二場比賽落下帷幕。在耗時 3 小時 7 分鐘的比賽後,柯潔投子認負,AlphaGo 取得了勝利。

在 23 日的首輪比賽中,AlphaGo 以四分之一子的優勢,擊敗了世界第一人類圍棋手柯潔。贏得比賽後,這場人機大戰引起了人們廣泛的關注和討論。DeepMind 也在賽後分析解讀了AlphaGo 背後的技術,表示當前版本 AlphaGo Master 的棋力,較與李世乭對弈的 AlphaGo 版本有三子提升,就連柯潔本人也在微博上表達了自己的「震驚」:

經過了一天的休整,今天上午 10:30 第二輪 AlphaGo 與柯潔的比賽正式開始,機器之心記者再次來到比賽現場見證這場「世紀之戰」。和第一局比賽一樣,在現場報道之外,機器之心還邀請到阿爾伯塔大學教授、計算機圍棋頂級專家 Martin Müller 以及《深度強化學習綜述》論文作者李玉喜博士,共同觀看了比賽直播。

在觀戰的同時,機器之心就第一天比賽後讀者關心的一些問題向 Martin Müller 教授進行了採訪,更為細緻地解讀這場人機大戰。

Martin Müller 教授(中)所帶領的團隊,在博弈樹搜索和規劃的蒙特卡洛方法、大規模並行搜索和組合博弈論方面頗有建樹,David Silver 與黃士傑(Aja Huang)都曾師從於他。李玉喜博士(右)是加拿大阿爾伯塔大學計算機系博士、博士後,致力於深度學習、強化學習、機器學習等前沿技術及其應用。

5 月25 日上午 10:30,第二局比賽開始,中國棋院院長華以剛主裁,由古力搭檔張璇、周睿羊(阿爾法羊)搭檔劉菁講解,圍棋大師聶衛平也來到了比賽現場。

黃士傑博士代 AlphaGo 執黑棋在右下角先落一子,柯潔執白點了三三,隨後 AlphaGo 走了左下三三。AlphaGo 的大局感依舊,虛招上很難猜測。在前幾步布局之後,兩方很快在局部展開爭鬥,局面變得極為複雜。

在左下角出現打劫情形後,Hassabis 表示,此時在 AlphaGo 的計算中,柯潔的表現是完美的。

隨後 AlphaGo 和柯潔圍繞打劫展開了博弈,但在 AlphaGo 下出第 133 手後,局面開始逐漸向計算機傾斜。之後柯潔的一步失誤進一步加大了 AlphaGo 的優勢,並將優勢轉換為勝勢,為這個優勢一直延續到比賽結束,確定了 AlphaGo 的最終勝利。行至 154 步,柯潔投子認負。

AlphaGo 的獲勝已經毫不令人意外了,甚至我們已經可以預料到後天(即 GMIS 2017 大會的第一天)最後一場比賽的結局了。明天,除了古力+AlphaGo 對戰連笑+AlphaGo 的人機配對賽外,AlphaGo 還將和人類棋手展開配對賽和單挑五位職業棋手聯盟。AlphaGo 在與人類合作以及對抗人類集體智慧上還將有什麼出人意料的表現和結果,讓我們拭目以待。

在第一天直播過程中和比賽結束之後,機器之心就觀眾們關心的幾個問題對 Martin Müller 進行了採訪,整理如下:

關於第一局比賽

機器之心:柯潔和 AlphaGo 的差距是否只有 1/4 子那麼小?

Martin Müller:大多數職業棋手認為 AlphaGo 在第一盤棋的中期已經獲得了很大的領先優勢,於是它在後期選擇了保守策略,並保持住了領先,所以人和電腦的棋藝差距並不能用 1/4 子來衡量。但是我們無法知道 AlphaGo 在想什麼,無法知曉它的真正策略是否在最後選擇了「保守」。

機器之心:AlphaGo 已經是讓人類九段 3 子的水平?

Martin Müller:昨天,DeepMind 隨後在補充說明中表示,讓 3 子的水平是 AlphaGo 與舊版 AlphaGo 對弈的估算結果,並不能代表真實水平。因為同類型系統自我對弈可能無法發現一些潛在的問題。如果是與其他計算機系統,或者棋手下棋,AlphaGo 會面臨其他棋風,它的對手們可能會發現一些系統的盲點,從而取得優勢。所以我們不能認為 AlphaGo 的水平已經達到讓全人類 3 子了。

機器之心:DeepMind 在昨天的發布會上表示新一代 AlphaGo 是單機版,只需要 4 個第一代 TPU,效率提升了 10 倍。你認為它是如何做到的?是否會為了效率犧牲了準確度?

Martin Müller:AlphaGo 的確是在去年有了很大的提升,在與李世乭比賽結束後,DeepMind 中的一個我的學生告訴我,他們當時還有很多的改進方法因為沒有足夠時間無法實施,現在經過了一年時間,他們有足夠的時間來改進這個系統,10 倍效率的提升果然不同凡響。

AlphaGo 背後的技術

機器之心:如何更好地描述 AlphaGo 機器學習演算法和蒙特卡洛樹搜索之間的關係?

Martin Müller:AlphaGo 的學習過程是線下的。它通常是先發展出若干神經網路,留在比賽中使用。蒙特卡洛樹搜索(MCTS)是其主要的決策演算法,用於決定一局比賽中每一步棋。MCTS 結合了博弈樹搜索、機器學習到的知識和模擬的全局遊戲來決定每一步。這些知識中最重要的部分是上面提到的深度神經網路。其中有一個網路(策略網路)選擇搜索中最有希望的走子,另一個網路(價值網路)可以評估其在搜索中遇到的數千乃至數百萬個棋盤局面。

機器之心:從與李世乭的比賽到現在,AlphaGo 有何改進?

Martin Müller:我不知道細節,而且也正急切期待 DeepMind 發布相關信息。但我聽說最重要的改進是使用機器學習創建博弈訓練的過程。在之前的版本中,這些訓練博弈是通過一個強大的策略網路創建的,沒有任何搜索。在這個新版本中,這些博弈是完全使用 AlphaGo 引擎創建的。這會慢很多,因為其每一步都涉及到一次樹搜索,但其可以產出質量高得多的博弈,從而可以基於此學習到下個版本的 AlphaGo。然後再重複這個過程。

機器之心:人工智慧科學家能夠把 AlphaGo 的機器學習演算法用到其他研究或應用中嗎?

Martin Müller:是的。深度卷積神經網路的思想實際上來自於圖像處理,而由於其視覺的本質,其已經在圍棋中得到了應用。AlphaGo 中所使用的另一種強大的學習方法是強化學習,這是目前最熱門的主題之一。更一般而言,結合了機器學習到的知識和深度搜索與模擬技術的現代啟發式搜索方法在許多決策問題上都有很大的潛力。

機器之心:Hassabis 昨天說要把相關技術開源,這是否會催生出新的技術進步?

Martin Müller:DeepMind 提到會在下個月

未來及其它

機器之心:在柯潔與 AlphaGo 的比賽結束後,你有何期望?

Martin Müller:柯潔已經聲明說這將是他與人工智慧最後的比賽。我希望他會改變他的想法。

我希望 DeepMind 將會將 AlphaGo 的許可權提供給每一個人,比如,通過谷歌雲。

這個團隊承諾會發布有關當前版本背後的科學的文章,人工智慧研究者都很期待。

其它圍棋程序開發者將非常想跟上 AlphaGo 的腳步。尤其是,騰訊有一個強大的人工智慧團隊,他們已經開發出了當前世界第二的程序絕藝(FineArt)。我認為在 DeepMind 引領的進步的帶動下,我們將很快就會有多個超人水平的程序。我希望它們其中一些將會開源,而且我期待看到未來它們之間的精彩比賽。

機器之心:對明天史無前例的團體賽的展望?

Martin Müller:我覺得團體賽有點像婚姻(笑),能否成功取決於隊友之間的配合程度,如果之前五名棋手有過針對性的訓練,結果應該會比一個人要好。

而與 AlphaGo 配合共同進行比賽會非常地有趣。在國際象棋運動中,也有過人類與計算機配合共同下棋的經歷,事實證明與計算機配合可以減少兩方的錯誤,提高總體水平。但對於圍棋而言,對弈雙方面臨著更複雜的局面,所以這種組合是否能夠將圍棋水平提升到一個新的高度還是未知的。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

PHP和Python如何選擇?或許你應該考慮一下這三個問題
融到 3.8 億的依圖,正在人工智慧醫療領域做什麼?
李佳:人工智慧的「Another Badass Woman」

TAG:機器之心 |

您可能感興趣

Kim Jones 接受 Naomi Campbell 專訪暢談自己的 Dior Men 首秀
獨家專訪 | Matthew Campbell Laurenza:會發光的才是生命體
Active Ride Shop 入華,獨家專訪 Jamie Thomas!
探討「丹寧宗師」Helmut Lang 的收藏價值 | 專訪收藏店 ENDYMA 店主 Michael Kardamakis
Karl Lagerfeld 接受《Numéro Magazine》專訪再次發表「驚人」言論
在 Justin Bieber 臉上紋身的他是個 Supreme Reseller?| 專訪 JonBoy
專訪朱詩雄:Apache Spark中的全新流式引擎Structured Streaming
Virgil Abloh 接受 Naomi Campbell 專訪談及與 Kanye West 的「歷史性」擁抱
專訪|專訪DALI CEO Jesper Schartau先生
專訪Catherine Otto—從BMJ子刊Heart主編的角度看文章發表
獨家專訪 | Julianne Moore:為熱愛而冒險
海報專訪獨家對話Donatella Versace:加入Versace大家庭!
Decred 的未來:項目負責人 Jake Yocom-Piatt 獨家專訪
獨家專訪 | Julia Restoin Roitfeld:身為人母的我才更嫵媚
那家賣Lemaire的買手店-專訪Triple-Major
Pyer Moss,一個具有政治色彩的美國街頭品牌 | Jerry?Lorenzo 專訪 Kerby?Jean-Raymond
HIFI專訪:Playback Designs創辦人兼執行長Kndreas Koch
專訪倫敦「潮童」Collin Wilson—hypekids 究竟是如何看待 Supreme 的?
Alex Kipman專訪:HoloLens 2就是用HoloLens設計的
Gopher China 2018 講師專訪-Marcel van Lohuizen