當前位置:
首頁 > 最新 > 敗1/4子是刻意設定?蔣濤講解AlphaGo2.0如何進化

敗1/4子是刻意設定?蔣濤講解AlphaGo2.0如何進化

柯潔輸了,賽後記者會的焦點轉向AlphaGo,重點如下:

1. 這次比賽的AlphaGo是單機版,仍然在用人類知識加以訓練。

2. 下個月將會發表關於AlphaGo的新論文,目的是讓其他程序同樣能變強。

3. 整個比賽結束後,將會公布AlphaGo下一階段的新計劃。

這裡,我們再來回顧一下蔣濤對於AlphaGo如何進化的語音講解。

從棋局上看,柯潔的表現還是值得稱讚的。但最後,當然還是毫無懸念就輸掉了,這說明人類在準備上,針對AlphaGo還是有不足。

柯潔不是一個人在戰鬥,應該是中國的圍棋界,加上中國的計算機界、AI界來一起迎戰人類最強大的對手。如果我們能夠打敗他,這將是一個非常重磅的新聞。

可是我們現在感覺,柯潔在開局上的套路準備有所不足。50多手下來,其實局面對黑棋(柯潔)來說已經不樂觀了。所以,這是反映我們準備不足的一個因素,特別是點三三局面的變化其實並不複雜,但從判斷來講是黑棋(柯潔)不利。

這裡是我們對棋局的看法。

AlphaGo棋風已變

聶衛平老師有說,AlphaGo是特意只輸半顆子。這一說法我們尚不能證實,但AlphaGo的白棋在後續變化上,相對於人類棋手對局,肯定是下得比較保守的。而另一個角度,柯潔的發揮又相對強勢。

因而,最後能出現這麼細微的局面,說明棋局還是在AlphaGo的掌控之中的,畢竟它要確保的是結果的勝利。至於勝子1目還是10目,對於電腦來說,這裡的判斷其實是一樣的,都是100%勝利這個結果。

所以,我認為這是兩個方面的因素,一是電腦從計算上可能做了適當的退讓,這從取勝的角度講是完全沒有問題的;二是柯潔在官子上也下得相對緊湊和精彩。

相對於去年的版本,今年AlphaGo的成長是非常明顯的。它有了很多創新的下法,和自己獨有的下法,這些下法我們可以從它今天的對局以及年初的Master大戰群雄上看出來。

DeepMind創始人哈薩比斯也簡單講過它的細節,AlphaGo今年是單機版,在計算量上是去年的十分之一,但能力上看來比去年提升了不止一點。

用柯潔自己的話說,他有信心戰勝去年的AlphaGo,但距離Master與新版AlphaGo的差距是非常顯著的。

強化學習功不可沒

從新版AlphaGo的表現來看,它更多是在自我學習的成長上,也就是通過強化學習(Reinforcement Learning)和自我對局演化成不同的版本。這樣,每一個AlphaGo程序都會有它自己的風格,你可以有意識地誘導它往不同風格去發展。

如果沒有不同的風格,強化學習的效果就不會太好。這就相當於你左右互搏,儘管自己和自己下得很多,但風格相近的成長對你未必是好事。而不同風格的成長,就能帶來更好的結果。

總的來說,這次的AlphaGo,跟去年相比是很不相同的,棋風也大不一樣,下法的創新程度也要高很多。這要歸功於它在自我對局中的成長,同時也證明DeepMind在強化學習上的研究和成果是非常有價值的。

每日薦文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 AI100 的精彩文章:

TAG:AI100 |

您可能感興趣

教你如何安裝Photoshop CC2018軟體?及新功能的講解
華碩新電腦受不了win10裝win7了解一下-以華碩FL5600L為例講解如何將win10系統改成win7系統
wisdom 主理人 Hans 親自講解品牌 2018 秋冬系列
LV Neverfull 路易威登老花購物袋M41178 高清實拍細節講解
Spring IoC講解
關於webview最詳細講解(包含 h5 和android 交互)
緩衝區實例講解之protostar stack3挑戰篇
protobuf深入講解
IDE,AHCI,Compatible,Enhanced,PATA講解
Office—Excel真題十六講解
亞馬遜ASIN Localization是什麼?亞馬遜ASIN Localization講解&Listing合規精華
The Weather Channel用MR講解颶風逃生指南
王自如親測iPhone xs Max,吳醒峰:信號講解有問題
詳解Linux命令-sed語法和實例講解
54頁PPT講解DeepMind深度學習及前沿進展【附下載】
Priceline預定酒店中bid功能講解及實戰
局座張召忠跨行講解華為Mate20 Pro,之前愛用小米手機!
noobnick時光刻度:ZF廠萬國IWC蒲計完美講解
100張ppt講解工業機器人的機械結構!
python裝飾器內容講解,告訴你python裝飾器是什麼