最小化類 AlphaGo Zero 引擎——Nochi

知識 02-22

Nochi 是一個極簡的 AlphaGo 引擎，它用 Keras 神經模型代替 Monte Carlo 模擬。Nochi 不會像 Michi 那樣受人矚目，但是它仍有一定的作用。

這不是一個像 AlphaGo 那樣真正的「零知識」（zero-knowledge）系統，作者稍微做了一些調整。

Nochi 已經被證實能夠在兩周內接近 GNUGo 的水平（8500 場比賽，6 線程加一款 Tesla M60 GPU）。

用法：

首先，在腳本的開始處設定 N 的值來確定棋盤的大小，N 默認為 19.

開始訓練：

python./michi.pyselfplay

它會自動生成一個 ID 並做周期性快照（這些數字應該乘以線程數來獲得真實的局數）。要恢復成其他的模式（比如開始 gameio 或者 gtp），請將 ID 設置為：

python./michi.pyselfplay G171107T013304_000000150

開始遊戲，你可以傳遞 gtp 參數並在 gogui 中啟動它，或者讓它用 GNUGo 玩遊戲：

gogui-1.4.9/bin/gogui-twogtp -black"python ./michi.py gtp G171107T013304_000000150"-white"gnugo --mode=gtp --chinese-rules --capture-all-dead"-size7-komi7.5-verbose-auto -alternate -games20-sgffilex

Nochi 還支持監督訓練：

while true;dofind GoGoD-2008-Winter-Database/ -name"*.sgf"| shuf; done | python ./michi.py replay_train

用 smt 將用於位置輸出的實際 MCTS 訓練信號和數值監督結合起來：

while true;dofind GoGoD-2008-Winter-Database/ -name"*.sgf"| shuf; done | python ./michi.py replay_traindist G171107T224743_R000030000

你可以用快照在自我對局、監督、監督 + MCTS 中自由切換，它們之間是相互兼容的。

Github 地址：

https://github.com/rossumai/nochi

春節 AI 學習狂歡，精品課程豪華特輯

優惠折上折，福利搶不停！

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 AI研習社 的精彩文章:

※還在糾結 Python 的數據導入問題嗎？有這張速查表就夠啦
※深度學習界的「吃雞掛」——目標檢測 SSD 實驗

TAG:AI研習社 |