最小化類 AlphaGo Zero 引擎——Nochi
Nochi 是一個極簡的 AlphaGo 引擎,它用 Keras 神經模型代替 Monte Carlo 模擬。Nochi 不會像 Michi 那樣受人矚目,但是它仍有一定的作用。
這不是一個像 AlphaGo 那樣真正的「零知識」(zero-knowledge)系統,作者稍微做了一些調整。
Nochi 已經被證實能夠在兩周內接近 GNUGo 的水平(8500 場比賽,6 線程加一款 Tesla M60 GPU)。
用法:
首先,在腳本的開始處設定 N 的值來確定棋盤的大小,N 默認為 19.
開始訓練:
python./michi.pyselfplay
它會自動生成一個 ID 並做周期性快照(這些數字應該乘以線程數來獲得真實的局數)。要恢復成其他的模式(比如開始 gameio 或者 gtp),請將 ID 設置為:
python./michi.pyselfplay G171107T013304_000000150
開始遊戲,你可以傳遞 gtp 參數並在 gogui 中啟動它,或者讓它用 GNUGo 玩遊戲:
gogui-1.4.9/bin/gogui-twogtp -black"python ./michi.py gtp G171107T013304_000000150"-white"gnugo --mode=gtp --chinese-rules --capture-all-dead"-size7-komi7.5-verbose-auto -alternate -games20-sgffilex
Nochi 還支持監督訓練:
while true;dofind GoGoD-2008-Winter-Database/ -name"*.sgf"| shuf; done | python ./michi.py replay_train
用 smt 將用於位置輸出的實際 MCTS 訓練信號和數值監督結合起來:
while true;dofind GoGoD-2008-Winter-Database/ -name"*.sgf"| shuf; done | python ./michi.py replay_traindist G171107T224743_R000030000
你可以用快照在自我對局、監督、監督 + MCTS 中自由切換,它們之間是相互兼容的。
Github 地址:
https://github.com/rossumai/nochi
春節 AI 學習狂歡,精品課程 豪華特輯
優惠折上折,福利搶不停!
※還在糾結 Python 的數據導入問題嗎?有這張速查表就夠啦
※深度學習界的 「吃雞掛」——目標檢測 SSD 實驗
TAG:AI研習社 |