當前位置:
首頁 > 知識 > 最小化類 AlphaGo Zero 引擎——Nochi

最小化類 AlphaGo Zero 引擎——Nochi

Nochi 是一個極簡的 AlphaGo 引擎,它用 Keras 神經模型代替 Monte Carlo 模擬。Nochi 不會像 Michi 那樣受人矚目,但是它仍有一定的作用。

這不是一個像 AlphaGo 那樣真正的「零知識」(zero-knowledge)系統,作者稍微做了一些調整。

Nochi 已經被證實能夠在兩周內接近 GNUGo 的水平(8500 場比賽,6 線程加一款 Tesla M60 GPU)。

用法:

首先,在腳本的開始處設定 N 的值來確定棋盤的大小,N 默認為 19.

開始訓練:

python./michi.pyselfplay

它會自動生成一個 ID 並做周期性快照(這些數字應該乘以線程數來獲得真實的局數)。要恢復成其他的模式(比如開始 gameio 或者 gtp),請將 ID 設置為:

python./michi.pyselfplay G171107T013304_000000150

開始遊戲,你可以傳遞 gtp 參數並在 gogui 中啟動它,或者讓它用 GNUGo 玩遊戲:

gogui-1.4.9/bin/gogui-twogtp -black"python ./michi.py gtp G171107T013304_000000150"-white"gnugo --mode=gtp --chinese-rules --capture-all-dead"-size7-komi7.5-verbose-auto -alternate -games20-sgffilex

Nochi 還支持監督訓練:

while true;dofind GoGoD-2008-Winter-Database/ -name"*.sgf"| shuf; done | python ./michi.py replay_train

用 smt 將用於位置輸出的實際 MCTS 訓練信號和數值監督結合起來:

while true;dofind GoGoD-2008-Winter-Database/ -name"*.sgf"| shuf; done | python ./michi.py replay_traindist G171107T224743_R000030000

你可以用快照在自我對局、監督、監督 + MCTS 中自由切換,它們之間是相互兼容的。

Github 地址:

https://github.com/rossumai/nochi

春節 AI 學習狂歡,精品課程 豪華特輯

優惠折上折,福利搶不停!


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 AI研習社 的精彩文章:

還在糾結 Python 的數據導入問題嗎?有這張速查表就夠啦
深度學習界的 「吃雞掛」——目標檢測 SSD 實驗

TAG:AI研習社 |