圍棋AI ELF OpenGo全面開源,田淵棟揭秘訓練過程
銅靈 發自 凹非寺
量子位 出品 | 公眾號 QbitAI
現在,隨時、隨地、隨心情,你都能和國際頂級圍棋AI對戰交流一局了。
最近,Facebook的圍棋AI ELF OpenGo全面開源,下載ELF OpenGo最終版本模型,人人都能與ELF OpenGo下棋。
對了,不要被ELF OpenGo「超能力」般的棋藝驚嘆到,不僅是你,連韓國棋院的專業圍棋選手也被打敗了。在與金志錫,申真諝,朴永訓及崔哲瀚四位專業棋手對戰時,ELF OpenGo以20:0的成績大贏特贏。
甚至圍棋AI界小有名氣的前輩Leela Zero,也以18:980的成績被ELF OpenGo遠遠甩在身後。
今天,Facebook公布了ELF OpenGo的研究論文,復現了AlphaGo Zero和AlphaZero,還詳細揭秘了ELF OpenGo的訓練細節,附帶了一系列開源地址。
15天,15天
在今天剛發布的論文ELF OpenGo: An Analysis and Open Reimplementation of AlphaZero中,Facebook研究人員全面披露了ELF OpenGo的訓練過程。
ELF OpenGo是去年誕生的。當時,Facebook改進了自己面向遊戲的機器學習框架ELF,在上面重新實現了DeepMind的AlphaGoZero及AlphaZero的演算法,得到了這個圍棋AI ELF OpenGo。
論文顯示,訓練過程大部分遵循了AlphaZero的訓練過程。
和AlphaZero用5000個自我對弈的TPU和64個訓練TPU不同,整個訓練過程共用了2000塊英偉達GPU,型號均為英偉達Tesla V100 GPU,內存為16GB,總共訓練了15天。
研究人員還應用了ELF OpenGo,完成了另外三方面突破。
一方面,為ELF OpenGo訓練處一個棋藝超越人類的模型。
研究人員開發了一個類似AlphaZero的軟體,在上面用2000塊GPU連續訓練了9天後,這個20個區塊的模型的表現已經超過了人類水平。
隨後,研究人員提供了一些預訓練模型、代碼和2000萬局自我對弈的訓練軌跡數據集進行訓練。
第二方面,研究人員提供了模型在訓練過程中的行為分析:
在訓練過程中,研究人員觀察到,ELF OpenGo與其他模型相比,水平變化比較大,即使學習率穩定,棋力也會上下浮動。
另外,模型需要依靠前瞻性來決定下一步棋怎麼下時,模型學習速度較慢,學習難度很大。
除此之外,研究人員還在探索了在遊戲的不同階段AI學會高質量的棋法的速度。
第三方面,研究人員進行了Mextensive ablation實驗,學習AlphaZero風格演算法的屬性,對比了ELF OpenGo與AlphaGo Zero與AlphaZero的訓練過程。
研究人員發現,對於最終模型而言,對局中加倍rollout水平大約提升200 ELO,AI的發揮會受到模型容量的限制。
目前,ELF OpenGo的論文、模型、實現代碼、自我對弈數據集和與人類對弈記錄等已經全部開放,地址可到文末尋找。
明星團隊
這篇論文來自Facebook人工智慧研究所(FAIR),一作國內機器學習圈裡一個熟悉的名字,田淵棟。
田淵棟從卡內基梅隆大學(CMU)畢業後,田淵棟奔赴谷歌無人車項目組,隨後跳槽轉向Facebook人工智慧研究所。Facebook圍棋AI Darkforest的相關研究,負責人和論文一作也是田淵棟。
田淵棟本人
田淵棟也一直活躍在知乎,是人工智慧、深度學習話題的優秀回答者,是知乎er心中的大神。
去年,田淵棟回顧自己近幾年的工作感悟和學習生涯的文章《博士五年之後五年的總結》,曾成為圈內的爆款文章,不少網友再次被圈粉,大呼醍醐灌頂。
論文二作Jerry Ma也同樣為華裔,其Facebook介紹顯示,2018年,Jerry Ma剛剛本課畢業,獲得哈佛大學經濟學和古典文學學士雙學位。目前擔任Facebook研究工程負責人。
Jerry Ma
年紀不大,責任不小。
傳送門
GitHub地址:
https://github.com/pytorch/ELF
論文地址 :
https://arxiv.org/abs/1902.04522v1
Facebook博客介紹:
https://ai.facebook.com/blog/open-sourcing-new-elf-opengo-bot-and-go-research/
ELF OpenGo官網:
https://facebook.ai/developers/tools/elf-opengo
另外,如果你自帶Windows系統的電腦,還可以下載這個軟體,在線下棋。下載地址:
https://dl.fbaipublicfiles.com/elfopengo/play/play_opengo_v2.zip
—完—
加入社群
量子位現開放「AI 行業」社群,面向AI行業相關從業者,技術、產品等人員,根據所在行業可選擇相應行業社群,在量子位公眾號(QbitAI)對話界面回復關鍵詞「行業群」,獲取入群方式。行業群會有審核,敬請諒解。
此外,量子位AI社群正在招募,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字「交流群」,獲取入群方式。
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。
喜歡就點「好看」吧 !


TAG:量子位 |