當前位置:
首頁 > 科技 > 開源!免費!谷歌AI訓練模型強化學習框架上線GitHub!

開源!免費!谷歌AI訓練模型強化學習框架上線GitHub!

強化學習 - 一種人工智慧(AI)技術,使用獎勵(或懲罰)來驅動代理人朝著特定目標前進 - 訓練打敗Alpha Go世界冠軍的系統並掌握Valve的Dota 2.它是Google子公司的核心部分 DeepMind的深度Q-network(DQN),可以在多個工作人員中分配學習,例如,在Atari 2600遊戲中實現「超人」性能。 麻煩的是,強化學習框架需要時間來掌握一個目標,往往不太靈活的,而且不是很穩定。

這也就是谷歌提出替代方案的原因:基於TensorFlow的開源強化框架,它是一個機器學習庫。 目前,它已經上線Github。

「受到大腦中獎勵動機行為的主要成分之一的啟發,並反映了神經科學與強化學習研究之間強烈的歷史聯繫,該平台旨在實現可以推動激進發現的那種投機性研究,」Pablo Samuel Castro和 Google Brain Team的研究人員Marc G. Bellemare在一篇博文中寫道。 「這個版本還包括一組闡明如何使用我們框架的colabs。」

他們和Google Brain團隊開發了強化框架,其中考慮了三個原則:靈活性,穩定性和可重複性。

為此,它包括一套精心編寫的代碼(15個Python文件),專註於街機學習環境 - 一個用視頻遊戲評估AI技術的平台 - 以及四種不同的機器學習模型:上述DQN;C51; Rainbow代理的簡化版本; 和隱式分位數網路。 為了重現性,代碼在Arcade學習環境支持的60個遊戲中提供完整的測試覆蓋率和訓練數據(採用JSON和Python pickle格式),並遵循標準化經驗評估結果的最佳實踐。

除了增強框架的發布,谷歌還推出了一個網站,允許開發人員快速可視化多個代理的培訓運行。 它還提供經過訓練的模型,原始統計日誌和TensorFlow事件文件,用於TensorBoard繪圖,TensorBoard是Mountain View公司的TensorFlow程序可視化工具套件。

「我們的希望是,我們的框架的靈活性和易用性將使研究人員能夠嘗試新的思想,包括增量和激進,」Bellemare和Castro寫道。 「我們已經積極地將它用於我們的研究,發現它使我們能夠靈活地快速迭代許多想法。 我們很高興看到社區可以幫助做些更偉大的事。「

鑒於TensorFlow目前這麼流行,想要學習和實踐的程序員們也可以了解下谷歌最近的AI開源項目——AIY Projects。AIY 全稱是 Artificial Intelligence Yourself,顧名思義就是利用 AI 來進行的 DIY 功能套件。谷歌目前為 AIY Projects 推出了兩款硬體--AIY Voice Kit 和 AIY Vision Kit。其中, Vision Kit(視覺套件)附帶的軟體可運行三個基於TensorFlow的神經網路,可以處理圖像識別和計算機視覺, 支持離線識別上千種常見物體(動物、植物)以及人臉、面部表情等。

谷歌為此還發布了一個TensorFlow.js的工具,有了這項工具,即使不是機器視覺領域的專家,大家也可以實現很多應用場景,比如在瀏覽器中訓練自己的寵物臉辨識系統,在自家的監視系統中使用等等。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 引力空間站 的精彩文章:

程序員們說說看:TensorFlow到底難不難學?
IBM人工智慧是一場騙局!被時代淘汰的巨頭下場如此慘淡!

TAG:引力空間站 |