開源！免費！谷歌AI訓練模型強化學習框架上線GitHub！

科技 11-26

強化學習 - 一種人工智慧（AI）技術，使用獎勵（或懲罰）來驅動代理人朝著特定目標前進 - 訓練打敗Alpha Go世界冠軍的系統並掌握Valve的Dota 2.它是Google子公司的核心部分 DeepMind的深度Q-network（DQN），可以在多個工作人員中分配學習，例如，在Atari 2600遊戲中實現「超人」性能。麻煩的是，強化學習框架需要時間來掌握一個目標，往往不太靈活的，而且不是很穩定。

這也就是谷歌提出替代方案的原因：基於TensorFlow的開源強化框架，它是一個機器學習庫。目前，它已經上線Github。

「受到大腦中獎勵動機行為的主要成分之一的啟發，並反映了神經科學與強化學習研究之間強烈的歷史聯繫，該平台旨在實現可以推動激進發現的那種投機性研究，」Pablo Samuel Castro和 Google Brain Team的研究人員Marc G. Bellemare在一篇博文中寫道。「這個版本還包括一組闡明如何使用我們框架的colabs。」

他們和Google Brain團隊開發了強化框架，其中考慮了三個原則：靈活性，穩定性和可重複性。

為此，它包括一套精心編寫的代碼（15個Python文件），專註於街機學習環境 - 一個用視頻遊戲評估AI技術的平台 - 以及四種不同的機器學習模型：上述DQN;C51; Rainbow代理的簡化版本; 和隱式分位數網路。為了重現性，代碼在Arcade學習環境支持的60個遊戲中提供完整的測試覆蓋率和訓練數據（採用JSON和Python pickle格式），並遵循標準化經驗評估結果的最佳實踐。

除了增強框架的發布，谷歌還推出了一個網站，允許開發人員快速可視化多個代理的培訓運行。它還提供經過訓練的模型，原始統計日誌和TensorFlow事件文件，用於TensorBoard繪圖，TensorBoard是Mountain View公司的TensorFlow程序可視化工具套件。

「我們的希望是，我們的框架的靈活性和易用性將使研究人員能夠嘗試新的思想，包括增量和激進，」Bellemare和Castro寫道。「我們已經積極地將它用於我們的研究，發現它使我們能夠靈活地快速迭代許多想法。我們很高興看到社區可以幫助做些更偉大的事。「

鑒於TensorFlow目前這麼流行，想要學習和實踐的程序員們也可以了解下谷歌最近的AI開源項目——AIY Projects。AIY 全稱是 Artificial Intelligence Yourself，顧名思義就是利用 AI 來進行的 DIY 功能套件。谷歌目前為 AIY Projects 推出了兩款硬體--AIY Voice Kit 和 AIY Vision Kit。其中， Vision Kit（視覺套件）附帶的軟體可運行三個基於TensorFlow的神經網路，可以處理圖像識別和計算機視覺, 支持離線識別上千種常見物體（動物、植物）以及人臉、面部表情等。

谷歌為此還發布了一個TensorFlow.js的工具，有了這項工具，即使不是機器視覺領域的專家，大家也可以實現很多應用場景，比如在瀏覽器中訓練自己的寵物臉辨識系統，在自家的監視系統中使用等等。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 引力空間站 的精彩文章:

※程序員們說說看：TensorFlow到底難不難學？
※IBM人工智慧是一場騙局！被時代淘汰的巨頭下場如此慘淡！

TAG:引力空間站 |