當前位置:
首頁 > 新聞 > Reddit熱議:只要2行代碼,免費開源ML管理工具TRAINS

Reddit熱議:只要2行代碼,免費開源ML管理工具TRAINS

Reddit熱議:只要2行代碼,免費開源ML管理工具TRAINS

【新智元導讀】本日Reddit熱議:開源機器學習管理平台TRAINS。據開發者介紹,該平台能夠通過中央伺服器集中記錄管理ML模型的一切信息,整合方便,與主流框架無縫對接,僅用兩行代碼即可啟用,相關Demo和GitHub資源已開放。

今天Reddit頭號熱帖看起來像是一條廣告:這是一個ML團隊自家開發的模型管理平台,名字很別緻,叫「TRAINS」,很直觀有沒有?

帖子作者是開發團隊成員之一,上來第一句就很耿直:現在機器學習模型管理平台很多,要不要來試試我們剛開源這個?

簡單介紹一下,這個平台名叫TRAINS,我們團隊沒有營銷team,所以我作為開發團隊一員,先發到reddit上讓你們先試試看了!

你這平台最大特點是啥?使用簡便!只需在腳本中添加兩行代碼,模型、性能指標、超參數就盡在掌握了。

話說回來,只要分享的東西好用,作為「美國貼吧」的Reddit上的網友其實並不拒絕廣告,下邊網友就開始提問了,比如:

我現在還沒進GitHub里詳細查看,不如你簡單介紹一下這個TRAINS平台和現有其他機器學習模型管理平台,比如和Sacred的區別、或者說是特別之處在哪兒呢?

Reddit熱議:只要2行代碼,免費開源ML管理工具TRAINS

樓主表示這個問題問的好。他表示,主要有六點區別

  • TRAINS整合整個資源庫只需兩行代碼,如果是Scared的話,需要為每個函數添加修飾器,記錄每個量度和超參數,顯示整合非常麻煩。
  • TRAINS還會自動將git repo和commit與實驗中的訓練過程連接起來。(據我所知,這在Sacred中是辦不到的,至少不容易實現)
  • TRAINS自動記錄模型(工件)並在集中位置創建它們的副本,因此團隊可以輕鬆共享模型和初始權重(使用Sacred,只能手動執行操作,只能在共享文件夾上共享。
  • TRAINS界面美觀,連續幾小時盯著不累眼睛。
  • TRAINS允許用戶從Python式的界面中輕鬆查詢實驗數據和指標。
  • TRAINS(如Scared)還允許用戶直接訪問mongoDB和elasticsearch資料庫,以便更深入地了解系統。

不過,作者Reddit上的回復中對TRAINS的介紹比較簡略,我們還可以去GitHub上看看。

GitHub上的介紹就直接多了,介紹說明文檔中直接將TRAINS稱為一套「神奇的自動化AI實驗管理器和版本控制器。」

即使是才華橫溢的科學家,工程師或開發人員,在獨立工作時都難免被複雜的流程搞得一團亂麻。機器學習的工作流程是可以管理的。隨著時間的推移和項目人手的增加,管理的混亂會降低生產力。隨著項目向生產方向發展,必須通過可見性和出處(provenance)來擴展深度學習的研究成果。

不論是對於團隊還是企業,TRAINS都能將所有內容記錄在一個中央伺服器中,並實現可視化和出處,這樣生產力就不會受到影響。TRAINS可以記錄和管理各種深度學習研究的模型負載,並且幾乎不需要付出集成成本。

我們專門設計了TRAINS,能夠輕鬆集成模型參數,團隊可以保留現有的方法和實踐。可以每天使用TRAINS來增強團隊協作,提升可視化程度,還可以用來將實驗日誌、輸出和數據收集到一個集中式的中央伺服器上。

Demo地址:https://demoapp.trainsai.io (需要註冊)

究竟神奇在哪呢?以下是作者團隊總結的TRAINS的主要特點。

Reddit熱議:只要2行代碼,免費開源ML管理工具TRAINS

TRAINS是我們解決機器學習/深度學習領域中與無數其他研究人員和開發人員分享的問題的方法:培訓生產級深度學習模型是一個光榮而又混亂的過程。TRAINS通過關聯代碼版本控制、研究項目、性能指標和模型出處來跟蹤和控制流程。


無縫兼容常用框架,一站式記錄所有模型數據

現在就能用

TRAINS免費開源,只需要兩行代碼即可完全集成。

可與其他常用工具一起使用

TRAINS與現有主要框架無縫集成,包括:PyTorch、TensorFlow、Keras和其他即將推出的框架支持Jupyter Notebook和PyCharm遠程調試

Reddit熱議:只要2行代碼,免費開源ML管理工具TRAINS

TRAINS伺服器和使用TRAINS python包的GPU訓練機器的交互過程

記錄一切:讓機器學習實驗真正可重複

自動關聯模型+代碼+參數+初始權重的模型日誌記錄

自動在集中存儲上創建模型副本(支持共享文件夾、S3、GS,Azure即將推出!)

共享與合作

多用戶過程跟蹤與合作

中心伺服器能夠整合日誌、記錄和通用統計數據

提高生產力

全面的實驗數據比對,代碼貢獻、初始權重、超參數和量度結果等。

組織與管理

管理並組織項目中的實驗

查詢能力。通過結果量度對實驗進行分類和篩選。

更多特色

通過網頁應用,利用遠程機器終止實驗

提供經過現場測試的功能豐富的SDK,可滿足用戶的即時定製化需求

有關TRAINS機器學習模型管理平台的更多詳情,可參閱GitHub資源:https://github.com/allegroai/trains

參考鏈接:

Reddit:

https://www.reddit.com/r/MachineLearning/comments/c2g2li/n_there_are_many_platforms_to_manage_your_ml/

GitHub:https://github.com/allegroai/trains

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

機器人教父:自動駕駛30年內能上路,實現通用人工智慧還要300年
高通「沒有許可,就沒有晶元」被判壟斷,霸王授權費不準收了?

TAG:新智元 |