當前位置:
首頁 > 新聞 > 想要快速的搭建高性能機器學習系統,企業應該怎麼干?

想要快速的搭建高性能機器學習系統,企業應該怎麼干?

雷鋒網按:本文為「範式大學系列課程」。

想要快速的搭建高性能機器學習系統,企業應該怎麼干?

亞馬遜目前的運維水平成為行業標準,但凡有公司要自己搭建 OpenStack,先要回答一個問題:OpenStack 比亞馬遜雲的優勢是什麼?

對於機器學習來說,公司要自己搭建機器學習系統,也可以先問一個問題:需要多長時間和多少錢,才能達到行業領先的性能?

要知道,時間成本 + 喪失的競爭優勢是無價的。

我們來算算這筆賬。

1、時間

自建機器學習系統,大概有這麼幾步:

  • 步驟 1:招聘機器學習團隊的 Leader,2 個月

  • 步驟 2:搭建機器學習團隊,2 個月

  • 步驟 3:前期業務調研,2 個月

  • 步驟 4:前期技術調研,2 個月

  • 步驟 5:數據採集相關開發和數據積累,0.5 個月

  • 步驟 6:數據分析處理,1 個月

  • 步驟 7:模型調研,0.5 個月

  • 步驟 8:線上系統開發,0.5 個月

  • 步驟 9:a/b測試和模型優化,0.5 個月

合計:11 個月

這是相對較快的時間表,如果在哪個環節踩到坑,拖延的時間就沒法計算了。

如果要減少時間,關鍵是什麼?

專業化分工 + 專註核心環節。

實際上,真正需要自己做的是數據採集、模型調研和模型優化,在專業化工具的幫助下,這些環節可以縮短到 1 個月。而其他 10 個月時間的工作,已經有專業化工具可以替代,溝通和實施時間可以縮短到 0.5 個月。

這樣就從原來的 11 個月,變成了 1.5 個月。

2、錢

機器學習系統的投入,一般是這樣的:

想要快速的搭建高性能機器學習系統,企業應該怎麼干?

1000 萬行/天的數據規模,機器學習系統一年的支出是 944 萬。

如果要減少投入,關鍵是什麼?

專業化分工 + 專註核心環節。

通過使用機器學習平台,上面的投入會變成這樣。

想要快速的搭建高性能機器學習系統,企業應該怎麼干?

10 台線上機器和 20 台線下機器 ,企業在購買時是按照峰值數據量配備的,但機器實際運轉的時間,往往只有 1/8,即每天運行 3 小時。剩下的 7/8 是浪費的。另外,開源機器學習框架對資源利用效率低,又是一大塊資源浪費。

所以原本需要 10 台線上機器和 20 台線下機器,通過機器學習平台只需要 2 台線上機器和 4 台線下機器,節約了 240 萬。

在人員投入上,30 台的機器需要配備 1 個帶頭人、3 個研發、1 個測試、1 個運維、1 個機器學習專家和 1 個業務專家,但如果採用機器學習平台,在專業化工具的幫助下,企業只需要 0.5 個機器學習專家和 0.5 個業務專家。

通過使用機器學習平台,企業的人力成本可以節約 588 萬。

另外,機器學習平台的思路可以實現 1.5 個月上線,如果全部自己做則需要 11 個月甚至更久。如果錯過了搶佔市場的黃金期,損失就是巨大了。對於一個 1000 萬行數據規模的公司來說,我們假定 9.5 個月延遲的損失是 5000 萬。

所以我們得到了兩個數字:

  • 如果不考慮時間的機會成本,採用機器學習平台的成本是自建系統成本的 12.3%。

  • 如果考慮時間的機會成本(5000 萬),採用機器學習平台的成本是自建系統成本的 2%。

3、機器學習系統

機器學習系統的性能有 3 個要素:

  • Max AUC:模型能達到最好的效果,好比山的高度

  • Actual AUC:實際上線模型的效果,好比爬到多高

  • Time:模型訓練和預測所需要的時間,好比多久爬到這個高度

如果自己搭建機器學習系統,首先遇到的瓶頸一般是數據處理能力。

對於大部分機器學習團隊來說,他們一般可以處理幾十萬規模的數據量,但如果數據規模超過 10 億,那麼即便是簡單的邏輯回歸模型,也會變成一個非常困難的問題。

為了遷就不足的計算能力,一般會做的事情是減少特徵數量和樣本數量,這樣才能在業務需要的時間內把模型訓練出來。

但這樣會造成很不好的結果,Max AUC 因為特徵和樣本數量減少而降低,Actual AUC 因為 Max AUC 和計算能力不足而降低,Time 因為計算能力不足而增加,最終整個系統的能力就會遇到瓶頸。

如果要提升性能,關鍵是什麼?

專業化分工 + 專註核心環節。

大規模機器學習的計算框架是一件非常難的事情,因為它不僅需要處理億萬規模的數據,而且要符合機器學習的規則。能做大規模機器學習計算框架的人全國都屈指可數,基本集中在百度、阿里、騰訊以及少數的創業公司。

所以對於公司來說,與其死啃大規模機器學習的計算框架,反而不如購買第三方的專業服務(這就好比你不會自己開發晶元)。而當計算能力充足的時候,公司就可以專註自己的核心環節,把特徵的維度做上去,把數據的規模做上去,把數據和業務的結合做的更清晰。

這樣公司機器學習系統的性能,例如在業務需要的時間內獲得的 AUC 才能提升上去。

4、總結

總的來說,公司要做機器學習,應該採取專業化分工 + 專註核心環節的方式,具體如下:

專業化分工完成和輔助完成的:前期業務調研、前期技術調研、數據處理、模型調研、模型優化、模型上線、大規模機器學習計算框架、線下機器、線上機器、運維、大部分的工程投入。

公司專註完成的環節:業務問題定義、數據採集、特徵擴充、模型調研。

這樣,只需要 1.5 個月的時間,大約 10%(2%) 的成本,不僅獲得了高性能的機器學習系統,而且能帶來實際業務效果的提升,讓機器學習能力真正轉變為市場競爭力。

(完)

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

2小時、5大AI 新品、英偉達股價暴漲17%,GTC大會上黃仁勛都講了些啥?(內附PPT)
碼隆科技亮相矽谷英偉達GTC,發布ProductAI國際版平台丨GTC2017
暴風攜手驀然認知推出第一款AI對話交互TV
選購深度學習 GPU,僅僅有性價比排名還不夠!

TAG:雷鋒網 |

您可能感興趣

高效能教練:如何打造堅不可摧的信念系統,輕鬆成為學習高手?
大排騎行|能停下比跑得快更重要!快速了解機車制動系統
智能手機系統更新速度哪家強 蘋果、谷歌都不錯
智能輔助系統漸成標配,但自動剎車功能成為投訴率最高的功能
如何快速打造出公安領域的智能系統
智能手機不停提示系統、軟體更新,是更新好還是不更新好?
智能手機到底需不需要升級系統?
讓機器學習如虎添翼:存儲廠商爭相利用GPU增強系統性能
為什麼沒有一種手機系統能夠結合安卓和蘋果?
電腦應該這樣優化可以減少系統垃圾,讓系統運行變快
電腦應該這樣清理才可以讓系統運行速度更快更好
電池容量大還不夠!手機長續航還要像它一樣做好系統優化
華為為什麼不採用或自己設計出像iOS這樣的系統,使手機運行更加流暢更具有競爭力?
鍛煉腿部能提高有意神經系統和大腦健康,你信嗎?
為何冷兵器沒有發展出系統的擒拿技?要想鎖住兵器太難
手機系統到底要不要更新?
這是要出手機的節奏 尼康正研發搭載安卓系統的相機
如何在閉環控制應用中提高系統性能?
應怎樣理解單兵綜合系統?效能遠大於步槍加榴彈發射器
可應用於數據中心的快速、高容量的光纖傳輸系統