想要快速的搭建高性能機器學習系統,企業應該怎麼干?
雷鋒網按:本文為「範式大學系列課程」。
亞馬遜目前的運維水平成為行業標準,但凡有公司要自己搭建 OpenStack,先要回答一個問題:OpenStack 比亞馬遜雲的優勢是什麼?
對於機器學習來說,公司要自己搭建機器學習系統,也可以先問一個問題:需要多長時間和多少錢,才能達到行業領先的性能?
要知道,時間成本 + 喪失的競爭優勢是無價的。
我們來算算這筆賬。
1、時間自建機器學習系統,大概有這麼幾步:
步驟 1:招聘機器學習團隊的 Leader,2 個月
步驟 2:搭建機器學習團隊,2 個月
步驟 3:前期業務調研,2 個月
步驟 4:前期技術調研,2 個月
步驟 5:數據採集相關開發和數據積累,0.5 個月
步驟 6:數據分析處理,1 個月
步驟 7:模型調研,0.5 個月
步驟 8:線上系統開發,0.5 個月
步驟 9:a/b測試和模型優化,0.5 個月
合計:11 個月
這是相對較快的時間表,如果在哪個環節踩到坑,拖延的時間就沒法計算了。
如果要減少時間,關鍵是什麼?
專業化分工 + 專註核心環節。
實際上,真正需要自己做的是數據採集、模型調研和模型優化,在專業化工具的幫助下,這些環節可以縮短到 1 個月。而其他 10 個月時間的工作,已經有專業化工具可以替代,溝通和實施時間可以縮短到 0.5 個月。
這樣就從原來的 11 個月,變成了 1.5 個月。
2、錢機器學習系統的投入,一般是這樣的:
1000 萬行/天的數據規模,機器學習系統一年的支出是 944 萬。
如果要減少投入,關鍵是什麼?
專業化分工 + 專註核心環節。
通過使用機器學習平台,上面的投入會變成這樣。
10 台線上機器和 20 台線下機器 ,企業在購買時是按照峰值數據量配備的,但機器實際運轉的時間,往往只有 1/8,即每天運行 3 小時。剩下的 7/8 是浪費的。另外,開源機器學習框架對資源利用效率低,又是一大塊資源浪費。
所以原本需要 10 台線上機器和 20 台線下機器,通過機器學習平台只需要 2 台線上機器和 4 台線下機器,節約了 240 萬。
在人員投入上,30 台的機器需要配備 1 個帶頭人、3 個研發、1 個測試、1 個運維、1 個機器學習專家和 1 個業務專家,但如果採用機器學習平台,在專業化工具的幫助下,企業只需要 0.5 個機器學習專家和 0.5 個業務專家。
通過使用機器學習平台,企業的人力成本可以節約 588 萬。
另外,機器學習平台的思路可以實現 1.5 個月上線,如果全部自己做則需要 11 個月甚至更久。如果錯過了搶佔市場的黃金期,損失就是巨大了。對於一個 1000 萬行數據規模的公司來說,我們假定 9.5 個月延遲的損失是 5000 萬。
所以我們得到了兩個數字:
如果不考慮時間的機會成本,採用機器學習平台的成本是自建系統成本的 12.3%。
如果考慮時間的機會成本(5000 萬),採用機器學習平台的成本是自建系統成本的 2%。
3、機器學習系統
機器學習系統的性能有 3 個要素:
Max AUC:模型能達到最好的效果,好比山的高度
Actual AUC:實際上線模型的效果,好比爬到多高
Time:模型訓練和預測所需要的時間,好比多久爬到這個高度
如果自己搭建機器學習系統,首先遇到的瓶頸一般是數據處理能力。
對於大部分機器學習團隊來說,他們一般可以處理幾十萬規模的數據量,但如果數據規模超過 10 億,那麼即便是簡單的邏輯回歸模型,也會變成一個非常困難的問題。
為了遷就不足的計算能力,一般會做的事情是減少特徵數量和樣本數量,這樣才能在業務需要的時間內把模型訓練出來。
但這樣會造成很不好的結果,Max AUC 因為特徵和樣本數量減少而降低,Actual AUC 因為 Max AUC 和計算能力不足而降低,Time 因為計算能力不足而增加,最終整個系統的能力就會遇到瓶頸。
如果要提升性能,關鍵是什麼?
專業化分工 + 專註核心環節。
大規模機器學習的計算框架是一件非常難的事情,因為它不僅需要處理億萬規模的數據,而且要符合機器學習的規則。能做大規模機器學習計算框架的人全國都屈指可數,基本集中在百度、阿里、騰訊以及少數的創業公司。
所以對於公司來說,與其死啃大規模機器學習的計算框架,反而不如購買第三方的專業服務(這就好比你不會自己開發晶元)。而當計算能力充足的時候,公司就可以專註自己的核心環節,把特徵的維度做上去,把數據的規模做上去,把數據和業務的結合做的更清晰。
這樣公司機器學習系統的性能,例如在業務需要的時間內獲得的 AUC 才能提升上去。
4、總結總的來說,公司要做機器學習,應該採取專業化分工 + 專註核心環節的方式,具體如下:
專業化分工完成和輔助完成的:前期業務調研、前期技術調研、數據處理、模型調研、模型優化、模型上線、大規模機器學習計算框架、線下機器、線上機器、運維、大部分的工程投入。
公司專註完成的環節:業務問題定義、數據採集、特徵擴充、模型調研。
這樣,只需要 1.5 個月的時間,大約 10%(2%) 的成本,不僅獲得了高性能的機器學習系統,而且能帶來實際業務效果的提升,讓機器學習能力真正轉變為市場競爭力。
(完)


※2小時、5大AI 新品、英偉達股價暴漲17%,GTC大會上黃仁勛都講了些啥?(內附PPT)
※碼隆科技亮相矽谷英偉達GTC,發布ProductAI國際版平台丨GTC2017
※暴風攜手驀然認知推出第一款AI對話交互TV
※選購深度學習 GPU,僅僅有性價比排名還不夠!
TAG:雷鋒網 |
※高效能教練:如何打造堅不可摧的信念系統,輕鬆成為學習高手?
※大排騎行|能停下比跑得快更重要!快速了解機車制動系統
※智能手機系統更新速度哪家強 蘋果、谷歌都不錯
※智能輔助系統漸成標配,但自動剎車功能成為投訴率最高的功能
※如何快速打造出公安領域的智能系統
※智能手機不停提示系統、軟體更新,是更新好還是不更新好?
※智能手機到底需不需要升級系統?
※讓機器學習如虎添翼:存儲廠商爭相利用GPU增強系統性能
※為什麼沒有一種手機系統能夠結合安卓和蘋果?
※電腦應該這樣優化可以減少系統垃圾,讓系統運行變快
※電腦應該這樣清理才可以讓系統運行速度更快更好
※電池容量大還不夠!手機長續航還要像它一樣做好系統優化
※華為為什麼不採用或自己設計出像iOS這樣的系統,使手機運行更加流暢更具有競爭力?
※鍛煉腿部能提高有意神經系統和大腦健康,你信嗎?
※為何冷兵器沒有發展出系統的擒拿技?要想鎖住兵器太難
※手機系統到底要不要更新?
※這是要出手機的節奏 尼康正研發搭載安卓系統的相機
※如何在閉環控制應用中提高系統性能?
※應怎樣理解單兵綜合系統?效能遠大於步槍加榴彈發射器
※可應用於數據中心的快速、高容量的光纖傳輸系統