當前位置:
首頁 > 科技 > AI 框架使用排行:TensorFlow、Scikit Learn、IBM Watson、Spark-MLib、Keras

AI 框架使用排行:TensorFlow、Scikit Learn、IBM Watson、Spark-MLib、Keras

作者簡介:Dan Olds是技術趨勢和客戶情緒方面的權威人士,他也是經常被知名行業和商業出版物頻頻引用的專家,比如《華爾街日報》、彭博新聞社、《Computerworld》、《eWeek》、《CIO》和《PCWorld》等。

AI軟體界在迅速發展。新的應用幾乎每天都在層出不窮,現在正好可以趁機了解人們到底在用機器學習和其他AI技術做什麼、這些技術可能何去何從。

我們在之前的兩篇文章中探討了實際用戶在如何對待AI,以及如何利用AI來解決問題、優化企業。我們在本文中將深入了解數據中心的AI角落,看看公司在使用什麼樣的軟硬體。

為此我們OrionX.net開展了一項調查,向用戶展示了二十幾種AI框架,詢問他們是否打算使用某框架、是否已經在使用某框架,或者是否認為自己是專家。

很少有人自稱是任何一種框架方面的專家,平均比例在2%左右。TensorFlow和Scikit Learn是兩種最受歡迎的框架,分別有9%和12%的人自稱是這種框架方面的專家。然而如上圖所示,客戶熟悉大量的AI框架,不過他們不認為自己是專家。

IBM Watson是使用率排名第三的AI框架,Spark-MLib名列第四。我們驚訝地發現,所有24種框架都有各自的粉絲和擁躉。你將這樣一份列表拿給調查用戶看時,通常會看到四五種大受歡迎的選擇,其餘淪為默默無聞。AI框架方面無疑不是這種情況。

雖然這些都是機器學習工具集,但它們並不是完全取代對方,這意味著像TensorFlow和Sciket Learn這樣一兩種流行框架不會淘汰其他框架。

AI硬體:更進一步的觀察

那麼,這些項目有多龐大?它們用於處理AI的集群又有多龐大?這是我們的發現結果。

對調查對象如今從事的所有AI項目而言,平均數據量為442 TB,最大單個項目的平均數據量為235 TB。因此,從下面的平均數據量來看,調查中的典型企業似乎在從事一些很大的項目。

然而,這些統計數據有點欺騙性。如果你看一下中位數而不是平均數,真實情況變得明朗化。AI項目的合併總數據量中位數僅為17TB,而最大單個項目的數據量只有5TB。

平均數和中位數之間差異這麼大,合理的解釋就是,有一小部分的大型項目讓數值出現了很大程度的偏差。AI趨勢仍處於起步階段,目前鮮有企業在開展極其龐大的AI項目。

如果看一下調查對象用於其AI項目的平均集群大小,就可以證明這一點。如圖所示,60%以上的調查對象擁有節點數量不到128個的集群,一大批調查對象使用節點數量不到32個的集群。另一方面,一小批調查對象擁有超過2048個節點的集群,僅20%的調查對象聲稱集群的節點數量在512個到1024個之間。

這也證實了我們處於AI時代的較早時期。隨著我們進一步發展,可能會看到AI集群的規模會迅速變大。

廣闊的加速器世界

在本次調查的硬體部分,我們詢問了關於GPU和FPGA等計算加速器的幾個問題。眾所周知,這些便捷的設備可以加快數字處理,還可以顯著加快深度學習任務,尤其是在機器學習訓練模型方面。GPU已成為大多數用戶的首選加速器,但隨著用戶對專門定製的AI FPGA越來越熟悉,我們預計這類加速器的使用量會逐漸增加。

我們詢問了客戶他們對於特定的GPU和FPGA加速器有多熟悉,為此給他們看了一份列有眾多候選者的長長列表,詢問他們是否熟悉該設備或目前是否在使用該設備。

下表代表了我們在2017年春夏期間所能找到的每一款加速器。到目前為止,可能還有更多的加速器即出現在市面上,或者更大的玩家會收購本文列表上的更多加速器。

看到80%的調查對象使用英偉達GPU加速器或熟悉英偉達GPU加速器,這不足為奇。

AMD GPU和谷歌TPU的熟悉度/使用率不相上下,都是60%多一點,而英特爾的Altera FPGA排在第四位。事實上,由於四處收購FPGA技術公司(具體來說指Altera和Movidius),英特爾有多款GPU加速器上榜。

我們沒有料想到的一個方面是,調查對象很熟悉或在使用榜單上不大知名的技術。就連榜單上知名度/使用量最小的硬體(來自Krtkl,這是一家設計嵌入式FPGA等產品的小公司)也被我們25%的調查對象所認可。

結束語

在第一篇文章中,我們的數據顯示,雖然幾乎所有的調查對象都在開展AI項目,但很少有人(約7%)真正在生產環境下搞AI項目。在第二篇文章中,我們發現大多數實際的AI項目旨在推進和簡化典型應用,比如預測性維護和分析大數據。雖然圖像、語音和視頻AI分析似乎備受媒體的關注,但大多數客戶在使用AI來分析數字和文本。

我們在本文中了解到,雖然有幾個非常大的AI項目(至少由我們的300多個調查對象來判斷是這樣),但就數據量而言,中位數項目還是相當小(約5TB)。我們還發現,說到GPU和FPGA之類的AI加速器,實際的客戶熟悉行情,他們知道這個市場的大小玩家。我們還再次證實了自己的假設:AI的發展處於早期階段;對於這個激動人心的細分市場而言,真正的發展還未到來。

報告全文:


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雲頭條 的精彩文章:

Intel將Wind River賣給了 TPG
區塊鏈是狗屎!

TAG:雲頭條 |