當前位置:
首頁 > 最新 > 2018 Gartner數據科學和機器學習平台魔力象限的贏家和輸家

2018 Gartner數據科學和機器學習平台魔力象限的贏家和輸家

作者|Gregory Piatetsky

譯者|孫浩

編輯|Emily

AI 前線導讀:我們比較了《Gartner 2018 數據科學和機器學習平台的魔力象限》和它的 2017 版本,注意到領導者和挑戰者的顯著變化,其中包括 IBM、SAS、RapidMiner、KNIME、Alteryx、H2O.ai 和 Domino。 Gartner 預計,未來兩到三年內,數據科學和機器學習平台市場將繼續出現動蕩。傳統的廠商將努力變得更加敏捷和具有高響應性。隨著數據科學和機器學習變得越來越普遍,擁有管理數據和分析數據的企業能力將變得越來越重要。

更多乾貨內容請關注微信公眾號「AI 前線」,(ID:ai-front)

Gartner 一直在變更這份報告的名稱 (以及市場部分的內容)——2018 年 2 月 23 日發布的 2018 年最新版,被命名為《數據科學和機器學習平台的魔力象限》(在機器和學習之間有一個老式的破折號)。2017 年,報告名稱是《數據科學平台的魔力象限》,2014-2016 年,名稱則是《高級分析平台的魔力象限》。這些變化反應了行業在內容和能力上的快速改變,以及與 AI 和機器學習成長相關的品牌間的演變。

Gartner 這樣定義數據科學和機器學習平台:

它是一個具有凝聚力的軟體應用程序,提供基本的融合各構件模塊的能力,既可以創建各種數據科學的解決方案,又可以將這個解決方案集成到業務流程及所涉及的周邊基礎設施及產品中去。

正如我們將在下面論述的那樣,2018 年的變化將非常重要。

2018 年的報告採用多個標準評估了 16 家分析和數據科學公司,並基於產品前瞻性和執行力將它們放置在 4 個象限中。

請注意,雖然像 Python 和 R 這樣的開源平台在數據科學市場中扮演著越來越重要的角色,但是 Gartner 的研究方法並沒有包括它們。

1:Gartner 2018 數據科學和機器學習平台的魔力象限

公司介紹:

領導者 (5):KNIME, Alteryx, SAS, RapidMiner, H2O.ai

挑戰者 (2):MathWorks, TIBCO 軟體 (新進入)

遠見者 (5):IBM、微軟、Domino 數據實驗室、Dataiku、Databricks(新進入)

特定領域者 (4):SAP、Angoss、Anaconda (新進入)、Teradata

2017 年新進入了三家公司:TIBCO 軟體、Anaconda 和 Databricks。

在 2017 年的 MQ 中,還有 3 家公司被刪除:FICO、Quest 和 Alpine 數據。我們注意到,Alpine 數據公司和 Quest 的 Statistica 資產被 TIBCO 收購,所以 TIBCO 出現在這次的 MQ 中,其位置接近於 2017 年的 Quest。

正如我們在之前的文章《Gartner 2017 數據科學平台 MQ :贏家和輸家》中所做的那樣,我們將最新的 2018 魔力象限與它之前的版本進行了比較。下面我們將研究這些變化以及其中的贏家和輸家。

文章鏈接:

https://www.kdnuggets.com/2017/02/gartner-2017-mq-data-science-platforms-gainers-losers.html

圖 2:Gartner 對數據科學和機器學習平台的魔力象限進行比較,2018 vs 2017

圖 2 顯示了 2017 MQ(灰色背景圖像) 和 2018 MQ(前景圖像) 的對比狀況,箭頭連接的圓點表示同一家公司。如果公司的位置明顯改善 (遠離剛開始的位置) 箭頭會是綠色的,位置變弱箭頭將用紅色表示。綠色圓圈代表新公司,而紅色 X 表示公司離開了這次的魔力象限。

領導者:

自 2014 年以來,我們第一次有了改變。IBM 過去曾屬於領導者,但由於執行能力較低,它被放到了遠見者象限。KNIME 在前瞻性軸上有顯著的進步,SAS 在同一軸上向後移動,RapidMiner 在執行能力上下降了一點。

2018 年有兩家公司首次加入了領導者行列:H2O.ai,從遠見者象限進入;Alteryx 公司,從挑戰者象限進入。

下面是每個公司的簡短介紹。對於完整報告,請參見文章末尾的鏈接。

KNIME 提供了開源的 KNIME 分析平台產品,全世界有超過 100K 用戶。KNIME 為企業在協作、安全性和效率方面的部署提供商業支持和擴展。2017 年,KNIME 增加了 AWS 和微軟 Azure 平台的雲版本,提高了數據質量特徵,擴展了深度學習能力。

Gartner 點評:

該廠商擁有對市場的深刻理解力、健壯的產品策略和豐富的用例優勢。這些特質凝聚在一起,鞏固了它作為領導者的地位。

Alteryx 平台可以使普通數據科學家能夠在一個獨立的工作流中構建模型。在 2017 年,Alteryx 成功進行了 IPO,後來收購了 Yhat,Yhat 是一個專註於模型部署和管理的數據科學供應商。

Gartner 點評:

Alteryx 已經從挑戰者的象限發展到領導者象限。這要歸功於強有力的執行 (在收入增長和客戶獲取方面),引人矚目的客戶滿意度,以及專註於幫助組織機構在不需要聘請專家數據科學家的情況下引入數據和分析文化的產品願景。

SAS 為分析和數據科學提供了許多軟體產品。對於它的 MQ,Gartner 評估了 SAS 企業版 Miner (EM) 和 SAS 可視化分析套件的產品。

Gartner 點評:

SAS 仍然處在領導者行列,但是在前瞻性和執行力方面已經失去了一些優勢。Visual Analytics 的套件遵循了產品願景,因為它的 Viya 雲就緒架構比以前的 SAS 架構更加開放,並且使得更多的用戶能夠獲得分析能力。然而,令人困惑的多產品策略使 SAS 的產品前瞻性變得越來越糟糕,並且對高授權成本的理解削弱了它的執行力。隨著市場的關注點轉向開源軟體和更靈活的產品,SAS 正在為自己在推出具有粘性的開放平台上的遲緩行為付出代價。

RapidMiner 平台包括 RapidMiner Studio 模型開發工具 (有免費版和商業版)、RapidMiner 伺服器和 RapidMiner Radoop。

Gartner 點評:

RapidMiner 仍然處在領導者行列,它給各種各樣的數據科學家和數據科學團隊提供了一個全面且易於使用的平台。RapidMiner 通過提高生產力和性能能力,繼續強化核心數據科學和模型開發及執行的速度。

H2O.ai 提供開源的機器學習平台產品,包括 H2O Flow,其產品的核心組件;H2O Steam;H2O Sparkling Water,用於 Spark 集成;以及 H2O Deep Water,它提供深度學習的能力。

Gartner 點評:

H2O.ai 已經從之前的遠見者象限發展到領導者象限。它繼續通過重大的商業擴張獲得發展,並鞏固其作為思想領袖和創新者的地位。

挑戰者

MathWorks 仍然是一個挑戰者,得益於它在高級分析領域的高知名度、龐大的裝機量和強大的客戶關係。然而,由於其對工程和高端財務場景的專註限制了其產品的前瞻性,還有一些客戶對其評分也較低。

TIBCO 軟體公司 (新入公司) 在 2017 年 6 月從 Quest Software 公司那裡收購了著名的 Statistica 軟體平台,從而進入了這個市場。2017 年 11 月,該公司還收購了 Alpine Data,這家公司 2017 年就處在 MQ 的遠見者行列。對於執行能力,這次 MQ 僅評估 TIBCO Statistica 平台的能力。TIBCO 的其他收購只對其前瞻性產生影響。

遠見者

IBM 提供了許多分析解決方案。對於這次的 MQ, Gartner 評估了 SPSS Modeler 和 SPSS Statistics,沒有評估 Data Science Experience(DSX),因為它沒有滿足 Gartner 執行力軸的評估標準。

Gartner 點評:

IBM 現在處在遠見者象限,與其他廠商相比,在產品前瞻性和執行能力方面都已經失去了優勢。然而,IBM 的 DSX 具有激發更廣泛且具有創新性的前瞻性產品的潛力。IBM 已經宣布計劃在 2018 年為 SPSS 產品實現一個新的介面,以將 SPSS Modeler 完全集成到 DSX 中。

微軟為數據科學和機器學習提供多種產品。對於雲計算,產品包括 Azure 機器學習、Azure 數據工廠、Azure 流分析、Azure HDInsight、Azure Data Lake 和 Power BI。對於 on-premises 計算,微軟為 SQL Server 提供了機器學習服務 (在此次 MQ 的截止日期之後的 2017 年 9 月發布)。只有 Azure 機器學習工具全部滿足了這次 MQ 包含的所有標準。

Gartner 點評:

微軟仍然處在遠見者象限。它這次的位置是由於市場反應能力和產品生存能力的低分造成的,因為 Azure 機器學習工具的雲計算特性限制了許多高級分析場景的可用性,這些場景需要使用 on-premises 選項。

Domino (Domino Data Lab) 數據科學平台是專家數據科學團隊的端到端解決方案。該平台的專註點是集成來自開源軟體和專有工具生態系統的工具,以實現協作性、再現性以及模型開發和部署的集中化。Domino 雖然仍在遠見者象限,但是它顯著提高了執行力。

Gartner 點評:

Domino……在機器學習生命周期的開始階段 (數據訪問、數據準備、數據探索和可視化),執行能力雖然有所提高,但仍然被產品功能性問題拖了後腿。然而,在過去的一年裡,Domino 充分展現了在競爭激烈的市場中贏得新客戶和獲得關注的能力。

Dataiku 提供 Data Science Studio (DSS) 產品,專註於跨學科協作和產品易用性。

Gartner 點評:

Dataiku 仍然在遠見者象限……因為 DSS 能夠使用戶快速啟動機器學習項目。它的產品前瞻性在於對協作和開源的支持,這也是它的產品路線圖的重點。由於在場景用例方面的廣度相對較差,以及自動化和數據流方面的不足,它的產品前瞻性得分低於之前的 MQ。

Databricks (新入公司) 在雲產品中提供了基於 Apache spark 的 Databricks 統一分析平台。該產品還提供安全性、可靠性、操作化和性能方面的專有特性。

Gartner 點評:

Databricks 是這次魔力象限的新進入者。作為遠見者,它借鑒了開源社區的經驗並結合自己的 Spark 專業知識,為用戶提供了一個易於訪問且熟悉的平台。除了數據科學和機器學習之外,Databricks 還關注數據工程。2017 年獲得 1.4 億美元 D 輪融資,這為 Databricks 提供了豐富的資源,以擴展其部署選項並實現其願景。

特定領域者

SAP 再次將其平台從 SAP 業務對象的預測分析改為簡單的預測分析。它仍然是一個小眾玩家,因為客戶滿意度低,缺乏思想共享,工具鏈碎片化,以及在雲技術、深度學習和 Python 技術上的巨大差距。

Angoss 在 2018 年 1 月被 Datawatch 收購,但由於收購延遲,該報告收錄的仍然是 Angoss。Angoss 擁有忠實的客戶,但仍然是特定領域者,因為它仍然被認為是桌面環境的供應商。

Anaconda (新入公司) 提供 Anaconda Enterprise 5.0 產品,這是一個基於互動式筆記本概念的開源開發環境。它還提供了一個軟體分發環境,通過它可以訪問眾多的開源開發環境和開源庫。

Teradata 提供 Teradata 統一數據體系結構產品,這是一個結合了開源和商業技術來提供分析能力的企業分析生態系統。由於其在數據科學開發方面缺乏凝聚力和易用性,它仍然是一個特定領域者。

市場展望

Gartner 預計,未來兩到三年內,數據科學和機器學習平台市場將繼續出現動蕩。全新的廠商,以及來自鄰近領域市場的現有廠商 (如分析和 BI 公司),將繼續進入該領域。例如,最近一次值得關注的收購案是在 2018 年 1 月 Datawatch 收購 Angoss。傳統的廠商將努力變得更加敏捷和具有高響應性。我們預計廠商間將進行進一步的收購和擴展,以獲得描述性、診斷性、預測性和規範性的分析能力。旨在解決特定的行業問題的應用型的分析解決方案,將繼續提供高級的從內到外的全面分析方案。

總結

傳統的數據科學和機器學習廠商正受到新進入者以及更小、更靈活的競爭對手的挑戰,這些競爭者更容易適應環境,並且隨著市場的發展能夠更迅速的做出反應。其他供應商也在適應市場需求。例如,Amazon 和谷歌正在開發數據科學和機器學習平台。商業軟體公司也進入了市場——例如,Salesforce 推出的 Einstein,Workday 收購的 Platfora。此外,傳統上專註於傳統描述性和診斷分析的廠商正在通過技術改進或收購來擴展他們的能力,以提供一系列的分析能力,其中不僅包括描述性分析和診斷分析,還包括預測性和規範性分析。收購能夠使廠商增強他們的視野,擴大他們的能力,例如:DataRobot 收購的 Nutonian, Progress 收購 DataRPM, TIBCO 軟體收購 Statistica(來自 Quest 軟體的消息) 和 Alpine Data。

許多組織機構在等待新平台的到來,期望新平台能夠幫助擴展現有的基礎設施,並與其他現在技術良好融合。用戶必須清楚這個市場的快速變化,並了解各廠商和其他組織機構是如何應對這些變化的。他們應該定期評估市場狀況並評估當前供應商應對和適應這些變化的能力。此外,他們還應考慮將其分析能力擴展為具有內聚性的描述性、診斷性、預測性和規範性的能力。他們必須熟悉並評估新進入者和顛覆性供應商,以了解這些競爭對手的數據科學和機器學習技術的價值主張。在評估新的廠商和平台時,他們必須評估平台是否與自己已經部署的分析平台存在競爭或互補。此外,考慮從外部服務供應商那裡獲得幫助也是很好的途徑。

隨著數據科學和機器學習變得越來越普遍,擁有管理數據和分析數據的企業能力將變得越來越重要。不只是管理能力,在它的整個生命周期中運作和管理數據科學和機器學習模型的能力,在整個分析生命周期中協作和共享的能力,都變得越來越重要。到目前為止,這一領域還沒有得到很多關注,但它正變得對組織機構的投資回報率最大化至關重要。

你可以從 Domino、H2O.ai、 Alteryx、 Dataiku 以及其他上文提到的廠商處下載《Gartner 2018 數據科學和機器學習平台的魔力象限》報告。

你也可以閱讀一篇相關的報告:《Gartner 2018 分析和商業智能平台的魔力象限》報告。

https://www.sisense.com/blog/gartners-2018-magic-quadrant-next-generation-bi/

https://www.kdnuggets.com/2018/02/gartner-2018-mq-data-science-machine-learning-changes.html

如果您覺得內容優質,記得給我們「留言」和「點贊」,給編輯鼓勵一下!

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器學習 的精彩文章:

在機器學習中經常使用的6種人工神經網路
Mercury自熱夾克使用機器學習為穿著者提供合適的溫度

TAG:機器學習 |