2018年大數據市場獲得成長並遷移到雲端
關鍵訊息,D1時間送達!
如今,大數據當然沒有變得更小,但是增長數據存儲的規模不再像以前那樣受到關注。相反,大多數組織都專註於分析、數據科學和機器學習。他們已經接受管理大數據只是公司業務的一部分的事實,如果他們想要競爭並取得成功,他們需要找到方法將這些大數據變成寶貴的見解。
「大數據」這個術語在20世紀90年代後期首次成為科技辭彙。當時SGI公司的John Mashey等人開始使用這個術語描述企業擁有和產生的龐大且不斷增長的數據,這些數據當時難以使用可用的技術進行存儲和分析。
2001年,分析師Doug Laney建議對大數據進行定義,其中包括三個V:數量(volume)、速度(velocity)和種類(variety)。在接下來的幾年中,Laney的定義成為了行業標準,並且有些人在這個定義中增加了第四個V- 變異性(variability)。
2005年,當雅虎公司推出Hadoop開源分散式數據存儲時,大數據技術向前邁進了一大步。該項目成為整個商業和開源數據存儲和分析解決方案生態系統的關鍵。
2014年,IDC公司和EMC公司發布了他們最新的數字宇宙的研究報告,報告顯示全球數字系統存儲的數據量每年增長40%。這些研究機構預測,到2020年,數字世界將擁有44澤位元組的信息,而這幾乎與宇宙中的恆星數量一樣多。
如今,大數據當然沒有變得更小,但是增長數據存儲的規模不再像以前那樣受到關注。相反,大多數組織都專註於分析、數據科學和機器學習。他們已經接受管理大數據只是公司業務的一部分的事實,如果他們想要競爭並取得成功,他們需要找到方法將這些大數據變成寶貴的見解。
大數據市場概述
大數據技術的企業支出在過去十年持續攀升。根據IDC公司的數據,全球大數據和業務分析收入可能從2017年的1508億美元增長到2020年的2100億美元,年複合增長率為11.9%。
IDC公司副總裁Dan Vesset表示:「經過多年的採用後,大數據和業務分析解決方案終於成為主流。大數據分析作為決策支持和決策自動化的推動者現在已經得到企業高層管理人員的高度關注,這種類型的解決方案也是在全球各個行業和業務流程中實現數字化轉型工作的關鍵支柱之一。」
研究報告表明,企業的大數據舉措正在對他們的利潤產生積極影響。在NewVantage Partners進行的大數據高管調查中,80.7%的受訪者表示他們的大數據投資是成功的,48.4%的受訪者表示他們已經通過大數據舉措實現了可衡量的收益。
這些結果可能會鼓勵企業繼續投資大數據,但他們採用的大數據解決方案類型正在發生變化。根據Forrester Research公司的調查報告,「大數據轉向雲計算是事實,通過雲訂閱的全球大數據解決方案支出的增長速度將比內部訂閱快7.5倍。」
該公司補充說,「此外,根據2016年和2017年對數據分析專業人士的調查,公共雲是大數據的首要技術優先事項。」
採用雲計算對於依賴機器學習技術的大數據分析來說特別流行。採用機器學習需要先進且昂貴的計算硬體,但在雲中運行機器學習使組織能夠以自己的數據中心所花費成本的一小部分來採用該技術。雖然企業面臨著與雲計算分析相關的一些挑戰,但專家表示,這種雲計算分析趨勢在未來幾年可能會加速實現。
大數據技術的市場細分
隨著大數據市場的成熟,供應商開發了各種各樣的大數據技術來滿足企業需求。這是一個非常廣闊的市場,但大多數大數據解決方案都屬於以下幾類之一:
?商業智能(BI):商業智能解決方案為通常存儲在數據倉庫中的業務數據提供分析和報告功能。根據Gartner公司的預測,商業智能和分析市場預計將從2017年的183億美元增加到2020年的228億美元。然而,這一增長速度比過去有所放緩。
?數據挖掘:數據挖掘是一個廣泛的類別,涵蓋了用於查找大數據模式的各種技術。雖然許多大數據解決方案仍然提供數據挖掘功能,但這個術語已經不太受歡迎,因為供應商使用「預測分析」和「機器學習」等術語來描述他們的解決方案。
?數據集成:大數據分析的一大挑戰是收集來自不同來源的所有相關數據,並將其轉換為可易於分析的格式。這導致了大量的數據集成解決方案,這些解決方案有時也被稱為ETL(簡稱「提取、轉換、載入」)解決方案。根據調查數據,到2022年,數據集成的市場收入可能會達到124億美元。
?數據管理:這類解決方案包括幫助組織整合、清潔、存儲、保護和確保其數字數據質量的工具。調查報告中預測,到2022年,這類大數據工具的市場收入將達到1052億美元。
?開源技術:許多最廣泛使用的大數據技術可以在開源許可證下獲得。特別是由Apache基金會管理的Hadoop和Spark等技術已經非常流行。許多供應商提供這些開源大數據技術的商業支持版本。
?數據湖:數據湖是一個存儲庫,可以從各種來源獲取數據並以原生格式存儲數據。這與數據倉庫有所不同,後者存儲已經過清理和格式化以用於分析的數據。數據湖泊很受希望對結構化數據和非結構化數據執行分析的組織的歡迎。
?NoSQL資料庫:與關係資料庫管理系統(RDBMSes)不同,NoSQL資料庫不會將信息存儲在具有行和列的傳統表中。相反,他們使用其他模型,如列、文檔或圖形來跟蹤數據。許多企業使用NoSQL資料庫來存儲非結構化數據進行分析。
?預測分析:目前最流行的大數據分析形式之一,預測分析著眼於歷史趨勢,以便對未來可能發生的事情提供一個良好的估計。許多現代預測分析解決方案都集成了機器學習功能,使他們的預測隨著時間的推移變得更加準確。在Zion Market Research公司的調查報告中,預測分析支出可能從2016年的34.9億美元上升到2022年的109.5億美元。
?規定性分析:規定性分析比預測分析更進一步。除了告訴組織未來可能發生的事情外,這些解決方案還提供了建議的行動方案,以實現預期的結果。專家表示,目前市場上很少有(如果有的話)大數據分析解決方案具有真正的規範功能,但這是供應商進行深入研究的一個領域。
?內存資料庫:內存技術使得大數據分析顯著加快。在任何計算機系統中,訪問內存中的數據(有時也稱為RAM)比訪問存儲在機械硬碟驅動器或固態硬碟驅動器上的數據要快得多。內存資料庫允許用戶將大量數據存儲在內存中,從而大大提高速度。
?人工智慧和機器學習:許多下一代大數據分析工具都集成了機器學習,這是人工智慧(AI)的一個子類。機器學習使用演算法來幫助系統隨著時間的推移逐漸完善,而不需要明確的編程。這是大數據市場增長最快的領域之一。
?數據科學平台:許多供應商已開始將其大數據分析解決方案標記為「數據科學平台」。這一類產品通常在統一平台中包含許多不同的功能。幾乎所有這類產品都具有一些分析和機器學習功能,而且還有許多產品也具有數據集成或數據管理功能。
全球主要的大數據公司
考慮到市場上包含如此多不同類型的大數據解決方案,所以有很多的公司提供大數據產品就不足為奇。下面的列表包括一些全球最知名的大數據公司,但還有很多其他的公司。
?亞馬遜網路服務公司(AWS)-提供雲存儲、資料庫、數據倉庫、分析和機器學習服務
?Alpine Data Labs -現在由Tibco公司所有,提供數據科學和機器學習平台
?Alteryx-提供自助式大數據分析平台
?Big Panda-提供監測和管理IT事件數據的分析
?Cloudera - 提供Hadoop發行版,以及數據科學和大數據分析工具
?Databricks - 由Apache Spark團隊創建,提供由Spark支持的統一分析平台
?Dataiku - 提供協作式數據科學平台
?Datameer - 提供靈活的數據管道管理平台
?DataStax - 由Apache Cassandra資料庫背後的團隊創建,提供基於Cassandra的分散式雲資料庫
?Domino - 提供了一個數據科學平台
?FICO - 提供數據分析工具,包括人工智慧和機器學習軟體以及打擊欺詐和網路犯罪的解決方案
?谷歌雲-提供基於雲計算的存儲、數據倉庫、分析、機器學習等技術
?GridGrain - 提供基於Apache Ignite的內存計算平台
?H2O.ai - 提供基於開源技術的數據科學和機器學習平台
?Hitachi Vantara -由日立數據系統、日立Insight集團和PunaHo合併而成,提供數據集成、大數據分析、存儲和相關產品
?Hortonworks - 提供流行的Hadoop發行版以及其他大數據工具和服務
?HPCC - 提供分散式大數據平台,可替代Hadoop
?HPE - 提供大數據硬體和服務
?IBM - 提供大數據云服務,以及資料庫、數據倉庫、分析和機器學習軟體
?Informatica - 提供基於雲計算的數據管理平台,提供各種大數據解決方案
?KNIME - 提供數據挖掘和分析軟體
?MapR--提供融合數據平台,以及大數據存儲、分析、機器學習和NoSQL資料庫
?MarkLogic - 提供NoSQL資料庫和數據集成工具
?Microsoft Azure--提供基於雲計算的存儲、大數據分析、機器學習、數據倉庫、數據湖等等
?MongoDB - 基於相同的技術提供NoSQL資料庫和雲計算服務
?Mu Sigma - 提供大數據分析和決策科學解決方案
?Oracle - 提供基於雲計算和內部部署的資料庫、數據集成、數據管理、分析等
?Palantir - 提供數據集成和數據管理解決方案
?Pivotal--提供內存技術和多雲分析平台
?Qlik - 提供商業智能和分析軟體
?RapidMiner - 提供數據挖掘、數據科學、預測分析、機器學習解決方案
?SAP - 提供內存數據管理、分析、人工智慧和機器學習工具
?SAS - 提供分析、商業智能和數據管理解決方案
?SiSense - 提供商業智能和分析
?Splice Machine - 提供組合資料庫、數據倉庫和機器學習平台
?Splunk - 提供日誌和安全數據的分析
?Striim - 提供流式分析
?SumoLogic - 提供日誌和安全數據的分析
?Tableau - 提供商業智能和大數據分析
?Talend - 提供大數據集成工具
?Tibco Jaspersoft - 提供商業智能和分析
?Teradata - 提供數據倉庫、數據湖和業務分析
版權聲明:本文為企業網D1Net編譯,轉載需註明出處為:企業網D1Net,如果不註明出處,企業網D1Net將保留追究其法律責任的權利。
(來源:企業網D1Net)
企業網D1net已推出企業應用商店(www.enappstore.com),面向企業級軟體,SaaS等提供商,提供陳列,點評功能,不參與交易和交付。現可免費入駐,入駐後,可獲得在企業網D1net 相應公眾號推薦的機會。歡迎入駐。


※全球首個基於Azure技術的區塊鏈投資產品已推出
※雲計算對災難恢復規劃的影響
TAG:企業網D1net |