什麼是大數據?你需要知道的一切
大數據定義
一般而言,大數據是指數量龐大且複雜的數據集,以至於傳統的數據處理軟體無法在合理的時間內捕獲,管理和處理數據。
這些大數據集可以包括結構化,非結構化和半結構化數據,每個數據都可以挖掘出價值潛力。
究竟有多少數據實際上構成「大」呢是有爭議的,但它通常可能是PB級的倍數,可能對應於EB級的數據。(1EB=1024PB 1PB=1024TB 1TB=1024GB)
大數據通常以三個特徵:
極端的數據量廣泛的多種類型的數據能夠加工處理的數據
構成大數據存儲的數據可以來自網站,社交媒體,桌面和移動應用,科學實驗以及物聯網中越來越多的感測器和其他設備。
大數據和分析
真正能夠從所有大數據中獲得價值的是應用於數據的分析。沒有分析,這僅僅只是一堆數據。
數據分析包括檢查數據集以獲得見解或得出數據中的有價值內容。
通過分析數據可以做出更明智的業務決策,例如何時何地進行營銷活動或引入新產品或服務。
分析可以指基本的商業分析或更高級的預測性分析,例如科學機構使用的分析。在最先進的數據分析類型中,數據挖掘是分析師評估大型數據集來發現看似無關事務之間關係的一種方式。
IT中的架構來支持大數據
對於大數據工作,團隊需要有適當的設備來收集和存儲數據,提供對數據的訪問,並在存儲和傳輸過程中保護信息。
由於公司希望繼續利以數據為中心的投資,因此大部分基於大數據的架構可能都是公司內部自己部署的。但越來越多的機構依靠雲計算服務來處理大部分大數據需求。
數據收集需要有數據源。其中很多,如網路應用程序,社交媒體渠道,移動應用程序和電子郵件已經成為了重要的幾個數據源。但隨著物聯網逐漸成熟,企業可能需要在各種設備和產品上部署感測器來收集數據,並生成用戶對應的數據。
為了存儲所有傳入的數據,大數據需要有適當的數據存儲方式。存儲方式包括傳統的數據倉庫,數據池和基於雲的存儲。
以上這些關於大數據的基本知識你get到了嗎。


TAG:西懷說志科技 |