與大數據有關的一些術語
隨著大數據時代的到來
數據倉庫、數據分析、數據挖掘等術語
也越來越多地出現在我們的生活中
那麼,你了解這些技術嗎?
資料庫&數據倉庫
資料庫:傳統的關係型資料庫的主要應用,主要是基本的、日常的事務處理,例如銀行交易。
數據倉庫:數據倉庫系統的主要應用主要是OLAP(On-Line Analytical Processing),支持複雜的分析操作,側重決策支持,並且提供直觀易懂的查詢結果。
數據倉庫,是在資料庫已經大量存在的情況下,為了進一步挖掘數據資源、為了決策需要而產生的,它並不是所謂的「大型資料庫」。
舉個栗子
以電商公司為例:
電商啟動初期,流量來了,客戶和訂單都多了時,普通查詢已經有壓力了,這個時候就需要升級架構變成多台伺服器和多個業務資料庫(量大+分庫表),這個階段的業務數字和指標還可以勉強從業務資料庫里查詢。
3-5年過後,隨著業務指數級的增長,數據量會陡增,公司角色也開始多了起來,開始有了 CEO、CMO、CIO等。高管們關心的問題,從最初非常粗放的「昨天的收入是多少」、「上個月的 PV、UV 是多少」,逐漸演化到非常精細化和具體的用戶的集群分析,特定用戶在某種使用場景中,例如「20~30歲女性用戶在過去五年的第一季度化妝品類商品的購買行為與公司進行的促銷活動方案之間的關係」。
想要解決這類非常具體、且能夠對公司決策起到關鍵性作用的問題,就需要建立一個數據倉庫了。
數據分析&數據挖掘
數據分析是20世紀早期就誕生的方法,而數據挖掘一直到信息革命後才逐漸發明。
數據分析的分析目標往往比較明確,分析條件也比較清楚,基本上就是採用統計方法,對數據進行多維度地描述;
數據挖掘的目標卻不是很清晰,要依靠挖掘演算法來找出隱藏在大量數據中的規律和模式,也就是從數據中提取出隱含的、未知的有價值的信息。
簡單來說,數據分析告訴你為什麼,數據挖掘告訴你怎麼做。
舉個栗子
你拿著50元去菜市場買菜,需要葷素搭配。
你詢問雞鴨魚豬肉以及各類蔬菜的價格,不斷進行統計分析,能各自買到多少肉,多少菜,大概能吃多久,心裡得出一組信息,這就是數據分析。
關係到你做出選擇的時候就需要對這些信息進行50元價值評估,根據自己的偏好,營養價值,科學的搭配,用餐時間計劃,最有性價比的組合等等,對這些信息進行價值化分析,最終確定一個購買方案,這就是數據挖掘。
什麼?
還嫌小編說的不夠?
因為小編並不是「專業」的啊!
誰專業?
當然是……
「智慧科技與雲計算應用峰會」啦
9月29日,在海南省海口
由中國開源雲聯盟和易建科技將聯合主辦
更有易建科技大數據首席專家喬梁在現場
點擊展開全文


※易建科技鍾忻:架構即未來
※選IOS還是選安卓,這是個問題啊!
TAG:易建科技 |