當前位置:
首頁 > 最新 > 你確認自己做的是「數據驅動」嗎?

你確認自己做的是「數據驅動」嗎?

本文由泡麵辦公室原創首發

前言

移動互聯網技術的快速發展,移動終端的廣泛普及,催生了大數據技術。今天,無論是個人的日常生活,還是企業的業務發展,都和數據密切相關,大數據技術正成為新發明、新產品和新服務的創新源泉。

近幾年,各種驅動在天上飄,有產品驅動、技術驅動、政策驅動還有老闆驅動,大數據也不甘寂寞,於是乎「數據驅動」一詞漸漸熱了起來。很多企業都說自己在搞數據驅動,也有不少從事數據技術的公司在對外提供數據驅動的技術諮詢和實施服務。各個行業都在激動地討論著「數據驅動」,有些公司甚至宣稱已經實現了「數據驅動」。

像大數據和區塊鏈一樣,很多人似是而非地討論著數據驅動,而且數據驅動逐漸也有很大希望繼在大數據、區塊鏈之後成為另外一個忽悠人民恐嚇百姓的民俗化名詞。那麼到底什麼是數據驅動呢?你真的在做數據驅動嗎?

何為「數據驅動」

在討論數據驅動前,首先讓我們看一個例子,打開手機移動應用Uber,APP頁面會有優惠碼提示:轉發優惠碼,如有下線使用該優惠碼,你將獲得優惠;在用車時,APP會根據坐車時間段和車輛緊張程度,提醒溢價的倍數,你如果不接受,則訂單取消;打車結束後,APP自動選擇優惠券進行結算,無需手動選擇;最後你的郵箱將收到此次打車的中英文版本的郵件。整個過程全部由系統自動完成,無需人工決策。包括轉發優惠碼的部分,也是由系統自動提醒,刺激用戶點擊完成的。

由此可見,數據驅動是通過移動互聯網或者其他的相關軟體為手段採集海量的數據,將數據進行組織形成信息,之後對相關的信息進行整合和提煉,在數據的基礎上經過訓練和擬合形成自動化的決策模型。當新的情況發生,新數據輸入的時候,系統可以用前面建立的模型以人工智慧的方式直接進行決策。如下圖所示,信號、數據、信息、情報、知識、智慧,一環扣一環,不斷地上升迭代,完成一個又一個決策。

信號是機器可讀的模擬或者數字脈衝,數據是人類可讀的信號,信息是經過索引後可以查詢的組織化的數據,而情報是對特定人在特定場景下有針對性的信息,知識是大量情報積累後可以改變人的知識結構的部分,智慧是基於知識和經驗可用於決策的部分。這個決策在人工智慧時代就是基於數據和演算法,特別是機器學習建立模型和使用模型的決策。因為在移動互聯網時代,業務需要海量毫秒級的瞬間決策,這是人類決策無法完成的。另外,人是感情動物,所有的決策會夾雜著情緒、親情、關係等社會關係,所做的決策未必是完全客觀的,很有可能添加了主觀因素。基於數據和模型的數據驅動決策是更加靠譜的方式。

但是這個過程需要數據的不斷輸入,需要模型根據比對決策結果和現實數據把偏差信息反饋給機器學習,在其後不斷的機器學習迭代過程中自我完善。從這個過程的描述中我們可以看到,數據驅動對企業的要求非常高,要有流式的數據不斷地注入,要有以機器學習為基礎的決策模型,要有能依賴模型輸出結果可以推動的業務系統,要有可以反饋預測偏差的反饋機制。

現在大家常聽到「數據驅動」,也有很多公司對外宣稱其實現了「數據驅動」,諸如「這是一家數據驅動公司」等話語比比皆是。但它果真是一家「數據驅動」公司么?

「數據驅動」的特徵

在一個真正的數據驅動的企業,數據是提供報告、深度模擬預測的來源,企業決策者應該將數據分析納入公司決策流程,並對公司的決策提供價值和影響。數據驅動企業最大的特點是擁有一套完整的數據價值體系。數據價值體系指的是一套完整的從數據收集、整理、報告到轉化成行業洞見和決策建議的流程。而落實到操作層面則是通過對數據的收集、整理、提煉,總結出規律形成一套智能模型,之後通過人工智慧的方式作出最終的決策。因此,真正的數據驅動公司應該具備以下特徵:

1、海量的數據;

2、自動化的業務;

3、強大的模型支持自動化決策。

這三個條件缺一不可,並形成一個循環,不斷地進行數據收集,完成建模,自動決策。

何為「以數據為中心」

到目前為止,好多宣稱自己是「數據驅動」業務的公司,其實並沒有真正的做到「數據驅動」,也許他只是一個「以數據為中心」進行決策的公司,只是在利用數據,並沒有真正實現數據的價值。

「以數據為中心進行決策」的方式與「數據驅動」相比,他沒有「數據驅動」那樣的智能,也沒有「數據驅動」那樣的高效。「以數據為中心進行決策」顧名思義就是用數據來支持決策,這些數據包括歷史記錄中的和現在產生的。通過對數據的整理、抽取,將數據轉化為可讀的知識,形成分析結果,決策者根據分析報告的結果考慮並決定決策結果,最終決策由人為參與。

舉一個簡單的例子,假設有A 和 B兩家訂票網站,A 公司將從網站收集到的數據進行分析,通過數據分析結果認為五一是出行高峰,於是決定抬高價格,並手動從後台調整了五一前後的機票價格和酒店價格。

B 公司則通過自動化手段實時收集、分析相關信息,總結規律,形成智能模型,當用戶進行搜索時,後台自動根據模型規則,對價格進行調整。

這2個公司,哪家是數據驅動型的公司呢?

顯而易見,公司 B 是數據驅動型的公司,而公司 A 則是一家「以數據為中心進行決策」的公司。

「以數據為中心進行決策」的公司,表面上公司所有人員,如產品、運營、技術、銷售都可以貢獻數據,也可以從數據里得出東西,但中間做決策的是人。如 A 公司,最終由人來決定機票是否提價。

數據即未來

那麼該如何真正的打造一個「數據驅動」的項目或公司呢?現在市面上關於大數據的書籍汗牛充棟,扔出去一塊磚也可以砸到N個大數據專家。但是數據科學作為一門嚴肅的新學科方興未艾,真正關於利用數據科學的方法論解決實際工作中的數據科學問題的實踐書籍少之又少。Brian Godsy(布瑞恩·戈德西)在他的《數據即未來》一書詳細介紹了數據科學項目的三個階段:

1、準備階段進行信息收集;

2、構建階段將計劃付諸行動,利用準備階段獲得的信息以及相關統計和軟體提供的可用工具來構建產品;

3、交付階段進行產品的交付、反饋及修改等。

書中還會教你如何預見問題以及如何處理不確定性,一步步引導你完成軟體和科學思維的最佳實踐,堪稱「數據驅動」方面的扛鼎之作。現在他的中文譯版《數據即未來》即將在京東發售。

中文版譯者陳斌,先後譯有《架構即未來》、《架構真經》等書,其中《架構即未來》還得到了CCTV2《第一時間》欄目的大力推薦。希望這本《數據即未來》能為更多想要在數據領域有所研究的人提供幫助。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 華章計算機 的精彩文章:

TAG:華章計算機 |