當前位置:
首頁 > 最新 > 深度解析——數據分析是什麼!

深度解析——數據分析是什麼!

趁著大過年的,這段時間很悠閑,咱們來思考一個深刻的問題:數據分析究竟是什麼?這是一個坑,跳進去很容易出不來,但是,自己如果不學著從這個坑裡面爬出來,以後遇上別人給你挖一個類似的坑,就很可能跳不過去。

像「數據分析究竟是什麼?」這種類似的問題有很多,比如:

1、在面試的時候被問到:談談你對數據分析的理解,你為什麼選擇這個職位,這個職位長期發展的前景如何?

2、各種數據分析群里的討論:Data Scientist是什麼?出路在哪裡?為什麼做 Analytics 的活 title 卻是 Data Scientist?

3、同事之間的交流:咱們明年的項目計劃怎麼填,下一年要做什麼?

等等諸如此類的,問法雖然不同,但討論的內容其實是類似的:數據分析(Data Analytics)究竟有什麼用?

我們先來回顧一下,在工作中做決策的幾個階段。

第一階段:沒有數據,更沒有分析

不管是產品也好,還是運營也好,總要做出各種決策,例如某個功能要不要做、要不要和某個渠道合作、怎麼合作,是換量還是買量等等,非常多的決策問題。在項目剛開始的階段,因為團隊還是很小,十幾個人左右,這時候一般憑的是從上到下的決定,靠的是經驗和感覺。

這種類型的決策,就是沒有數據,也沒有分析。因為最後效果如何,沒有一個數據上的衡量標準,或者只有簡單粗暴的幾個數據:DAU、MAU、有多少人用(購買),收入多少,成本多少,最後賺了多少等。

第二階段:有數據,看起來好像有分析

很快,團隊意識到,拍腦袋做出的決策,很容易導致拍大腿,沒有量化的指標,也不知道產品功能的上線或者運營方案的實施,是否達到了預期的效果。

於是,招了幾個大數據開發工程師,開始採集各種數據,在產品中加入各種埋點,收集各種用戶的行為數據,同時把用戶各種維度的數據,例如機型、地域、操作系統、網路類型、推廣渠道等等上報到數據倉庫裡面。

然後,大數據開發工程師根據以往的經驗,把每個功能的DAU、MAU、留存、召回、轉化等等報表做出來,還有各種特殊需求的報表,放在一個報表系統裡面,滿目琳琅,很全面。

這個階段,我們已經達到了數據分析的第一個目的,就是知道了過去,也就是明白過去發生了什麼事情,想要知道過去發生了什麼,很簡單,把報表系統做好即可。但是一碰上一些特殊的事件,例如某天某個功能的DAU下降了,咋回事呢?不知道怎麼回事了。

這時候,我們自然而然地想到,要通過數據去解決問題。慢慢地,我們進入了第三個階段。

第三階段:有數據,有分析,有原因

這個階段開始引入hypothesis的概念,我們不但要知道發生了什麼(reporting),還要知道為什麼會發生 (hypothesis driven)。知道為什麼會發生很重要,首先這個是你老闆經常要你回答的問題。其次,知道為什麼發生,可以告訴我們,以後做類似的事情,可能會發生什麼。

要回答為什麼發生,只需要一種數據分析方法即可,那就是對比分析,做起來,就有三個手段了。

第一個手段,就是多維度對比分析,前面我們收集了那麼多維度的信息(機型、品牌、地域、操作系統、版本等等),多維度對比分析,也經常被稱為用戶畫像分析,通過多種維度的對比,我們很容易就發現了某個指標的變化,是由於哪幾個維度的變化而導致的。

第二個手段,就是相關分析,相關分析通過對比多個指標之間的相關性,找出指標之間的相關關係,例如廣告費用和每日新增用戶數之間的關係一般是強正相關的,應用內廣告的頻次的數量一般和留存率是強負相關的等等,通過相關分析,可以把要分析的指標轉移到另外一個指標去,例如我們分析為什麼日活躍用戶數降低了,如果發現應用內廣告的頻次增加了,留存是降低了,那麼日活說不定就收到影響了,這時候,我們把這個影響量化,基本上就可以回答為什麼這個問題了。

第三個手段,就是A/B test了,這個比較具有難度,首先,要做A/B Test需要前端和後端的支持,而且,這個測試,是和核心功能無關的工作,因此,經常得不到各個部門的支持。但是,做A/B Test非常有必要,因為,它可以找到因果性,也就是證明了,為什麼會發生。有沒有發現,我前面說的話,都是可能、說不定的詞語,做了A/B Test,你就可以拍胸脯用「肯定」這個詞了。沒做實驗,誰都沒有發言權。

實驗這個詞,是否有點高端?這是一個經常在大學裡面聽到的詞,大學裡面誰經常干實驗這個事情?沒錯,就是科學家,因此,數據分析為什麼稱為數據科學?現在知道了吧。也就是說,你要做到使用實驗,來驗證數據分析的結論,要做到這種程度,才可以稱為數據科學。

這裡我們還需要注意一下,科學(Scientist)的定義並不是說,採用的分析方法多麼高大上(例如回歸、神經網路、聚類、有監督、無監督等等),而在於其解決問題的方式:通過對現有問題做出各種假設,然後通過實施各種A/B Test的科學實驗,驗證假設是否正確。

總結一下第三個階段的核心,第二個階段是知道過去發生了什麼事情,而第三個階段,則是知道現在發生了什麼事情,也就是可以通過數據去解釋業務中的問題。如何了解目前業務中的問題呢?一般我們會通過專題分析,不停地去對比數據之間的差異性,找出業務問題發生的原因。

第四階段:知道發生了什麼、知道為什麼發生、知道接下來應該做什麼

數據分析的終極階段,就是我們不但知道發生了什麼(reporting),知道為什麼發生 (hypothesis-driven),還知道接下來應該做什麼 (product/strategy leadership)。

這個階段有很多難點:本身搞清楚應該做什麼就很難,還需要把這些東西 sell 出去,就更是難上加難了,但是這恰恰是數據分析的作用之一。不管數據分析做出了什麼結果,如果沒有把結論應用到實際product change裡面去的話,都是紙上談兵。

對於大多數的數據分析崗位來說,階段二是基礎,階段三是應該做到的,階段四是好像能做到一些,但是還有很大提高餘地的。而數據分析的作用和影響力,就來源於階段四。這也是為什麼很多數據分析的職位看起來要求很低,但是要做得好卻很難。因為第四階段做得如何,實在是太難量化了。

數據分析第四個階段的核心,就是不僅知道了過去以及現在的業務狀況,還需要指導業務的下一個走向,也就是未來應該做什麼。通過數據分析確定下一步應該做什麼,可以讓組織達到最大化的提高。

最後,我們來總結一下,數據分析的作用。很簡單,用趙本山春晚小品的節目名字就可以總結,那就是《過去、現在和將來》。通過報表(reporting),可以知道業務過去發生了什麼,通過專題分析(hypothesis driven),可以知道目前某個業務問題為什麼產生,最後通過數據分析結論,推動產品的改進(product/strategy leadership),知道將來應該做什麼。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 數據分析實戰 的精彩文章:

TAG:數據分析實戰 |