用Power BI 做相關分析
大道至簡,學以致用,普惠眾人
今日話題
相關分析(correlation analysis),相關分析是研究現象之間是否存在某種依存關係,並對具體有依存關係的現象探討其相關方向以及相關程度,是研究隨機變數之間的相關關係的一種統計方法。以上是相關分析的定義,而反應相關關係在統計學上用的是相關係數,今天我們要介紹的是,如何用Power BI Desktop 計算相關係數的方法。
計算相關係數
1、數據準備
有如下一組銷售數據,裡邊有分類以及反應銷售的驗證金額和毛利額,如下圖所示:
2、創建散點圖
根據上述的數據,我們現在報表上面創建一個散點圖,先看看兩組數據的大概分布趨勢情況,其中X軸放的是驗證金額,Y軸顯示的是毛利額,散點為每個省區在這個二維表中的分布,效果如下圖所示:
從上圖我們可以看到散點圖的趨勢比較分散,說明驗證額(收入)和毛利的相關性不顯著。
3、創建快速度量
做好這個散點圖後,為了驗證相關性,我們需要計算這兩組指標的相關係數,操作方法如下:
在【欄位】上單擊滑鼠右鍵,在彈出的右鍵快捷菜單中選擇【新建快速度量值】,如下圖所示:
彈出【快速度量】對話框,在【計算】下拉菜單中找到並選擇【相關係數】,如下圖所示:
將右側欄位分別拖拽到制定的欄位中,如將驗證額拖拽到度量值X中,操作如下圖所示:
創建完畢後,在【欄位】中我們就可以看到新創建了一個新的度量值,並且在編輯欄中可以看到欄位新的度量值的計算代碼,如下圖所示:
設置完畢後,我們可以用卡片來顯示這個相關係數,如下圖所示:
相關係數為0.62,在統計學上,這個值表示為不相關關係不顯著,驗證了我們通過散點圖看到的效果。
美化後如下圖所示:
4、調出快速度量的方法
默認的快速度量的功能是沒有的,如果之前沒有做過設置,可以通過如下的操作獲得快速度量。
在左上角的【文件】選項卡中依次單擊【選項和設置】【選項】,如下圖所示:
在彈出的【選項】對話中,單擊左側的【預覽功能】,並在右側勾選【快速度量】複選框,如下圖所示:
通過以上操作,我們就可以在【欄位】中看到【新建快速度量值】這個選項了。
相關性是統計方法、大數據分析、運營分析中的一種很重要的分析方法,而相關係數是反應相關性的重要數據指標,現在我們就可以在Power BI Desktop 中快速計算這個數據,為我們的分析增添一種方法。


TAG:觀正堂 |