當前位置:
首頁 > 最新 > Tableau冠軍遇上同濟大學,如何將可視化進行到底?

Tableau冠軍遇上同濟大學,如何將可視化進行到底?

當Tableau冠軍碰上全球領先的創意設計學院——同濟大學創意設計學院,會有怎樣的思維碰撞?本次數據俠走進校園活動,DT君邀請到的數據俠是來自Merkle的數據分析師林雨暘,作為2017年上海Tableau大賽的冠軍,他在同濟大學創意設計學院帶來一場關於「數據可視化應用」的精彩演講。

數據俠首次走進校園

3月23日,數據俠組織了第一期走進校園活動。DT君與數據俠、2017年上海Tableau大賽冠軍林雨暘一起,走進亞洲頂尖的創意設計學院,為青春洋溢的同濟創意設計學院的學子們獻上一場數據可視化乾貨的分享。

數據俠走進校園之同濟大學活動分為兩場,後續還將開展關於Python爬蟲教學、數據俠線下實驗室及為同濟創意設計學院優秀學生作品提供內容發布平台的活動。

本周DT君特邀的嘉賓是在數據俠社群中極具人氣的林雨暘,他為大家傳授Tableau可視化「秘籍」。根據當天活動中林雨暘的分享內容,DT君為大家整理出了乾貨,供大家參考學習。

可視化存在的意義

谷歌CEO Eric Schmidt在八年前說過,「每兩天,我們創造的信息就像我們從文明曙光到2003年一樣多。」

每一天中的每一分鐘產生了多少數據單,還是每天都能夠接觸到的朋友圈、微博中的信息,都能夠看出如今的我們身處在一個資訊爆炸的時代。

但從上圖中可以看到,從2002年到2015年,人類的集中力已經從12秒掉到了8秒也就是說我們對一件事情的專註力程度甚至比金魚9秒的注意力還要低,其中最大的一個原因是手機使我們無法集中自己的注意力。那麼該如何解決大家集中力越來越短的問題?

就像林登博士說的,大約50%的大腦參與視覺處理,70%的所有感受受體都在眼睛裡,視覺效果被消化的速度比文本快6萬倍。從這個結果來看,我們所有人都是視覺動物,我們很容易被視覺產生影響。因此,我們消化圖表的能力比消化文本的能力強很多。

以上圖為例,左右兩邊所表達的東西是相同的,但右邊的內容需要你了解英文、讀懂單詞、讀懂文法等。而相比之下左邊僅僅是一個視覺上的表達,能讓人更直觀地了解其警示信息。

數據可視化工具:Tableau知多少

典型的數據分析的流程就如同一個閉環,從對商業了解出發,尋找你需要的數據並對數據進行清洗,隨後做出建模評估,最後再得以實施,其中數據整理是整個流程花費時間最長的一步。

我們可以把數據進行高維度地分類:

第一類是分類變數或是名義變數(Think Named…),這類變數像是地區性、姓名等訊息,它們本身不會有先後次序,也不會呈現這背後具體代表了多少的數字。

第二類是順序變數(Think Ordered…),這類變數的呈現方式是有先後次序的,可能是從1排到100、或是從時間近的排到時間遠的。

第三類是區間變數(Think How much/many?),例如重量、成本、折扣,都算是區間變數。

Tableau是紐交所掛牌上市的數據可視化工具,它並不完全是一家軟體公司,它最大的競爭者是微軟,不同於微軟的是它只做數據可視化的軟體。因此他必須將功能做得非常好,才能夠支撐它用於產品。

Tableau可以說是PowerPoint和Excel的結合體,一方面可以做數據報表,另一方面可以做呈現互動。

Tableau有三個大的產品線,分別是Desktop、Server (包含Server與Online)和Tableau Public。我自認為Tableau在未來的某一天會成為另一個PowerPoint,因為當我們越來越需要處理巨量數據,並與數據有一定的互動性時,傳統的數據分析和可視化工具可能就會有功能上的局限性。

(圖片說明:上圖為2017年數據可視化工具排行榜)

下圖是Tableau的靜態頁面,它可以支持截圖,能夠滿足商業報告中相關聯的圖標放在同一個視角下的呈現。另外它很強的一個賣點是它的地圖功能,同時Tableau也能夠做出一些帶有分析性的圖,它不僅僅是可以讓你拖拉拽,也可以讓你寫一些函數,做一些更為高級的可視化呈現。

例如上面展示的四幅圖:漏斗圖、南丁格爾玫瑰圖、路徑走向圖、甜甜圈圖,靈活應用這些圖表能夠讓整體的數據可視化報告增添讓人意想不到的驚喜。

除了上面提到的幾種圖表以外,這裡再詳細介紹兩個我在報告當中非常喜歡用到的圖表。

一是Bump Charts(凹凸圖):

凹凸圖最主要能夠呈現出次序的時間類比、次序的數據類型。並且加上時間維度之後,就可以很清楚地看到無論是公司的產品、銷售來源或是任何可以排名的東西,在經過時間軸的眼鏡之下,可以怎樣去做趨勢的分布。

二是Sankey(桑基圖):

桑基圖可以在不同時間節點上看到數據到底是怎麼流通的。

比如說客戶群體從A到B到底是怎樣去變化,可能在節點A時,客戶群體有十個人,到節點B時,客戶群體變為20個人,那通過桑基圖,我們就可以更直觀地觀察這些人群的分布動態到底是怎樣的。

如何可視化?

如何才能讓受眾在視覺效果上更舒服,且能夠更容易地記住你的內容?

簡單地將數據可視化的語法分為三種,分別是心理學、實測、通用法則。

首先是完形心理學又稱格式塔理論,其內容是人們總是會先看到整體,再去關注局部,人們對事物的整體感受不等於局部感受的加法,視覺系統總是在不斷地試圖在感官上將圖形閉合。通過位置、顏色的變化,將個人視覺元素加以組織,以了解整個視覺內容。因此在做一個表達時,要注意位置、顏色這樣細節的變化。

其次是實測——人眼追蹤技術,這種技術在學界和商界被廣泛應用,它能夠感知出你的眼球首先落在一張畫面哪一個區塊,在哪一個區塊留得時間比較久哪一個區塊留的時間比較短。

通過追蹤眼球落點的先後順序,或者通過熱力圖的方式,知道人的眼睛到底停留在畫面的哪個部分是較久的,進而去推出一些通用原則用於設計可視化的報表。

一是F式布局原則,從上圖中可以發現熱力圖的分布布局都像一個「F」,即人的眼球會先從左上角掃描到左下角,接著再從左到右。因此,在做一個設計方案時,需要把重要的東西放在左上角,以防止在一掃而過時,也能留下比較深的印象。

二是方向提示原則,當圖上有人像時,我們的視覺會集中在人像臉上。當人像左右轉動時,我們的眼睛也會隨著他的視線移動,被他的視線所引導。

如上圖所示,當左右兩站圖在內容上只有小baby的視線有所不同,其他均沒有變化的情況下,我們的視覺會隨之變化。

最後是在商用條件下的通用規則,上圖是由一位美國博士提出來的簡單工具,它能夠在你看到數據維度時,從原則性的角度出發告訴你在碰到不同情境之下應該用什麼樣的圖表來做呈現。它可以告訴你,如何去判斷數據,如何呈現出數據之間的關係。

另一個通用原則是關於儀錶板的三種經典類型,分別是戰略型、運營型以及分析型。

但當有不同的分類出現時,就需要不同的呈現方式。如上圖所示,左邊的圖就會更容易讓讀者造成混淆。比如當你的分類超過三種以上時,就不建議再使用餅狀圖,因為份額非常小的時候,不容易一眼就看出份額大小及它究竟代表了什麼。但柱狀圖就永遠都能讓你一眼看出份額最小的到底是什麼是多少,因此柱狀圖在視覺傳達上比餅狀圖效率高很多。

註:以上內容根據林雨暘在數據俠走進校園活動的演講實錄整理。圖片來自其現場PPT,已經本人審閱。本文僅為作者觀點,不代表DT財經立場。

DT君送福利:

者 |林雨暘

題圖 | 站酷海洛

數據俠門派

本文數據俠林雨暘,現任上海電通Merkle數據分析師,協助娛樂、高科技等客戶透過數據挖掘的方式發現並創造價值。熱愛數據和統計、營銷、科技,曾自主創業,擔任過跨國銷售、上市專案經理等職位。旅居歐洲、美國等地,喜歡旅行、閱讀、運動、音樂、Podcast。現與朋友經營RS實驗室訂閱號,希望利用數據分析的方式發現生活中有趣的事物。

加入數據俠

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 DT財經 的精彩文章:

看菜鳥物流專家解密,物流是如何成為區塊鏈新主場
當機器都會「學習」了,你還想不學習么?——數據科學50人·謝梁

TAG:DT財經 |