當前位置:
首頁 > 科技 > 程序員,你真的懂數據可視化嗎?

程序員,你真的懂數據可視化嗎?

作者 |張小墨

責編 | 郭 芮

隨著「中台」的火熱,數據中台逐漸為人所知,讓很多原本隱於水下的崗位浮出了水面,比如數據產品經理、數據分析師等。「數據可視化」就是上述崗位的看家本領之一。所謂顏值即正義,數據可視化水平很大程度影響了工作輸出質量。

那到底什麼是數據可視化,如何實現數據可視化,作為產品經理,又該如何設計一個自研的可視化系統/工具呢?

什麼是數據可視化?

俗語有曰:字不如表,表不如圖。

數據可視化就是通過易讀、易懂、易操作的圖表,給用戶帶來良好的視覺效果,降低用戶的理解難度,從而實現用數字給用戶講個故事的工作目的。

簡單理解,數據可視化=數據 可視化,數據內容是基礎,可視化是用圖形化的方式呈現,並藉此傳達信息的方式。

所以數據內容是可視化的內核,單純追求可視化炫酷的意義並不大,擁有了優質的數據內容,可視化的意義方得以凸顯。

如何實現數據可視化?

實現數據可視化,步驟並不複雜,就像把大象放冰箱里,同樣分成三步:數據準備、可視化設計與內容分發。

1、數據準備

數據分析的目的是為了解決問題,從而給公司與部門提供存在參考價值的分析內容,完成上述內容的基礎就是數據,各種數據。

數據準備就是為了明確數據範圍,減少數據量,通過採集、統計、分析與歸納,梳理出我們需要的數據結果表。

梳理出的數據內容,存儲方式就是簡單的使用Excel,也可以使用MySQL或者Hive等等,這需要根據數據量和查詢性能的要求來選擇。

數據分析人員使用數據表時,通過單表查詢或者多表關聯的方式,完成其數據分析工作,就可以進入可視化設計環節了。

2、可視化設計

工欲善其事,必先利其器。

使用最頻繁的可視化工具可能還是Excel,除此之外,還可以通過R語言、Python結合JS,通過代碼的方式來實現,但是這些實現方式,學習與操作成本略高。

如今市面上可選的可視化工具有很多:Tableau、海致BDP、帆軟FineBI、PowerBI、網易有數等等,通過基礎的SQL能力結合滑鼠的拖拽操作,就可以完成可視化設計。

(海致BDP操作頁)

用滑鼠對數據表欄位進行拖拽,就可以實現維度與指標的設置,還可以添加篩選條件,再結合SQL查詢,便完成了可視化報表的製作。

而在工具越來越實用的前提下,考驗我們的還有設計與審美能力,我們需要注意的有:

A、減少數字噪音,選擇合適的圖表

圖表有很多選擇,並不是複雜的圖表才算上檔次,大道至簡,越是簡單的圖表,越是能讓用戶理解我們所要表達的內容。

簡單總結一下:

基本圖表:折線圖、散點圖、條形圖、柱狀圖、氣泡圖、組合圖、面積圖、餅圖等;

複雜圖表:儀錶盤、地圖、流向地圖、熱力地圖、樹形圖、框架圖、漏斗圖、甘特圖、詞雲圖、雷達圖等。

選擇圖表時,需要了解不同圖表的優劣以及它們適合的應用場景,盡量較少數據噪音,不要同時給予用戶太多的內容。

但也不是不可以使用複雜圖表,某些場景下複雜圖表可能更能清晰的表達數據背後的含義,那用一下也未嘗不可。

B、顏色搭配合理,多維度交互搭配

關於配色,仁者見仁,智者見智,有各種流派。

就筆者而言,更傾向於盡量少使用艷色調,多使用漸變色,確保辨識度,而需要對比的數據可以選擇對比色或者互補色。

建議大家多去一些配色網站看看,如:Material Palette、Material UI Colors等等,也可以多去Dribbble、堆糖、花瓣或者千圖這些網站溜達一下。

(From:Material UI Colors)

看的越多,就會越有感覺,獲得一種積累而產生的靈感。

至於說到多維度的交互,常見的有以下幾種:

篩選:通過設置過濾條件,實現不同維度數據的組合展現;

鑽取:實現不同層次的數據的分層展示,如上下級部門等;

聯動:通過一個圖形的變化,聯動其他圖形的變化,如選擇餅圖中的某一個色塊,則底部趨勢表顯示對應內容的趨勢變化等。

當然還有很多的其他交互,只要可以為用戶展示有效的數據內容,滿足用戶的業務需要,那就是好交互。

好看又好用,便是數據可視化的意義。

3、內容分發

數據可視化最終的產物是一張圖數並茂的報表,我們可以通過很多方式傳達給用戶,最簡單莫過於直接提供源文件或者截圖,但這樣過於笨重與低效。

數據平台類產品就承擔了高效分發報表的責任,如BI平台、移動BI平台等,即實現了對報表查看許可權的控制,又實現了對報表數據許可權的控制。

我們也可以直接使用第三方工具直接完成內容分發,諸如Tableau之類的工具,都可以在本地化部署的基礎上實現內容分發,不過出於功能擴展性與數據安全性等多方面考慮,不少公司依舊選擇用自研的方式來打造自己的數據可視化系統。

下面,就讓我們簡單了解一下,我們該如何打造一款數據可視化系統/工具。

可視化系統/工具的設計思路

該部分內容旨在簡單介紹企業BI系統或大數據分析平台等數據可視化產品的設計思路,為產品設計人員提供參考的同時,也為感興趣的讀者剖析解密一下此類數據產品。

1、數據源管理

此類產品目前支持的數據源越來越多了,畢竟數據是進行數據分析與可視化的基礎,無法連接數據源,下面一切的工作都將無法開展。

(海致BDP數據源管理頁)

在進行此類產品設計時,優先需要完成公司現有數據源的調研,然後再根據實際場景,選定項目所要支持的數據源。

因為不同的資料庫存在不同的優劣勢,可視化報表除了數據準確與樣式交互合理,對於數據查詢速度同樣存在要求,我們不可能讓用戶進行一次點選操作後,等待數分鐘。

比如,當數據量達到億這個量級,MySQL就不太適合了,這個時候更適合選擇一些分散式資料庫,如HBase等。

根據平台數據量與公司現有能力,選定需要支持的數據源,這是此類產品設計的第一步。

2、圖表庫管理

圖表庫,就像「彈藥庫」,但是圖表組件的封裝是個持久戰,耗時耗力,需要耗費大量的前端開發資源,不過我們可以使用ECharts這類開源圖表庫:

(From:ECharts)

根據可視化需要,不斷完善自研系統的圖表庫,可以讓數據分析師使用可視化工具時,做到「信手拈來」,那就算是有所小成了。

3、報表開發與分發

報表開發與分發是數據可視化系統的核心功能,該部分在實現報表開發的同時,還需要完成許可權(查看許可權與數據許可權)的配置。

實現該部分功能設計,有一個「捷徑」,去學習市面上主流可視化工具的實現方式,他們詳實的產品幫助文檔都是自研產品設計的「靈感源泉」。

(帆軟FineBI首頁)

至於許可權的控制,也有很多方式,比如做單點讀取用戶許可權表等,對數據許可權的控制,是數據安全的必備項。

通過以上步驟,我們就完成了自研可視化工具的產品設計,但該部分涉及內容較多,作為簡單介紹,本文不再過多展開。

結語

數據可視化,需要以用戶為中心,以用戶體驗為基礎,輸出可視化報表,為業務賦能。

在公司不具備或者沒有必要進行可視化工具自研的情況下,大量的可視化工具可供諸君選用,正所謂:君子生非異也,善假於物也。

聲明:本文為作者投稿,版權歸其所有。

【END】

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 CSDN 的精彩文章:

推薦系統與新技術結合將碰撞出怎樣的火花?
從「技術理性」到「實踐智慧」華為雲這波大招夠強

TAG:CSDN |