想成為數據科學家?試試費曼技巧!
作者:Venkat Raman
編譯:weakish
編者按:True Influence數據科學家Venkat Raman介紹了自己進入數據科學領域、成為數據科學家的秘訣——費曼技巧。
來源:Pixabay
許多博客和文章在談論如何成為數據科學家這一話題。通常會給出這樣一個列表:
學習描述性統計、假設檢驗、概率
了解機器學習演算法的類型——監督學習、無監督學習
學習Python、R、SAS、SQL
基於Python、R、SAS應用機器學習技術
學習數據可視化
雖然上述途徑沒什麼問題,但僅僅如此不足成為一個高效的數據科學家。現在你可能會問為什麼?在回答這一問題之前,我想先談談「費曼技巧」。
為什麼叫「費曼技巧」?
這一技巧的命名來源於偉大的理論物理學家理查德·費曼(Richard Feynman)。他能以非凡的技巧使用樸素的外行用語解釋最複雜的科學話題,因此他有一個綽號「大解釋者」(The Great Explainer)。
費曼技巧
第一步:收縮你覺得難以把握的主題。了解這一主題。
第二步:假裝你正教某人這一主題,並且使用非常簡單的術語。通過這樣的方式向自己解釋這一主題。
如果你不能以簡單的方式解釋它,說明你對它的理解還不深。來源:Geminthinking
第三步:嘗試一個例子,或者演示它是如何工作的。
第四步:評估你對這一主題的知識,如果仍有一些概念不清楚,學習更多關於這些概念的內容,並重複第2至4步。
完成這一過程之後,你會發展出對該主題比剛開始時更深的理解。這就是「費曼技巧」的魔法。
要成為數據科學大家,先成為「大解釋者」
數據科學領域需要持續的學習。其中一些概念也許極難理解。費曼技巧幫助某人理解原本認為非常難的主題。
向老闆、客戶、投資人解釋的需要
只有當關鍵決策者認識到其中的價值,數據分析產業才能生存。決策者是
你的老闆如果你從事的是面向企業內部的分析工作。
客戶如果你從事分析諮詢/服務業。
VC(投資人)如果你正為你的「AI初創企業」尋求投資(募集資金的第一步是用AI稱呼它 )
大多數情況下,你的老闆/客戶/投資人可能並不具備數據分析的背景,或者對最新數據分析主題的深刻理解。使用儘可能簡單的語言向他們解釋數據分析概念,使他們看到你的提議的價值,這是你的責任。
所以,底線是練習費曼技巧,免得自己像呆伯特一樣,天天面對老闆的折磨
來源:Dilbert Comic
譯文:
老闆:我們有一個巨大的資料庫,裡面裝滿了客戶行為信息。(圖一)
呆伯特:棒極了。我們可以使用非線性數學和數據挖掘技術優化我們的零售渠道。(圖二)
老闆:如果你說的是垃圾推廣,那這個會議很成功。
來源:Dilbert Comic
譯文:
老闆:我們的雲中的大數據,是否為我們提供了可執行的分析(actionable analytics)?(圖一)
呆伯特:是的,數據顯示一旦你學了新術語,我的生產力就下跌了。(圖二)
老闆:也許內存內計算(in-memory computing)能加速你的應用。(圖三)
呆伯特:下跌,下跌,下跌。(圖三)
我是如何成為數據科學家的
在我的MBA課程中,我是唯一具備統計背景的人,我總覺得,當我向朋友們解釋統計概念時,我對統計概念的理解加深了。他們的讚許(很容易地學到了這個概念),鼓勵了我,也讓我感到自己有責任徹底地學習這些概念,以免教給他們錯誤的知識。
徹底學習的自信使我得以進入數據科學領域。即使現在我仍然使用費曼技巧來更好地把握那些初看起來很費解的主題。
實踐費曼技巧——撰寫文章
好吧,我必須承認,我之所以寫本博客的第一篇文章Recommender Engine(推薦引擎)是為了更好地理解推薦系統如何工作。儘管我不能說自己是推薦系統的專家,我確信我以直觀的方式學到了某些東西。
類似的,我最近的文章How to Dockerize an R shiny app- Part 1(如何將R應用納入docker容器)嘗試通過樂高積木解釋docker。
費曼技巧——冒名頂替症候群的解藥
費曼:首要原則是,你千萬不能愚弄自己,最容易被愚弄的人是你自己。來源:Pinterest
由於數據科學領域有利可圖,許多人希望進入這一領域。那些不具備統計/數學背景而成功進入這一領域的人,有時會受冒名頂替症候群的困擾。正如上圖刻畫的那樣,「最容易被愚弄的人是你自己」。克服冒名頂替症候群的唯一方法是真正深刻地理解數據科學的眾多概念。
如果你喜歡我的文章,歡迎點贊。也歡迎留言你對文章的意見。


TAG:論智 |