資深數據科學家面試經驗:千萬別踩這4個坑!
策劃編輯 | Vincent
作者 | Ganes Kesari B
譯者 | 無明
編輯 | Vincent,Natalie
AI 前線導讀:「數據科學家」被認為是本世紀最性感的工作,但要招聘一個數據科學家可能就不那麼「性感」了。事實上,對於很多公司來說,招聘工作可能會讓人感到痛苦不堪。而對有志於成為數據科學家的人來說,要想在數據科學領域找到一份完美的工作,也往往不像表面上那麼光彩奪目。本文作者在數據分析從業多年,同時也是印度一家數據公司的聯合創始人,他基於多年的數據科學家招聘工作,總結了可能導致應聘者面試失敗的四個陷阱。AI 前線對文章進行了翻譯並分享給大家,希望你們看完之後不會再掉進類似的坑裡!
更多乾貨內容請關注微信公眾號「AI 前線」,(ID:ai-front)
機器學習很難,而培養能夠進行機器學習開發的人更難。要想成為一名富有成效的數據科學家,需要經過不同階段的專業知識訓練。
對於想找到這樣的數據科學家的公司來說,就像大海撈針。在 Gramener 從事了多年的數據科學家招聘工作之後,我總結了人才市場上存在的一些應聘者的技能模式。雖然面試失敗的方式有數百種,但它們大致可以被分為四大類型。
有可能被拒之門外的 4 種應聘方式
成千上萬的申請人中只有少數能夠擠過機器學習的獨木橋,因此了解大多數人的失敗情況是很有幫助的。對於有抱負的數據科學家或希望提高工作水平的人來說,這些都是需要避免的陷阱。
意識到自己的弱點是解決問題的第一步。
想要成為一名真正成功的數據科學,應聘者需要掌握專業的技能。為了用輕鬆的方式來說明這些問題,我們將用訓練狙擊手的例子作為類比。
那麼,可能導致應聘數據科學家職位失敗的 4 種方式是什麼?
1. 用機器學習流行語裝飾簡歷
與其他任何工作一樣,用行業術語來裝飾個人簡歷也許是很誘人的,而數據科學恰恰不缺乏流行語。雖然這種行為的確提高了簡歷獲得關注的機會,但很快會帶來反作用。
簡歷上聲稱的高級分析技能實際上只是熟悉基本的 Excel 數據透視表、SQL 查詢或 Google Analytics,這樣的情況並不罕見。這種行為不僅浪費時間,也無法讓候選人通過面試,甚至會讓他們感到挫敗。
對於有抱負的狙擊手來說,這就好比只要穿上士兵的外衣、扛起士兵的槍,不需要任何時間訓練就能成為一名士兵一樣。這聽起來似乎很荒謬,一隻披著狼皮的羊四處尋找獵物,這可不是一件開玩笑的事。
2. 不建模,直接調用第三方庫
許多聲稱了解建模的候選人都極力解釋模型函數調用和參數。確實,通過一行代碼就可以讓模型運行起來,但機器學習遠不止這麼簡單。數據科學家需要了解更多,比如為什麼邏輯回歸比 SVM 更適合用在某些場景里,或者什麼時候簡單的外推法比 ARIMA 或 Holt-Winters 等預測技術更好用。
一個好的狙擊手需要做的不僅僅是瞄準和射擊。實際上,射擊訓練只佔狙擊學校課程的 20%。狙擊手需要掌握更多的技能,比如耐心、遵守紀律和從遠處估計目標距離的觀察能力。
3. 數據分析基礎不牢固
機器學習技術方面的動手能力可以成為候選人的加分項,但他們往往會在這方面做得不足。他們需要投入精力進行訓練,以掌握更多基礎技能,比如容易被忽略的統計和探索性數據分析。
建模僅占數據分析生命周期的一小部分。在任何成功的機器學習項目中,超過 50%的時間都是在數據準備、數據清理,而之後的 25%時間用於模型的解釋和推薦。
即使候選人聲稱他們的項目達到了 90%的準確率,但他們卻很難解釋 p 值是什麼。聽著他們解釋為什麼我們需要模型的置信區間時,簡直就是一場悲劇。
牢牢掌握基礎知識對所有學科都是至關重要的。一名狙擊手首先需要成為一名偉大的步兵。如果狙擊手在戰鬥中無法修好出問題的槍或者是失火的話,那麼再好的槍法又有什麼用?
4. 無法應用分析技術來解決業務問題
要掌握我們討論過的所有技術顯然是一項艱巨的任務。不過我們還是錯過了整個鏈條的關鍵環節,而這正是大多數面試出現問題的地方。
數據科學家的最終使命是解決業務問題,而不僅僅是分析數據或建立一個偉大的模型。他們在使用工具載入數據之前,需要先知道要解決什麼業務問題,並制定解決問題的步驟。
當被問及企業如何解決客戶流失問題時,如果候選人開始大侃數據分析技術,或者更糟糕的是,圍繞模型名稱說個沒完,那麼面試極有可能失敗。他們應該要想想為什麼用戶會註冊、用戶的期望是什麼以及什麼東西會影響到業務。
試想,如果一個專家狙擊手無法偽裝好自己或無法找到正確的射擊目標,那麼這樣的狙擊手其實是一個危險的人,他的風險比外部的敵人來得更大。
總結:走向數據科學
總之,在走向數據科學的路上,我們需要遵守一些原則:
找出業務問題,並通過一系列步驟來解決問題。
在統計學和探索性數據分析中應用基礎知識,以獲得對數據的直觀感受,並不斷改進分析方法。
選擇恰當的數據分析技術或機器學習模型,然後把結果呈現給用戶。
正確定位自己的專業知識技能,做適合這個角色做的事情。
One More Thing
噢,對了,在你真的想好要進入數據分析領域之前,建議你先看看數據科學家們發自內心深處的吐槽《年薪超 70 萬,為什麼數據科學家們還都忙著找新工作?》,如果看完之後你依然滿腔熱情,AI 前線祝你能夠在數據分析市場中找到自己的一席之地!
https://towardsdatascience.com/4-ways-to-fail-a-data-scientist-job-interview-d9c4c85c683
今日薦文


※如何學習一門新的編程語言?
※Airbnb數據工程師的進階指南:技術基礎
TAG:AI前線 |