當前位置:
首頁 > 科技 > LinkedIn周洋:數據科學家應該是做真正有影響力的問題解決者

LinkedIn周洋:數據科學家應該是做真正有影響力的問題解決者

至頂網CIO與應用頻道 06月15日 北京消息:「數據科學家(Data Scientist)」作為一個從矽谷發端的新興概念,近年來已經被世界各地的科技企業熱議。對於這樣一個神秘又重要的角色,大多數人對它的理解僅限於「數據科學家就是集技術專家與數量分析師的角色於一身,採用科學方法、運用數據挖掘工具尋找新的數據洞察的工程師」。6月15日,LinkedIn增長與國際業務數據科學負責人周洋在第九屆中國雲計算大會上與國內外互聯網一線公司相關技術高管及各大研究院的技術專家就雲計算大數據技術、產業和應用等話題進行深入交流,並分享了自己多年從事數據科學工作的經驗和心得。

數據科學團隊的發源要回溯到2008年,時任 LinkedIn數據產品團隊負責人的DJ Patil和Facebook的Jeff Hammerbacher分別建立了世界上最初兩個真正意義上的數據科學團隊。為了與傳統意義上不成建制的數據部門作區分,他們選擇「數據科學家(Data Scientist)」一詞來準確描述自身的工作性質。而後隨著全球數據化趨勢的愈演愈烈,這一職業稱謂被各大公司機構所沿用,在世界上逐漸流傳開來。正因如此,從某種意義上說,「數據科學家(Data Scientist)」的「發源地」之一,就在LinkedIn。

前LinkedIn數據產品團隊負責人DJ Patil

LinkedIn從一家以數據為驅動的矽谷新銳,到成熟的大數據公司,周洋比任何人都更清楚數據對於一家企業長遠發展的重要意義。自從2013年加入LinkedIn,周洋帶領數據科學團隊在戰略決策層面不斷為公司探索新的利益增長點,將工作發展過程中各種「不確定性」明朗化,見證了LinkedIn全球註冊用戶從2.5億到5億的「健康、平穩、持續」性增長。

數據科學團隊是公司三大支柱之一

數據科學家在公司扮演怎樣的角色?一方面,他們幫助產品經理實現增長用戶的目的,為產品團隊提供技術支持,另一方面與工程師確定最後如何實現技術落地。因此,數據科學家需要對項目業務和痛點有足夠深刻的認知,才能和產品經理共同尋找業務增長的機會;同時要與工程師及時有效地溝通,確保新產品能夠最大化地向用戶傳遞價值。在產品團隊里,數據科學家與產品經理和工程團隊一起,組成整個團隊的三根支柱。只有這三根支柱緊密協作,才能將各自的專業優勢發揮到最大,使得產品團隊能夠高效運行。

LinkedIn增長與國際業務數據科學團隊就是這樣一支精銳部隊,這個20多人的數據科學家團隊是嵌入在LinkedIn 150多人的增長產品團隊中,成員們被分散到各個項目里,與項目經理和工程師坐在一起,組成這個「新團隊」的「三大支柱」。周洋稱,「我們的數據科學家大多數都和他們支持的業務團隊在一起,比如支持病毒式增長的科學家就和這個團隊的業務負責人坐在一起,我又跟增長團隊負責人坐在一起,這種嵌入式模式非常有效。而且,數據科學家大多會跟完整個產品周期,越早的進入項目過程,越能夠更有效率的工作,而在對於新人培訓時,也會強調這一點。」

LinkedIn周洋:數據科學家應該是做真正有影響力的問題解決者

LinkedIn(領英)增長與國際業務數據科學負責人周洋

數據科學家不止步於技術

與傳統意義上的數據工程師、數據分析師不同,數據科學團隊的任務不該止步於技術開發。周洋認為,決定一個科學家優秀程度的重要因素並不是技術,因為在他看來,技術是可以培養提高的。一個通過面試的量化領域(quantitative field)如計算機、統計、運籌學、數學、電子工程等相關領域的人才,其硬技能( hard skills)如編程能力、統計等是比較容易衡量的。而真正困難的是批判性思維和溝通能力。一個數據科學家對業務問題的批判性思維、將業務問題拆分成可回答的數據問題的轉換能力、以及最終將解決方案清晰簡潔地傳達給決策者的溝通能力,才是優秀數據科學家的價值體現。

「在LinkedIn,我們從來不用工作量(如寫了多少代碼)或工作時間長短來做數據科學家的績效考核。我們衡量工作的標準是對業務產生的影響:尋找新的業務機會,改進現有業務流程,或者確定業務方向。」

LinkedIn數據科學團隊的宗旨是:To make data-driven decision at scale。這裡有幾個關鍵詞:數據驅動(data-driven),決策(decision),可擴展化(scale)。周洋介紹到,「我們鼓勵數據科學家積極主動去介入業務,比如我們在接受到業務部門的問題時,會去積極理解這個問題的上下文以及最終要解決什麼樣的業務難題。有時候問問題的人想知道的問題,並不是他問的這個問題可以解決的。我們鼓勵我們的數據科學家成為業務夥伴的思考夥伴(thought partner),一起來探索、分析業務需求,以及思考怎麼樣通過數據分析去解決。但團隊的目的不是分析,而是通過分析拿到洞察,從而提出業務建議。」

決策(decision)和創新(innovation)是數據科學家的終極任務

對於數據科學家來說,最終要解決的問題有兩點:決策和創新。通過數據去實施具體分析是很多人都能做的,但是從業務的層面發現並解決抽象問題,才是最難得的品質:從拿到這個問題,到回答這個問題,包括拿到這個問題的批判性思維,通過一個框架把問題剖析分析成很多不同的角度和任務,幫助決策者做出數據支持的決策,或者創造新的數據產品實現業務提升。

我們處在大數據時代,但是大量的原始數據就像金礦,在被充分利用之前,其價值並沒有顯示出來。數據科學家首先需要和不同團隊協作,構建完整的數據生態系統。這其中包括數據採集、ETL、存儲、計算、分析、試驗、可視化等。在這個生態系統上,數據科學家應當提供高價值的決策和創新工作。

「不確定性」的問題存在於業務中很多不同的層面,而數據科學團隊應該為各個層面的決策者提供支持。例如,微觀的層面,工程師會希望知道瀏覽量下降了5%是否應該引起重視?產品經理會想要知道,一個產品想法能否有效落地?CEO 會想要知道,公司的發展策略上,如何向移動端轉移?這都是一些不確定的問題,需要數據科學家通過數據分析為業務決策提供數據支撐。

在提供業務決策時不一定是一個很高大上的可視化圖表,而更應該是可以用一句話描述的內容,甚至可以不包括數字。比如告訴我們的CEO,應該更好的發展移動端戰略。而關於為什麼要這麼做,我們再進一步去展示數據維度的原因。將一個虛無縹緲的概念剖析開,建立框架和分析角度,將大而全的問題分解,用數據分析給出小而美的答案,進一步將其變成產品建議,進而為決策層提供決策依據。

數據科學家的價值同樣體現在業務創新上。在對業務和數據深刻理解的基礎上,數據科學家需要能夠通過分析發現業務機會,設計並創建數據產品來將業務機會轉換成業務提升。

隨著數據對於企業發展的重要性越來越被認可,數據科學團隊勢必會逐漸落地於每個公司。「我非常欣賞LinkedIn的一點是,除了它的數據驅動文化,LinkedIn鼓勵一個人不要做螺絲釘,給每個人包括數據科學家更大的發揮空間,鼓勵他們跳出自己『數據專家』的角色局限,做一個真正有影響力的問題解決者。LinkedIn也十分鼓勵每個數據科學人才找到自己的長處,實現個人價值的最大化。」

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 ZD至頂網 的精彩文章:

魚鷹軟體簽約汽車互動體驗營銷傳播NO.1極度空間
分析報告:IBM將成為唯一的磁帶廠商
微軟風投:來看看巨頭的最新13項投資
福特在企業里推數據訪問和分析功能
魚鷹軟體簽約整合營銷專家派合傳播

TAG:ZD至頂網 |

您可能感興趣

Facebook首席AI科學家Yann LeCun:距離「真正的」AI我們還缺什麼?
科學家Jeff Lieberman:我是誰?
「最美應用」 Island Delta :科學家也能當間諜!好萊塢大片里才有的劇情,要不要體驗一下?
Super Science Friends-科學家也能有超能力
Immunity:HIV為何無法治癒?科學家找到關鍵機制!
亞馬遜前首席科學家 Andreas Weigend:展望大數據與未來
科學家發現一個人體新器官 Interstitium,讓我們一起目睹
陳列平:follow my heart,我要做那前面5%的科學家!
World eBook Library:從霍金說起,科學家們在「探索宇宙」的奧秘中都做了哪些研究?
亞馬遜AWS首席科學家Animashree Anandkumar:機器學習將引領未來革命
谷歌大腦科學家Hugo LaRochelle:不要為AI劃定邊界
褶子科學家Issey Miyake 的寫意梳理
Zuckerberg 可能工作要不保了;非洲出版新期刊幫科學家提高影響力
Mol Cell:科學家們發現對細胞功能有關鍵影響的酶
Cell Metabol:科學家闡明控制機體衰老及年齡相關疾病的謎題
數據科學家效率提升必備技巧之Jupyter Notebook篇
利用Python做絕地科學家
Plos Pathogen:科學家們揭示蚊子中細菌阻斷病毒傳播的內在機制
我國科學家在Nature Review Chemistry上發表單原子催化述評
Acta Neuropathol Commun:科學家們開發出診斷神經退行性疾病的新方法