數據科學十大技能
數據科學的實踐需要三個一般領域的技能:商業洞察、計算機技術/編程和統計學/數學。與詢問對象有關,具體的重要技能集合總是在變化。Dave Holts描述了得到數據科學家工作所需要的技能,Ferris Jumah通過檢查帶有「數據科學家」稱號的LinkedIn個人資料識別10項技能,BurtchWorks提供了他們的在數據科學領域中獲得成功至關重要的技能列表,RJMetrics也使用LinkedIn數據找出了20個重要的數據科學技能。這些列表、重要技能反映了數據專業人員在他們社交媒體資料上列出的頻率,或者只是簡單地代表了作者認為最好的技能集合。
數據科學技能和熟練程度
數據科學調查中評估的25種技能
在正在進行的數據科學家研究中,我們要求數據專業人員指出他們在25項不同數據科學技能上的熟練程度。上表中列出了這25項技能,反映了通常與數據科學家相關的技能集合。事實上,這些技能是前述研究中所包含的。
我用「中等」熟練水平作為數據專業人員擁有該技能的標準。「中等」說明一個數據專業人員能夠按照要求完成任務,並且通常不需要他人的幫助。
重要數據科學技能
我以擁有該技能的數據專業人員百分比對這25項技能排序。
該列表在上圖顯示。圖中前十項技能(從左到右)是所有數據專業人員中最常見的。數據科學十大技能是:
統計 - 溝通(87%)
技術 - 處理結構化數據(75%)
數學&建模 - 數學(71%)
商業 - 項目管理(71%)
統計 - 數據挖掘和可視化工具(71%)
統計 - 科學/科學方法(65%)
統計 - 數據管理(65%)
商業 - 產品設計和開發(59%)
統計 - 統計學和統計建模(59%)
商業 - 商業開發(53%)
許多重要的數據科學技能屬於統計領域:所有的五項統計相關技能出現在前10名中,包括溝通、數據挖掘和可視化工具、科學/科學方法、以及統計學和統計建模。另外,商業洞察力相關的三項技能出現在前10,包括項目管理、產品設計以及開發。沒有編程技能出現在前10中。
因職業角色而異的十大數據科學技能
下面,我們按不同的職業角色看看他們的十大技能。這種描述也出現在上一部分的圖2中(後面的表呈現了細節)。對於每個職業角色,我指出了該角色的數據專業人士擁有每項技能的頻率。可以看到在圖2中,一些重要數據科學技能在不同角色中是通用的。這包括溝通、管理結構化數據、數學、項目管理、數據挖掘和可視化工具、數據管理、以及產品設計和開發。然而,除了這些相似之處還有相當大的差異,讓我們看看每個職業角色。
商業經理:那些認為自己是商業經理(尤其是領導者、商務人士和企業家)的數據專業人士中的十大數據科學技能:
統計 - 溝通(91%)
商業 - 項目管理(86%)
商業 - 商業開發(77%)
技術 - 處理結構化數據(74%)
商業 - 預算(71%)
商業 - 產品設計和開發(70%)
數學&建模 - 數學(65%)
統計 - 數據管理(64%)
統計- -數據挖掘和可視化工具(64%)
商業 - 管理和兼容性(61%)
只與商業經理相關的重要技能毫無疑問的是商業領域的。這些技能包括商業開發、預算、以及管理和兼容性。
開發工作者:那些認為自己是開發工作者(尤其是開發者和工程師)的數據專業人士中的十大數據科學技能:
技術 - 管理結構化數據(91%)
統計 - 溝通(85%)
統計 - 數據挖掘和可視化工具(76%)
商業 - 產品設計(75%)
數學&建模 - 數學(75%)
統計 - 數據管理(75%)
商業 - 項目管理(74%)
編程 - 資料庫管理(73%)
編程 - 後端編程(70%)
編程 - 系統管理(65%)
只與開發者相關的技能是技術和編程的那些。這些重要的技能包括後端編程、系統管理以及資料庫管理。雖然這些數據數據專業人員具備這些技能,但是他們中只有少數人擁有那些在大數據世界中很重要的,更加技術化、更加依賴編程的技能。例如,少於一半人掌握雲管理(42%),大數據和分布式數據(48%)和NLP以及文本挖掘(42%)。這些結果都與RJ Metrics的數據科學研究一致。我懷疑這些百分比會隨著更多數據科學項目的畢業生開始就業而上升。
創意工作者:那些認為自己是創意工作者(尤其是萬事通、藝術家和黑客)的數據專業人士中的十大數據科學技能:
統計 - 溝通(87%)
技術 - 處理結構化數據(79%)
商業 - 項目管理(77%)
統計 - 數據挖掘和可視化工具(77%)
數學&建模 - 數學(75%)
商業 - 產品設計和開發(68%)
統計 - 科學/科學方法(68%)
統計 - 數據管理(67%)
統計 - 統計學和統計建模(63%)
商業 - 商業開發(58%)
創意工作者並沒有隻對他們重要的技能。事實上,他們的重要數據科學技能列表與那些研究者緊密匹配,十項中有八項一致。
研究工作者:那些認為自己是研究工作者(尤其是研究員、科學家和統計學家)的數據專業人士中的十大數據科學技能:
統計 - 溝通(90%)
統計 - 數據挖掘和可視化工具(81%)
數學&建模 - 數學(80%)
統計 - 科學/科學方法(78%)
統計 - 統計學和統計建模(75%)
技術 - 處理結構化數據(73%)
統計 - 數據管理(69%)
商業 - 項目管理(68%)
技術 - 機器學習(58%)
數學 - 最優化(56%)
研究工作者的重要數據科學技能主要在統計領域。另外,只在研究工作者上體現的重要數據科學技能是高度定量性質,包括機器學習和最優化。
總結和結論
按職業角色的重要數據科學技能
重要數據科學技能列表取決於你正在考慮成為的數據科學家類型。雖然一些技能看起來在不同專業人士間通用(尤其是溝通,處理結構化數據,數學,項目管理,數據挖掘和可視化工具,數據管理,以及產品設計和開發),但是其他數據科學技能對特定領域也有獨特之處。開發工作者的重要技能包含編程技能;研究工作者則包含數學相關的技能,當然商業經理的重要技能包含商業相關的節能。
這些結果對數據專業人員感興趣的領域和他們的招聘者及組織都有影響。數據專業人員可以使用結果來了解不同類型工作需要具備的技能種類。如果你有較強的統計能力,你可能會尋找一個有較強研究成分的工作。了解你的技能並找那些對應的工作。
招聘人員需要了解不同類型的數據科學角色,以更好的招募與空缺職位的角色需求最匹配的專業人員。避免關注應聘者的職位,而是確定他們的技能符合要求。組織可以確保數據科學團隊包含不同類型的數據科學家,讓每個人解決最合適的問題,以此來優化他們的數據科學團隊。
來源:數藝智訓
全球市場交易訓練營,讓你成為最優秀的金融人!上海訓練營來啦!
解讀華爾街對沖基金最新交易策略
跨市場套利波動率量化模型
量化模型分析基本面事件
揭秘宏觀對沖基金的策略研究方法
經典技術分析是為輸家準備的套路
量子物理對交易的啟示……
時間:
8月3日(周四):18:00-21:00
8月4日(周五):18:00-21:00
8月5日(周六):9:00-12:00;14:00-17:00;18:00-20:00(業內交流活動)
8月6日(周日):9:00-12:00
地點:上海市
點擊展開全文


※如果科學家封神,會有什麼稱號
※代數、幾何、分析三者到底有什麼不同
※王者榮耀大數據:坑你的可能不是小學生
※2017量化交易零基礎實訓營
TAG:大數據實驗室 |
※數據科學的大坑
※數據科學與數據科學家
※全球排名前十的大學——納米科學與技術學科
※數據科學與大數據技術專業培養哪些人才?
※中國科學技術大學
※大數據研究項目中數據科學家需要掌握遷移學習
※數據科學進階之路:了解數據科學工作,管理數據科學家團隊
※數據科學對科學研究的影響
※東方能源科學 學科二 能的認識
※安徽省科學技術獎勵大會隆重召開 三人獲重大科技成就獎
※數說上海市科學技術獎
※物理學三大偉大科學家是誰?
※中科院先導專項「地球大數據科學工程」啟動
※轉型數據科學 需要什麼技能傍身?
※科學解讀!日本料理十大烹飪技巧
※科學家研究表明大腦不是唯一的智能基礎
※清華大學成立中藥、監管科學兩大研究院
※《麻省理工科技評論》18年科技十大突破之基因給算命提供科學依據
※數學是科學嗎?
※中國科學院將建成國際地球大數據科學中心