好雨知時節:成為機器學習工程師你準備好了么?
根據Indeed在美國在2018年的最佳工作報告,機器學習工程師的位置排在第四位,僅次於商業項目經理(第一名)、全棧開發者(第二名)和計算機視覺工程師(第三名)。事實上,從2014年到2017年,機器學習工程師的招聘數量增長了166%。
隨著人工智慧和機器學習的興起,許多組織發現自己需要考慮是否準備好引進機器學習工程師。
人工智慧(AI)專家供應短缺是現在普遍存在的問題,大型科技公司已在採取措施解決此問題,谷歌和亞馬遜都推出了人工智慧諮詢服務。根據《連線》雜誌的報告,谷歌首席執行官Sundar Pichai表示,目前只有「幾千人」能夠創建複雜的機器學習模型。 「如果你是一個在中西部地區的某個製造公司,你可能很有錢,但很難吸引到每年250,000美元的斯坦福大學博士為你工作。」
那麼你如何吸引機器學習工程師呢? CMSWire抓住了一些機器學習工程師來討論他們的角色,他們對他們公司的技術前景的看法以及他們在工作場所尋找的東西。從而牢牢掌握引起你共鳴的主題。
了解數據需求和時間表
mabl的機器學習工程師Sergei Makar-Limanov在一家小型創業公司工作。他們的目標是使用機器學習和AI來改進並自動測試網站和應用程序。在過去,馬卡爾 - 李馬諾夫的頭銜傾向於數據科學, 「總的來說,我對解決棘手的商業問題很感興趣,因此,如果我面臨一個機器學習能夠增加價值的挑戰,我很高興能夠為此付出努力。」
作為一個機器學習工程師,他可以從一個組織中找到什麼?對他來說,最重要的就是看到該組織的吸引力嗎? 「除了處於一個支持性工作環境之外,」Makar-Limanov表示,「高層管理人員的理解和支持對於機器學習項目取得成功是非常重要的。」
在這一點上,Makar-Limanov表示,這意味著組織需要有一個良好的理解,並支持以下內容:
1.所需的數據類型以及收集數據的一般方法。組織可最好擁有一個強大的數據倉庫解決方案,以支持必要的數據查詢,或願意投資構建此類解決方案。
2.時間線的不同方法。根據Makar-Limanov的說法,大多數組織都認可敏捷方法,其中有兩周或三周的時間去衝刺完成任務,但許多基於機器學習的項目並不適合這樣的時間表,最初的開發往往會花費較多的時間。
3.願意投資一個衡量機器學習應用程序結果的框架。 Makar-Limanov表示,「機器學習和人工智慧演算法在100%的時間內都不合適,因此為了理解改進,人們需要衡量實時性能,並將其與現有的解決方案進行比較。」
鼓勵參與開發過程
技術需求因組織而異。 Makar-Limanov曾在Hive、Spark頂級內部Hadoop集群以及其他使用帶有Redshift或Athena後端的AWS Stacks的地方工作。目前他正在使用BigQuery,DataFlow和Google Cloud Machine Learning來開展GCP基礎架構工作。 「在商業方面,對於企業來說數據驅動和認識到工程資源需要專註於數據收集非常重要,數據科學家需要參與產品的開發以確保正確的類型的信息的收集。例如,添加驗證碼以識別可疑的機器人流量,即使這可能不是嚴格的業務要求。」
耐心與測試
首席技術官AtomicX是一家使用機器學習的聊天機器人技術的公司,其首席技術官Eric Moller表示,他現在的重點是將機器學習技術應用於對話和文本數據以做出更好的預測。作為一個機器學習工程師,Moller指出,「機器學習仍然是一個相當科學的追求,將它應用到一個新領域通常意味著,在開始看到結果之前,需要容忍很多失敗。」
組織還需要機器學習工程師獲得成功的良好結構化數據。 Moller表示,「許多公司都活躍在機器學習的潮流中。最重要的是:你需要收集大量的結構化數據,尋找深層次的模式,並搜索那些經典的統計/回歸技術。」
讓不可能成為可能
Moller表示,他很高興看到他的公司將機器學習應用於通常「不可能」解決使用傳統計算範例的問題。 「我們已經掌握了圖像識別技術,機器現在在很多方面都可以比人類做得更好,比如在AtomicX中,我們將機器學習應用於文本和對話系統,這是一個非常困難的問題,因為我們的語言中嵌入了如此多的集體人類經驗。」
Moller也看好生成設計,他表示,機器學習的另一個方面是「令人難以置信的潛力」。 「我們已經通過簡單地提供我們想要優化的參數來構建更輕、更強、更高效的結構和設計。」
結合科學,數學知識
Zimperium首席科學家Esteban Pellegrino領導公司在Zimperium的z9移動安全引擎中的機器學習和人工智慧方面工作。他認為他的角色是通過利用先進的建模技術來解決複雜的安全問題,從而改變移動安全領域。佩萊格里諾最初受過巴爾塞羅研究所的核工程師培訓,他作為首席科學家的角色是在移動領域演變其團隊的安全解決方案。他與研究、開發和產品團隊合作,尋找合適的解決方案,這些解決方案足以滿足未來連接應用程序和設備的架構,其中,機器學習可能是解決方案的一部分,或者不是。
Pellegrino認為,機器學習結合了「多個科學領域」,以便找到工程和工業問題的解決方案。機器學習工程師應該能夠「輕鬆融入科學和數學不同領域的新知識」。
足夠的數據
組織機構學習工程師最重要的事情是在組織試圖解決的問題範圍內獲取足夠的數據。 Pellegrino表示,「這種問題應該在有明確的答案之前進行評估,如果它是正確的技術,如果可用的數據足夠,那麼就需要一個機器學習工程師。」
機器學習工程師希望具有足夠的創造力以找到現成的解決方案,並用有用的學習表示來構建數據模型,以有效地解決手頭的問題,他補充表示, 「這對組織來說可能是一個非常獨特的迭代過程,它將改變基礎設施,更好地將其適應於合適的架構,以便在工作流程中進行高效的數據提取、處理和學習」。
未來:ML的機器工具
佩萊格里諾預測說,在某種程度上,機器學習將幫助我們優化人類的大腦力量,這些力量會改善我們生活方式。我們在生活中會遇到各種各樣的問題,而很多方面是人類無法解決的,這時候機器學習演算法就能夠排上用場了。
未來,我們將看到機器學習成為機器而不僅是人類的工具。佩萊格里諾表示,機器將動態地學習和建立模型,以便在沒有人為干預的情況下更好地表現現實。


TAG:機器學習 |