當前位置:
首頁 > 新聞 > Adobe首席科學家王珏加盟曠視科技,主管曠視美國研究院

Adobe首席科學家王珏加盟曠視科技,主管曠視美國研究院

Talk is cheap, show me the code

新智元報道

作者:胡祥傑

【新智元導讀】孫劍之後,Face++再迎來一名重量級計算機視覺研究者——王珏博士。他將領導Face++位於美國的研究院,與孫劍負責的中國研究院相呼應。專訪中,王珏與新智元分享了他對研究與應用的看法:他習慣於一直看到技術的最終應用場景,從而來確定技術的走向,而不是僅僅局限於技術的本身。針對創業公司缺乏數據的難題,王珏博士也給出了可行的解決方案建議,比如,將一個渲染引擎嵌入到機器學習的框架裡面,使得渲染引擎能夠根據學習的需要動態生成數據。

GIF/38K

根據新智元獲得的獨家消息,前Adobe首席科學家王珏已經確認加盟國內計算機視覺和深度學習初創企業曠視科技(Face++)。

這是繼2016年7月前微軟亞洲研究院(MSRA)視覺組的首席研究員、華人深度學習科研的領軍人物孫劍之後,又一名加入曠視科技的重量級研究員。根據曠視科技的介紹,2017年4月,在 Adobe 度過了 9 年半研究生涯的王珏博士低調離職,加入曠視(Face++)並帶領曠視美國研究院(Megvii Research US)。

王珏曾就讀清華,2007 年在美國華盛頓大學獲得博士學位,隨即加入 Adobe Research。憑藉其出色的研究成果,在短短 6 年間,從助理研究員連升數級做到首席科學家 (Principal Scientist),據介紹,他是 Adobe Research 歷史上升職最快的科學家之一。

王珏同時在三個領域的最高級別會議和期刊發表論文:計算機視覺,計算機圖形學 (包括 11 篇 SIGGRAPH ) 和人機交互,其研究成果廣泛應用於 Adobe 的各項產品中,為 Adobe 近10年的影像處理軟體升級提供了強有力的技術支持。例如,2010年 Adobe 隆重發布的第一個商用動態視頻去背景技術 Roto brush,以及2013年發布的第一款商用圖像去模糊工具 Shake Reduction, 都是由王珏主導完成的。

選擇曠視:孫劍不遠萬里到西雅圖親自邀請,「內心是無法拒絕的」

2016年底,王珏博士萌生了離開 Adobe 的想法。「Adobe Research 提供了一個非常舒適和優越的研究環境,但是當你已經通過了它為你帶來的所有考驗之後,需要在一個新的環境裡面繼續充實和提高自己。」 王珏這樣評價自己的離職訴求。

這個想法傳開後,王珏博士收到了許多公司的邀請,既有 Google, Facebook,以及騰訊和阿里這樣的行業巨頭,也有中美的多家創業公司。那麼王珏博士最終選擇曠視的原因是什麼呢?王珏博士是這樣解釋的:

「主要是三個方面的原因。一是和曠視有天然的親近感。曠視是一幫有才華的清華年輕人創立的,在企業文化中有清華行勝於言,腳踏實地的價值觀。對於作為清華校友的我來講,對於這樣的文化有天然的熟悉和親近感。二是孫劍博士的誠意邀請。我和孫劍博士認識和同行多年,彼此都比較熟悉,他不遠萬里到西雅圖來邀請我,我內心是無法拒絕的。第三是機遇。我個人覺得中國目前人工智慧研究的環境,從數據規模到商業機會都比美國要好,但是在人才儲備上仍然不佔優勢。能夠幫助中國的人工智慧公司,特別是初創公司更進一步,在美國吸引頂尖人才為我所用,對中國高科技發展是一件里程碑性質的事情。這樣的機會在人生中並不多見,碰到了就應該抓住」。

回顧自己的職業生涯,王珏博士深有感觸: 「我個人的研究生涯是從美國公司在中國的研究院 (微軟亞洲研究院)開始,現在又加入中國公司在美國的研究院。這樣一個交替,見證了中國科技和商業在過去 15 年的高速發展。」

不追求將招聘重心放在頂級專家上,對於初創公司來講,戰鬥力決定一切

王珏現在帶領曠視的美國研究院,與孫劍負責的曠視中國研究院相互呼應。那麼,曠視的這個美國研究院目標和定位是什麼?

王珏在接受新智元的採訪時說:「曠視美國研究院肩負著多重使命。最基本的一點,就是要為公司開拓新的市場,發展新的業務提供強有力的技術支持。也就是說,美國研究院要對曠視北京研究院形成互補,需要獨立承擔一些新方向的研發工作,而不僅僅是對現有的研究內容錦上添花。在此之上,我們也希望通過自己的努力,提高曠視在世界範圍內AI產業和科研中的話語權。最後,要為公司吸引一些在海外的優秀人才為我所用。」

他還說,目前團隊在快速擴張中,我們的目標是在較短時間內形成一個有戰鬥力的團隊。這個團隊將包括多領域的精兵強將:計算機視覺,圖形學,計算攝像學,機器學習以及多媒體等,當然我們也十分注重團隊的層次感,要既有老將,也有新兵,既有科學家,也有工程師。

在人才招聘的標準上,王珏有著獨特的觀點,他說,我認為的最佳招聘是為公司找到契合度最高的人才。我們首先希望候選人對我們在做的事情有高度認同感。其次,我們希望候選人除了在學術研究上已經有所建樹之外,能夠有把東西真正搞work的強烈興趣和一定的工程能力。最後,要有那麼一點點極客精神。對於即將畢業的研究生來說,發表多少論文不重要,我們希望看到候選人獨立思考和全身心投入解決一個問題的態度和過程。

他接著說道,頂級的視覺專家你們新智元已經報道過很多了,但是我們不追求將招聘重心放在頂級專家上。把10個頂級專家放在一起,未必能形成一個有戰鬥力的團隊。對於初創公司來講,戰鬥力決定一切。

曠視美國研究院成立兩個多月了,它的現狀是什麼呢?王珏博士說:「我們的理念是行勝於言,認真做事。我特別喜歡公司發的筆記本上面的一句話:Talk is cheap, show me the code。成立短短兩個多月,我們已經成立了一個小的團隊,已經為曠視的產品提供了多項技術輸出,學術界也將很快看到我們的論文和研究成果。」 關於未來,「我們希望能儘快聚攏一批優秀的人,建立一個有意思的研究環境,一起做一些有意思而且有意義的大事情」。

做視覺的覺得我是做圖形學的,做圖形學的覺得我是做視覺的,兩邊人都來了我就說自己做人機交互

在 Adobe 9 年多的時間裡,王珏博士手把手帶領過 31 位博士實習生,發表了了 65 篇學術論文,獲得了 58 項美國專利,實現了 13 項重要技術的研發和產品轉換。在眾多的技術之中,王珏博士對2013年發布的去模糊技術 Shake Reduction 情有獨鍾。這項技術由王珏博士在2012年 Adobe MAX 技術大會上向 5000 多名觀眾公開演示。然而,讓王珏博士記憶猶新的原因並不在此。

王珏博士回憶說:「在13年底的某一天,我被叫到一個會議室,見到了公司的多位高管。老闆用投影儀投出了一張模糊的圖片,說祝賀你,FBI 用你的技術恢復了這張圖片的細節,從而根據其中的線索在 Kansas 解救了兩名被綁架的兒童。聽到這個消息,我整個人感覺像是被電流擊中一般,好幾天都處於非常亢奮的狀態」。「用自己的技術讓這個世界美好了一點點,這對於科研人員來講,是一件非常有幸福感的事情」。在此之後,FBI 曾多次使用該技術輔助案件的偵破工作。

王珏博士形容自己是經常走在岔道上的人,因為他的研究興趣非常廣泛。「做視覺的覺得我是做圖形學的,做圖形學的覺得我是做視覺的,兩邊人都來了我就說自己做人機交互。」 王珏博士這樣打趣自己。「我一直以來都不給自己的研究加太多的限制,只關注於做自己感興趣的事情,自己能做的事情,用心做」。形成這樣的研究風格也和王珏博士的經歷有關,他在清華自動化系跟隨李衍達院士的課題組研究醫學成像,在微軟研究院跟隨王堅博士(現阿里巴巴技術委員會主席)做手寫筆、和徐迎慶老師(現清華美術學院信息藝術設計系主任)做動畫,在華盛頓大學電子工程系跟隨圖形學泰斗 Michael Cohen (1998年圖形學終身成就獎得主) 研究計算攝像學,「好像從來沒有務過本專業的正業」。

長期跨領域的研究,使得王珏博士在研究上總是喜歡多思考一些問題。「比如在做一個演算法的時候,我不僅會考慮演算法性能,還會考慮演算法能否支持有效的用戶交互,這往往是傳統的計算機視覺研究人員容易忽視的問題。而這,也許是演算法是否能夠落地的關鍵。」

王珏對新智元說:「做技術研究的時候,我習慣於一直看到技術的最終應用場景,從而來確定技術的走向,而不是僅僅局限於技術的本身。比如從視頻分割這個視覺經典問題講起。分割不是最終目的,有多種可能的應用,而不同的應用對於演算法精度和複雜度的要求是不同的。在Adobe的時候,我們希望分割結果能夠直接應用在好萊塢的電影製作上,那麼這個應用對於分割精度的要求就非常高。而全自動的演算法無論如何總是會出錯的。如何能在交互環境下有效的進行視頻分割就成了一個有意思的問題,一方面要求演算法能夠在少量用戶干預下快速收斂到精確結果,另一方面也要求系統提供一種直觀和有效的交互方式,使得演算法能夠輔助用戶進行高效的工作。」

「落地」,未來成功產品轉化率希望能做到 50%

在和王珏博士的交流中,「落地」這個詞出現了好幾次。「要做研究,首先要研究清楚自己」,王珏博士這樣說。「研究分為很多種,有理論研究,基礎技術研究,基於好奇心的探索性研究,也有面嚮應用的研究。每個人的喜好和特長是不一樣的,應該選擇適合自己的研究道路。我是一個比較純粹的實用主義者,所以特別喜歡應用驅動的研究,通俗的講,就是能落地的研究。」

在王珏博士看來,能落地首先是選題的問題。「偉大的實用技術都有一個最基本的要素,就是他們解決的問題一定是用戶的剛需。要做能落地的研究,首選需要理解和關注用戶的痛點。工業界實驗室之所以能誕生很多實用技術,是因為他們更貼近用戶,理解什麼是真正對用戶有價值的問題,而不是閉門造車。」 在進入 Adobe 規劃第一個項目之前,王珏博士花了一個月的時間走訪了多家使用 Adobe 產品的影視機構,觀察他們的工作流程,傾聽他們對現有產品的吐槽,這才將動態視頻去背景這個全行業的痛點作為首要研究的課題。

落地是一個艱難的過程。在王珏博士看來,一篇優秀的學術論文最多只解決了一半的問題,在落地過程還有大量的細節難關需要攻克,而攻克這些問題既需要靈感和巧妙的解決問題的思路,也需要大量的工程經驗與實踐積累。有的時候,甚至需要全盤推翻學術論文裡面提出的解決方法。在2016年做全景圖拼接的邊緣正則化這個項目中,王珏博士帶領團隊在研究了學術界最新研究成果後,提出了一種巧妙的替代演算法,實現了計算速度百倍的提升,也使得這個研究成果成為今天 Adobe Lightroom 裡面廣受歡迎的新功能。

「有一次在一個國際會議上遇到一家大公司 AI lab的manager, 聊天的時候我感嘆我自己參與的項目只有大概 25% 的成功產品轉化率,那位 mananger 很驚訝,因為他們那裡這個數字只有大概 10%。」 王珏博士未來的目標,就是將這個轉化率翻一倍,希望能達到 50%。

新智元對50%的成功產品轉化率感到好奇,王珏博士進一步解釋說,要達到這個目標,核心還是在團隊的構建。如果單單是把10個頂級視覺專家放在一起,那麼這個目標是沒法達到了。一方面是團隊必須包含從初期研發到最終落地所需要的全部人才,更重要的一點,是每個團隊成員都要認可研究落地這個共同目標,並為之努力。特別是對科學家來說,能夠放下身段,傾聽客戶的聲音,從客戶需求中去尋找自己的研究課題,才能保證研究的實用性。這也是華為精神在曠視內部廣受推崇的原因。

計算機視覺的未來:有必要跳出視覺的圈子,從大系統的角度來看視覺,才不會有「只緣生在此山中」的錯覺

作為在計算機視覺技術上有著多年積累的資深研究者,王珏博士也與新智元分享了他對當下這一技術發展趨勢的看法。

首先,今年的CVPR上,ImageNet大規模圖像識別比賽被宣布終止,有專家解讀說,未來業界會朝向視覺理解進軍。那麼,王珏博士如何看待計算機視覺的未來?

他說:「計算機視覺近幾年發展很快,也有很多人預測未來的發展方向,我覺得他們說得都很有道理。我只想提一點,有的時候有必要跳出視覺的圈子,從大系統的角度來看視覺,才不會有「只緣生在此山中」的錯覺。最近比較火的無人車和無人店就是很好的兩個例子,兩個都是系統工程,視覺是重要一環,但是如何將視覺技術和其他技術有效融合,才是其是否能成功的關鍵。」

從視覺本身這個領域來看,王珏博士覺得基於視頻的視覺理解是一個重要的中長期方向。他說,現實世界中沒有生物是通過一張靜態圖片來認知的,這個世界的很多規則和信息都包含著時序序列中。舉個簡單例子,你和一個人面對面交談,他的複雜情緒變化你很容易從微小的面部表情感知。而拍一張圖片,大家喊一句「茄子」就可以矇混過關。對於視頻的精細化理解,目前還處於起步階段,還有很長的路要走。

計算機視覺在中國存在過剩嗎?

計算機視覺技術在中國非常火熱,有資料統計,幾乎一半以上的AI公司都在這一領域發力,那麼,在中國市場,這一技術存在過剩嗎?

王珏博士認為,計算機視覺技術做的人多是因為它確實有很明確的應用場景,已經有很多成功的商業化樣例。從這個角度來講,他不覺得有過剩。他說,其實在計算機應用領域的研究上,產學研結合得非常緊密,如果有過剩的話市場機制會慢慢矯正。等到哪天學視覺的同學找工作比較困難了,那就是真正過剩了。

關於這一技術的落地,他認為,目前落得非常好的是人臉的識別和認證,這件事的價值非常大,可以對多個行業帶來巨大影響,現在是安防和金融,即將是零售和服務業。無人駕駛是另一個很清晰的落地點。「相對於醫療,我更看好視覺在工業和農業機器人領域的落地前景。相對於給人看病,我覺得先給農作物看病更容易實現」,王珏說。

最後,王珏博士也與新智元分享了他對數據的看法。他說,大公司會通過開源技術,封閉數據來打擊潛在的競爭對手。對於初創公司,如果沒有明確在商業計劃書裡面提到數據來源我會感到不可思議。其中的一個方案是可以想辦法造數據。對於計算機圖形學來說,這是一個機會。以前圖形學的渲染主要是給人看,未來會有越來越多的渲染是給機器看。一個有意思的問題是如何將一個渲染引擎嵌入到機器學習的框架裡面,使得渲染引擎能夠根據學習的需要動態生成數據。這方面學術界已經有一些嘗試,他感覺潛力十分巨大。

【號外】新智元正在進行新一輪招聘,飛往智能宇宙的最美飛船,還有N個座位

點擊閱讀原文可查看職位詳情,期待你的加入


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

Science專訪谷歌Magenta負責人:AI創作焦點是機器學習演算法
「Nature」破譯大腦:追蹤15000個神經元繪製最詳細神經迴路圖
「男人比女人更易被機器取代」AlphaBetap評自動化風險TOP職業
「重磅」Nature發布科研影響力榜單,中科院等15家中國機構上榜
DeepMind進軍星際爭霸2,谷歌FB打響通用AI戰爭

TAG:新智元 |

您可能感興趣

Facebook AI 翻譯主管黃非加盟阿里達摩院
Facebook AI翻譯主管黃非加盟阿里達摩院
Uber聘請前亞馬遜電子部門主管負責歐洲業務
潑冷水 美國銀行技術與運營主管稱Apple Card零創新
Facebook任命英國前副首相為全球事務主管
李飛飛繼任者、Google Cloud新AI 主管安德魯·摩爾的 AB 面
李飛飛繼任者、Google Cloud新AI 主管安德魯·摩爾的 AB 面
東華大學旭日工商管理學院招生推廣主管張斯雯談2018MBA調劑
LEAP 招新 | Modern Eye 藝影書閣招募新媒體運營主管
特斯拉Autopilot主管凱勒離職 或加盟英特爾
爭霸人工智慧 蘋果挖來Google首席AI主管
特斯拉Autopilot主管離職 入職英特爾
Facebook任命VR部門新任主管
Chanel 首位多元化及包容性全球主管;雅詩蘭黛首位女性副董事長;Victoria Beckham CEO 離職
CIO訪談:蘇格蘭皇家銀行創新主管Kevin Hanley告訴你誰該為創新負責
LVMH 集團大公子 Antoine Arnault 又被委以更多重任:兼任集團傳訊和形象主管
XBOX主管Phil Spencer祝賀《戰神》獲媒體高分
音樂記者 Alex Gale 加入 Apple Music,主管編輯工作
Facebook任命前Google AR/VR業務主管領導Portal團隊
特斯拉自動駕駛技術Autopilot主管Jim Keller離職,重返晶元開發行業