當前位置:
首頁 > 最新 > 八篇論文引爆ICML,螞蟻金服技術亮相國際機器學習大會

八篇論文引爆ICML,螞蟻金服技術亮相國際機器學習大會

小螞蟻說:

國際機器學習大會ICML 2018 於 7 月 10 日在瑞典斯德哥爾摩召開。這場學術大會於1980年首次在匹茲堡舉行,今年已是第 35 屆,和 NIPS(神經信息處理系統大會)並列為機器學習學術界最頂級的會議。

有人整理了ICML 2018 收錄的論文數量,發現贏家依舊是大家的「老朋友」:前列的均為美國院校,而頭把交椅的Google 也有多篇論文收錄。目前越來越多來自工業界的研究力量屢屢出席行業頂級會議,這也表明越來越多的頂級科技公司願意在前沿學術學術研究上投入資源。螞蟻金服也是其中之一。

今年,螞蟻金服以獨立身份參加ICML,為大會奉獻了八篇論文,本文將給大家帶來分享。

引言

隨著機器學習熱度的增加和其中「中國力量」的逐漸強大,在各大頂級會議上有越來越多的中國組織排名靠前,大有爭奪頭把交椅的勢頭。

比如,本次ICML,清華大學有 12 篇論文被收錄;華裔作者的數量也令人驚訝,如喬治亞理工學院終身副教授、機器學習中心副主任宋樂署名的就有8篇論文。

而宋樂教授的另外一個身份,就是螞蟻金服人工智慧部研究員。

螞蟻金服成為ICML 上「中國力量」的代表之一,為大會奉獻了8篇論文。其中,六篇含金量十足的Oral Paper,成為議程上研討會的主角,接受與會專家的熱烈討論。

這些論文幾乎每篇署名作者都有世界級學術專家。比如人工智慧教父,螞蟻金服科學智囊團主席邁克爾·歐文·喬丹 (Michael I. Jordan),以及上面提到的喬治亞理工學院機器學習中心副主任,在螞蟻金服人工智慧部擔任研究員的宋樂教授等。

不僅如此,螞蟻金服還在本屆大會上展示了多項核心技術和產品:基於強大的深度學習能力開發的定損寶、自研的圖結構處理Graph Embedding 技術,以及基於圖像處理和自然語言理解技術開發的智能客服等。特別是定損寶,將圖像識別技術和車險領域首次結合,每年有望為中國保險公司節約數十億元人民幣成本,備受參與ICML 2018 的業界人士關注。

和頂級學術界人才深度合作,凸顯螞蟻金服在機器學習方面的能力,而將學術成就快速轉化為商業級產品更是證明了螞蟻金服的的決心——人才的吸引力和學術商用的兩手並重,讓首次參會的螞蟻金服就成為了這場頂級學術會議上的耀眼新星。

用先進的人工智慧,解決真實世界難題

深度學習如此熱火朝天,最大的原因在於它可以被訓練用於解決真實世界的問題。比如社交網路的用戶之間存在著多維關係,而地鐵線路也存在複雜和不規則的連接。如何將可能有著相同社交圈的用戶連接在一起,如何用安排最優的導航路線,在過去靠經驗和複雜的計算,在今天需要深度學習。

和社交網路、地鐵線路類似,金融數據也是圖結構,但又不完全相同。由於螞蟻金服為上億級的個人用戶提供服務,產生的金融數據從一開始就是海量且極其複雜的。即便是此前最先進的Graph Embedding 技術,處理金融級的圖結構仍有壓力。(Graph Embedding = 圖嵌入向量空間,一種圖結構深度學習的方法。)

這成為了學術界和業界所面臨的共同難題。

在ICML 2018 上,螞蟻金服提出了一個新解法,用提交的幾篇論文形成一個完整的思路:

首先,螞蟻金服的研究人員設計了一個新的圖形卷積網路模型;然後,他們設計出新的特徵傳播方法和剪枝技術,讓神經網路中不斷傳遞的計算結果越來越準確,消除無用的傳遞;然後,他們設計了一種對抗攻擊的方式以挑戰模型,進而提高準確度;最後,研究者整理了之前的思路,再設計出一種能夠將研究成果泛化的機制,針對真實世界裡不同的問題,快速教育並生成新模型。

這一組六篇論文所提出方法的主要意義,在於處理金融領域的圖結構數據時效率很高,顯著強於業界之前在Graph Embedding 方面的最優解。這種深度學習處理圖結構的方法,在真實世界中可以被用於系統性風險的監測預測,顯著降低風控成本,提升系統的安全性——而這正是金融科技企業的立命之本。

螞蟻金服在ICML 2018 上展示的另一個核心產品定損寶 2.0,背後同樣是當前最先進的深度學習技術。它的功能是當發生車輛事故時,用戶拍照上傳即可快速定損,這一技術可以整合到第三方保險公司的手機應用里。

功能很簡單,原理卻極其複雜,因為定損的不是保險公司的客服或定損人員,而是深度學習圖像處理演算法。它首先要找到不起眼的磕碰位置,也就是找到問題在哪裡;然後要能夠將發現的所有異樣結合起來,給出一個綜合的定損結果,甚至要能做出小碰小修、大碰換新的建議,也就是需要強大和高彈性的模式識別能力。

讓問題複雜化的在於照片本身分多樣性。並不是每一張照片都非常標準和清晰,有的太暗,有的因為打了手電筒反而出現強反光,在定損寶里就需要在底層的深度神經網路上設計消噪。

對於螞蟻金服的世界級研究團隊來說,這些難題並非不能解決。去年上線之後,定損寶已經整合到了太平、大地、陽光等保險公司的服務中,在一年時間裡節約了定損員75萬小時的工作量,人工和系統成本約合20億元人民幣。

定損寶2.0 版本從人工判斷全面升級為人工智慧定損,縮短了時間並提高了準確率,而且降低了使用者的專業度,車主自己就可以成為定損員。

「為了讓普通車主隨手拍也能達到專業效果,我們應用了大量新技術,其中專利數就達到了46 項,」螞蟻金服保險事業群副總裁李冠如表示,這個專利數比 1.0 版多了一倍。

如無意外,定損寶2.0也將全面升級為開放平台,保險公司可以自行開發產品然後接入API。這一設定將鼓勵更多中小保險公司涉足車險業務,為企業和消費者創造價值。這也是螞蟻金服稱這些技術為「暖科技」,而不是「黑科技」的原因所在。因為這些技術並不僅僅是酷炫,更重要的是能讓世界變得更好。

技術出海,靠技術也靠人才

螞蟻金服在ICML 2018 上一鳴驚人,不僅看收錄的論文和展示的技術,還要誰是它們的幕後英雄。

邀請知名學者加盟擔任高級顧問是科技行業的通用做法,Google、微軟、Facebook 等美國公司都是通過這樣的方式加速人工智慧研究和投入商用。而和螞蟻金服牽手的,正是被稱為人工智慧教父的邁克爾·歐文·喬丹。

喬丹教授是美國科學院、工程院以及藝術與科學院的三院院士——得到這一成就者本就寥寥,而喬丹是計算機科學領域唯一獲得該成就的學者。他目前在美國加州大學伯克利分校擔任電氣工程、計算機和統計學教授,學生也有許多圈內同樣知名的學者,如前百度首席科學家吳恩達,以及成為微軟人工智慧顧問的蒙特利爾大學教授約書亞·本吉奧(Yoshua Bengio)。

一年後,雙方的合作已經開花結果。在本次ICML 2018 收錄的論文《Learning to Explain: An information-TheoreticPerspective on Model Interpretation》正是由螞蟻金服牽頭,論文的署名作者中就有喬丹,以及他在伯克利的同事和學生。

另一位近年來在深度學習領域發布了大量論文的專家,名字也出現在了螞蟻金服本屆ICML 提交的幾乎所有論文當中。他就是近年來頻繁出現在各大人工智慧頂級會議上,大量發表頂尖學術成果的宋樂教授。

宋樂教授任教於美國最優秀理工類院校之一的喬治亞理工學院,擔任計算機系終身副教授,並領導著該校的機器學習中心。他本科畢業於華南理工大學,在悉尼大學和澳大利亞信息通訊技術中心獲得了博士學位,隨後前往卡耐基梅隆大學擔任學者,也曾在Google Research(現 Google AI)做過一段時間科學家。

和喬丹一樣,宋樂認可螞蟻金服正在做的事情。他在去年加盟螞蟻金服,擔任人工智慧部研究員,領導深度學習、強化學習和可解釋性模型方面的研究。

和其他機構對於技術出海的定義不同,在螞蟻金服看來,學術人才應該成為技術出海的奠基者和見證人,出海的一個重要目標應該是和全球的學術界專家和受眾建立合作。吸取和輸出同樣重要。

除了這些專家,螞蟻金服還跟其他頂級學術機構和人士建立了合作。比如2016 年,螞蟻金服跟清華大學交叉信息研究院院長、圖靈獎唯一華人獲得者姚期智合作,組建了數字金融科技聯合實驗室;MIT FinTech實驗室中,螞蟻金服是創始成員中唯一一家中國公司;美國政府旗下國家科學基金會和加州大學伯克利分校共同組建的 RISE 實驗室中,螞蟻金服和阿里巴巴也是創始成員。

螞蟻金服認為,想要在金融領域輸出創新,全球的學術交流是必要前提。

發論文只是途徑,目的是把金融平等帶給世界上的每個人

此次螞蟻金服在ICML上發表的論文在這場全球頂級學術會議上引起了很大反響。各國學者和業界代表擠滿了展台,了解定損寶2.0、Graph Embedding 和智能客服等技術。

但一切只是開始,論文只是螞蟻金服和學術界交流的途徑,像其他機構一樣刷論文並不是終極目的。對螞蟻金服而言,在頂級學術會議上發布論文,有兩方面的意義,一個是推進人工智慧最前沿研究的發展,同時緊密地把學術與應用場景結合起來。而螞蟻金服擁有海量的應用場景,這些技術從研究到落地能夠真正造福數以億計的用戶,真正為世界帶來平等的機會。

螞蟻金服認為,工業界可以和學術界展開更多合作,因為業界有更多的數據、更大的問題和更難的挑戰。而這種合作不僅可以讓技術落地,還可以反哺、發展技術。

因為做技術並非它本身的目的。用技術去解決真正的問題、產生有意義的服務,用科技的力量,讓人們能夠享受到平等便利的金融服務,才是螞蟻金服的使命和夢想:

2014年,珠峰大本營,探險者苦於現金找零的麻煩,開始使用支付寶結算。後來,二維碼出現在了珠峰大本營幾乎每一頂帳篷前;

中國的中小業主往往享受不到便利、合規的金融服務。一個奶牛養殖戶在螞蟻金服的幫助下貸款解決了資金周轉,讓一家人能夠吃飽飯,還擴大了養殖規模;

2015年功能上線的刷臉支付,一年時間服務了超過2億用戶。這個已經習以為常的功能,對於60歲的退休職工王燕玲並不普通,因為她再也不用翻箱倒櫃找密碼了;

在螞蟻金服的產品體系中,螞蟻金服是個獨特的存在,用戶每一筆線下支付都會積累一點能量,到達一定程度就可以種下一棵樹,截至目前已經種了超過1000 萬顆樹——跟長城不一樣,這片森林在衛星上確實看得見。

這樣的例子還有很多。螞蟻金服希望進一步攜手高校和學術屆人才,讓技術創新快速商業化並反哺技術進步;讓城市或山區,讓年長或年幼,讓富有或貧窮的人之間,鴻溝不斷消弭。這也便是螞蟻金服所信奉和追求的普惠願景。一起加入我們吧,讓技術,無遠弗屆。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器學習 的精彩文章:

14款機器學習加權平均模型融合的火花
機器學習技法-lecture5:Kernel Logistic Regression

TAG:機器學習 |