當前位置:
首頁 > 最新 > 阿里之夜×AAAI 2018,立足產學研構建全球合作共同體

阿里之夜×AAAI 2018,立足產學研構建全球合作共同體

雷鋒網 AI 科技評論按:AAAI(Association for the Advancement of Artificial Intelligence,國際人工智慧協會)是人工智慧領域最為權威與重要的協會之一,而 AAAI Conference on Artificial Intelligence(AAAI)則被中國計算機學會(CCF)推薦為人工智慧的 A 類會議。2018 年 2 月 2 日-7 日,第 32 屆 AAAI 會議(AAAI-18)在美國新奧爾良舉行。本次大會的官方資料顯示,AAAI 今年主會共收到投稿 3808 篇,錄用論文 938 篇。

值得一提的是,來自中國的投稿數從去年的 785 篇躥升了 58%,達到 1242 篇,並有 260 余篇論文被錄用。而在 AAAI 2018 上,阿里巴巴共有 11 篇錄用論文,6 位作者受邀赴主會作報告。論文內容涉及對抗學習、神經網路、提高輕量網路性能的訓練框架、機器翻譯、聊天機器人、無監督學習框架、極限低比特神經網路等技術方向。

作為開年首個頂級人工智慧學術會議,阿里巴巴不僅收到眾多論文被收錄的喜訊,在會議舉辦期間,阿里巴巴也於當地時間 2 月 5 日晚間舉辦了新一期的 workshop-阿里之夜,以開啟新一年的征程。雷鋒網 AI 科技評論也作為獨家媒體受邀做現場報道。


2 月 5 日當晚,阿里之夜在 AAAI 2018 會場順利進行。上百名 AAAI 組委成員、論文合作者、研究院所專家、高校學者通過定向邀約制齊聚一堂,不僅有 AAAI 協會主席 Prof. Subbarao Kambhampati 及 18 位 AAAI 2018 組委成員列席參與,還有來自全球 60 位 top 學者專家(包括 US Army research office 的 Dr Liye Dai, Director of MIT Initiative on the Digital Economy,Dr. Erik Brynjolfsson),以及全球著名高校的 60 多位 PhD 同學也參與了這一活動。

阿里巴巴人工智慧實驗室北京研發中心負責人聶再清博士作為代表作歡迎致辭,並以視頻、圖片等豐富形式分享了阿里的人工智慧最新研究進展和未來布局。

與此同時,作為受邀嘉賓出席「阿里之夜」的 AAAI 協會主席、美國亞利桑那大學教授 Subbarao Kambhampati 先生也做了致辭。Kambhampati 教授表示,「我在近幾年造訪中國,發現人工智慧已經在中國蓬勃興起,而且中國工業界擁有眾多首創模式和技術,在人工智慧領先表現讓我感到非常振奮。此外,投資界及政府對人工智慧也給予了眾多關注和支持,於我看來也是 AI 在中國進步的重要體現。」Kambhampati 教授用自己在中國的親身經歷告訴大家,阿里的產品給人類生活帶來的便捷和高效,高度評價了阿里巴巴將人工智慧技術轉化為產品和服務的能力。

阿里巴巴達摩院機器智能技術實驗室 NLP 資深專家陳博興和技術戰略部同學分別在會上分享了「AI 在阿里巴巴」及阿里巴巴學術合作項目。以阿里巴巴達摩院機器智能技術實驗室為代表,阿里巴巴展示了自己在智能語音、機器視覺(如圖像/視頻內容分析)、NLP(自然語言處理)及機器學習&優化四大領域為基礎的研究業務。

此外,阿里技術戰略部同學展示了全球學術合作的相關進展。以「AIR 計劃」為代表,在過去一年收到了 234 個來自全球 13 個國家、99 所高校的項目,並最終有 40 個優秀項目入選 2017 AIR 計劃全球評選結果。

在活動的最後,阿里巴巴還預告了將要開啟的一項重要賽事——2018FashionAI 全球挑戰賽。這一賽事由阿里巴巴「圖像和美」團隊聯合香港理工大學紡織與制衣系共同發起,並通過發布業界首個滿足服飾專業性和深度學習要求的大規模高質量數據集,號召業界一起聚焦機器認知時尚的兩個基礎問題:服飾關鍵點定位和服飾屬性標籤識別,共同推動 AI 技術在時尚產業的落地。

一名海外學生表示,他通過「阿里技術」公眾號了解到,阿里之夜將同期在 AAAI 2018 會議期間舉行,抱著對阿里巴巴學術合作項目的好奇,他第一時間報名參加了這次活動。「(這次活動)讓我更加深入地了解了阿里巴巴在學術領域的投入,感覺它是一家真正重視研究的企業。」


「阿里之夜」是阿里巴巴在學術會議上舉辦的 workshop 品牌,旨在搭建全球學術合作橋樑,構建全球產學研合作共同體。在去年的 IJCAI 2017 上,阿里巴巴也進行了「阿里之夜」的相關活動,同樣吸引了眾多學者的深度參與。

而這也正是阿里巴巴深度參與學術會議的一個重要目的。阿里巴巴 AAAI 2018 現場負責人石洪竺告訴雷鋒網 AI 科技評論,在一個聚焦的學術會議上舉辦阿里之夜,面向對應專業的學生去介紹阿里的技術品牌,「用這一方式產生更多的影響力,去影響我們最想影響的那些人,我認為這是阿里巴巴參與學術會議永恆的主題。」

聶再清博士也強調,「阿里之夜的宗旨是打造阿里巴巴的技術品牌與技術影響力,帶動產學研的交融。」據介紹,阿里巴巴在 2018 年將計劃在不同領域的學術頂會上持續帶來「阿里之夜」的品牌活動。

如果說,阿里巴巴舉辦阿里之夜是希望從宏觀角度展示自己在學術領域取得的成果,那麼在學術會議所取得的成果則更能從微觀凸顯阿里巴巴在人工智慧領域的優秀表現。

在過去一年,阿里巴巴共有 5 篇 KDD 論文、4 篇 CVPR 論文、3 篇 ACM MM 論文、11 篇 IJCAI 論文先後被錄用,橫跨數據挖掘、計算機視覺、多媒體、人工智慧等多個領域。此外,在機器視覺演算法測評平台 KITTI、國際肺結節檢測大賽 LUNA16、知識庫構建測評 KBP2017 等多項國際權威賽事上,阿里巴巴也多次刷新世界紀錄並取得測評賽事的冠軍。

除此之外,阿里巴巴也爭取到了機器視覺頂級會議 ACM MM 2020 的主辦權,成為首個獲得主辦權的中國企業。

步入 2018,在今年 1 月,阿里巴巴機器智能技術實驗室 NLP 團隊提交的 SLQA 演算法模型,在 SQuAD 挑戰賽中也取得了精確匹配、模糊匹配第一名的成績。與此同時,這也是 AI 歷史上機器閱讀理解首次在精確匹配上超越人類閱讀理解。

在首個頂級人工智慧學術會議 AAAI 2018 上,阿里巴巴共有 11 篇論文入選並均被主會收錄,涉及對抗學習、神經網路、提高輕量網路性能的訓練框架、機器翻譯、聊天機器人、無監督學習框架、極限低比特神經網路等領域。

在阿里之夜的現場,聶再清博士告訴雷鋒網 AI 科技評論,阿里巴巴希望從戰略高度,由電商企業向一家技術驅動的公司轉型,而要做到這一轉型,需要有大量的新技術做為支撐,「從公司的戰略角度出發,我們在技術研究上投入了大量的資金和人力,特別是我們最近在達摩院上的部署,包括像 AAAI 2018 阿里之夜這樣的學術活動,都是阿里巴巴高度關注技術的一種表現。」

而從選題角度來看,聶再清博士表示,學術論文所解決的問題,很重要一部分都來源於企業在實際中碰到的需求,阿里巴巴會嘗試讓技術水平達到理想狀態,讓用戶滿意,隨後才是論文的總結與發表。

以阿里巴巴今年的 AAAI 2018 錄用論文《Extremely Low Bit Neural Network: Squeeze the Last Bit Out with ADMM》(極限低比特神經網路:通過 ADMM 演算法壓縮掉最後一個比特)為例,從移動端部署的實際需求出發,團隊試圖通過低比特技術來壓縮和加速深度神經網路。論文第一作者冷聰介紹道,團隊將這個問題建模成一個離散約束優化模型,並引入了 ADMM 演算法,將原始問題分解成幾個子問題,針對每個子問題分別給出高效的求解方法。實驗發現,所提出的訓練演算法具有很快的收斂速度。同時,在精度和模型前向速度方面,團隊的低比特演算法超過了現有主流的壓縮演算法。

而在實際應用上,冷聰告訴雷鋒網 AI 科技評論,端上存儲仍然需要考慮業務的實際需求。對於精度不敏感的應用,可以使用非常低的比特來量化模型,「在精度低一個點甚至零點幾個點的前提下,如果能帶來幾十倍的壓縮,那麼是完全可以接受的」,而對檢測等對精度比較敏感的應用而言,採用高比特技術的壓縮可能更符合實際需求。

在與雷鋒網 AI 科技評論交流的時候,冷聰表示,雖然在研究選題上還是要以公司的業務和價值取向出發,但一篇論文從構思到撰寫完稿需要至少一至兩個星期的「脫產」才能完成,即在這段期間,員工會將優先順序完全放在論文的寫作上。在冷聰博士看來,阿里巴巴願意讓員工潛心完成論文的寫作,本身就是一種對學術交流和討論的重視和投入。而選擇一些優秀的技術以論文的形式投遞各大學術會議,也是阿里巴巴對外進行學術交流的一種形式。

而在機器翻譯上,阿里巴巴也憑藉《Improved English to Russian Translation by Neural Suffix Prediction》(一種基於詞尾預測的提高英俄翻譯質量的方法)受邀在 AAAI 2018 上做口頭報告。團隊提出了一種創新方法,不僅能夠通過控制翻譯粒度來減少數據稀疏,還可以通過一個有效的詞尾預測機制,大大降低目標端俄語譯文的形態錯誤,提高英俄翻譯質量。通過和多個比較有影響力的已有工作對比,在 5000 萬量級的超大規模的數據集上,這一方法可以成功的在基於 RNN 和 Transformer 兩種主流的神經網路翻譯模型上得到穩定的提升。

而在落地層面,阿里巴巴又是如何將學術研究成果與實際產品應用聯繫起來的?


實際上,阿里巴巴對學術與產業的鴻溝並沒有那麼難以跨越,兩者與其說是「先有雞後有蛋」的關係,倒不如稱之為互為因果、相互促進的螺旋式上升關係。

先從被廣泛認為最具落地想像空間與可行性的計算機視覺來看,阿里巴巴從電商起家,以「拍立淘」等以圖搜圖的相關應用入手,逐步豐富在 CV 領域的技術積累。

達摩院機器智能技術實驗室副主任華先勝此前在接受雷鋒網 AI 科技評論採訪時曾表示,電商搜索與城市大腦,本質上都是視覺系統問題。「阿里城市大腦中很關鍵的一個任務就是要解決視覺信號的問題,這實際上是對城市的智能感知。」因此,阿里巴巴在計算機視覺領域所做的研發和投入,正是希望讓城市大腦做到「全面知、全局知、全時知」。

在過去一年間,阿里巴巴所取得的領先成果便已經令人們感到驚訝與嘆服。從應用場景來看,去年成功當選「國家隊」成員的阿里雲城市大腦讓我們看到了國家對阿里巴巴 AI 力量的認可。實際上,早在 2017 年 11 月成為國家新一代人工智慧開放創新平台的人工智慧技術服務之前,杭州城市大腦 1.0 便已順利發布,接管杭州 128 個信號燈路口,試點區域通行時間減少 15.3%,高架道路出行時間節省 4.6 分鐘。在杭州主城區,城市大腦日均事件報警 500 次以上,準確率達 92%;在蕭山,120 救護車到達現場時間縮短一半。

更如果把時間線往前繼續推移,阿里雲在 6 月 10 日的雲棲大會?上海峰會上宣布推出應對全球環境惡化的技術方案:ET 環境大腦。這一方案已在江蘇實現了對水、氣、土、污染源的智能感知。據了解,在沿海多個省份的固廢全程監管模擬推演中,政府使用 ET 環境大腦共預警 131 次,其中有效預警 122 次,有效率達 93%,管理企業達 2.5 萬家。

而從語音識別領域,我們更看到了阿里巴巴在這一領域的全力投入。不論是首款智能音箱天貓精靈 X1 的順利發布及成功熱賣;或是 AliGenie 語音開放平台,都是最為鮮活的例證。

阿里巴巴採用先進的六麥克風聲學融合的方案,進行聲音的定向採集和降噪,實現了 5 米的遠場語音識別;而利用聲紋識別技術,阿里巴巴基於語音通路,為用戶提供更具個性化的定製化服務。

此外,利用海量的語音訓練數據和語言數據訓練出來的語音識別模型,基於深度語義編碼的意圖識別和槽填充技術,讓設備更懂人,準確解決指代理解問題與用戶意圖跳轉問題,以覆蓋生活中的大部分對話場景。

而阿里巴巴創建的「多模態智能語音交互解決方案」,可謂是在全球範圍內首次解決了公共環境中強雜訊、強幹擾下的智能語音人機交互問題。目前,該技術方案已與上海地鐵合作,可實現遠距離語音購票。這些成果標誌著阿里的技術投入已經成功轉化為商業化產品,並進一步使你我的生活更加便捷。

陳博興也向雷鋒網 AI 科技評論介紹了阿里在機器翻譯領域所取得的成就。阿里起步於電商業務,得益於國際化的飛躍步伐,為配合跨境電商在海外貿易中的溝通需求,阿里巴巴從 2012 年投入做機器翻譯業務,目前已經能提供包括商品信息翻譯、商品搜索翻譯和通用領域翻譯在內的三種服務能力,累計為集團 19 個部門共計 23 個應用場景提供語言服務。

豐富的合作資源背後,隱含的是阿里巴巴世界級業務應用場景及世界級海量數據的強大支持。從電子商務起步,如今的阿里巴巴已經擁有金融支付、物流、新製造、新零售等國內甚至世界領先的業務場景,這些場景所產生的 EB 級數據,不論是從數量上或是維度上,都是世界級的。以去年雙 11 為例,當天交易創建峰值 32.5 萬筆/秒,支付峰值 25.6 萬筆/秒,菜鳥網路物流訂單量超過 8 億;而回顧 2017 財年,阿里巴巴平台每天產生數億消費者瀏覽和交易信息、包含超過千萬級別的商品更迭、5.07 億的月活躍用戶等等。不難看出,阿里巴巴不僅具有豐富的應用場景,在數據的積累與處理上也具有得天獨厚的優勢。

而從基礎設施入手,包括超大規模計算、數據處理及演算法平台的構建,都成為了阿里巴巴集團各大業務的關鍵支持。也正因為如此,人才作為一切技術研發的核心,如何將全球的頂尖學術人才匯聚一堂,並推動阿里巴巴在產學研領域的縱向深入和橫向延展,同樣也成了阿里巴巴在戰略布局上的關鍵一環。


2017 年 10 月的雲棲大會上,CTO 行癲宣布了阿里巴巴達摩院的誕生。阿里巴巴達摩院是阿里巴巴集團在全球多點設立的科研機構,通過立足基礎研究、顛覆性技術和應用技術的研究,阿里巴巴著眼於匯聚全球頂尖科學力量,旨在成為「世界頂級科研機構」,並開始在全球各地組建前沿科技研究中心,致力於研究機器智能、智聯網、金融科技等多個產業的相關領域內容。阿里巴巴達摩院的涉足領域主要包括三個方向:

首先是自主研究中心。通過亞洲達摩院、美洲達摩院及歐洲達摩院三大全球分部,在北京、杭州、新加坡、以色列、聖馬特奧、貝爾維尤、莫斯科等地建設立足不同方向的研究實驗室,在初期計劃將 100 名頂尖科學家與研究人員納入麾下。

陳博興也在會後交流時和雷鋒網 AI 科技評論表示,這次參與 AAAI 2018 的一個重要體會在於海外留學生對於阿里巴巴特別是達摩院表現出了高度的興趣。「有很多留學國外的同學在交流時表示,他們希望能更多地了解阿里,也有不少流露出計划到阿里工作、實習的想法。在以前,很少有這麼大群體數量的學生對國內的公司表示出這麼大的興趣,在國外的博士生,他們畢業後一般都會希望在谷歌、Facebook、微軟這樣的企業工作一段時間,再考慮回國工作;而全球達摩院的建立對海外留學生的吸引力大大地增加了。這也得益於人工智慧在中國的快速發展,至少在應用上,中美兩國在步伐上還是相近的,因此學生們也會更有興趣選擇國內的企業。」

其次是聯合實驗室。阿里巴巴已與浙江大學、中科院、清華大學、加州大學伯克利分校先後達成合作關係,目前已建立了以浙江大學-阿里巴巴前沿技術聯合研究中心、RISELab(加州大學伯克利分校)、中國科學院-阿里巴巴量子計算實驗室、清華大學-螞蟻金服數字金融科技聯合實驗室在內的多家高校聯合研究所,以高校的研究實力及阿里巴巴的商業場景資源強強聯手,推動產業界、學術界及研究領域的深度合作。

第三個方面則是阿里巴巴創新研究計劃——「AIR 計劃」(Alibaba Innovative Research)。作為阿里巴巴達摩院的三大組成主體之一,「AIR 計劃」是阿里巴巴集團設立的首個全球性科研項目。這一項目主要致力於推進計算機科學領域基礎性、前瞻性、突破性難題的研究,以工業界和學術界深度融合的方式引領重大科技創新的實踐應用,構建產學研協作共同體。

在 2017 年,「AIR 計劃」發布了 14 個領域、30 個來自業務一線的技術問題,涵蓋人工智慧、機器學習、數據中心、圖計算等研究內容,並收到了來自全球 13 個國家、99 個大學和科研機構提交的 234 份研究提案,最終有 40 個優秀項目入選為 2017 AIR 計劃全球評選結果。而除了這一全球性科研項目外,阿里巴巴也通過推進訪問學者計劃等多種豐富形式,向學者們提供在阿里巴巴的訪問研究機會。

不論是阿里巴巴橫跨全球的各項學術戰略部署合作,彙集世界級的頂尖人才;又或是在各大頂級學術頂級會議上發表論文,積極投身學術研究;抑或是從 IJCAI 2017 開始啟動的「阿里之夜」活動,促進與學者的深入交流,本質上都是阿里巴巴關注學術界、立足基礎研究的重要表現。藉助面向全球的人才部署,相信阿里巴巴將會在更多的學術會議嶄露頭角,帶來更多的研究成果;而依靠強大的應用場景與數據支持,學術研究成果同樣能夠在阿里收穫應用落地的果實,助推阿里技術的商業化步伐。我們也相信,阿里巴巴在 AAAI 2018 的學術征程只是今年的第一步,未來我們還能在更多的學術會議上見到阿里巴巴的身影,在我們的生活中用到阿里自主研發的 AI 技術。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

人工智慧大熱,為晶元初創公司打開新前沿
1:1錨定美元的USDT:「空氣幣」詰問從何而來?

TAG:雷鋒網 |