在 IJCAI 2019 上,阿里不僅貢獻了 11 篇論文,還展示了最新的 AI 技術
機器之心報道
作者:李澤南
澳門舉行的人工智慧頂會 IJCAI 2019 因為正值大會創立 50 周年而備受矚目。在這場盛會上,國內科技巨頭阿里巴巴展示了自己面向文娛和安全兩大方向的最新技術。
在本屆 IJCAI 上,阿里巴巴不僅有多篇論文入選,還以研討會、交流、展覽等形式全面展示了自己的 AI 實力。其中不僅有面向文娛的 AI 技術,也有近期廣受好評的智能打假應用。
8 月 13 日晚,阿里大文娛與阿里安全還在 IJCAI 大會期間共同舉辦了一場「阿里之夜」,邀請來自阿里巴巴的技術專家以及學界著名教授朱軍等人,一同進行了技術交流與分享。而阿里文娛摩酷實驗室的負責人王曉博則向我們首次介紹了阿里旗下兩大 AI 實驗室的研究與近況。
發展面向文娛的 AI 技術:阿里文娛摩酷實驗室
在位於威尼斯人酒店的 IJCAI 2019 阿里巴巴展台中,我們可以看到由阿里文娛摩酷實驗室研發的北斗星智庫。北斗星是泛內容的 AI 平台,依託 AI 大數據能力,對泛內容進行全維解構分析,在內容的投資、製作、運營、營銷的全生命周期中,給予 AI 大數據的輔助決策參考。在本次 IJCAI 的 Demo 中,觀眾可以體驗北斗星是如何從創作、運營、宣推各個階段輸出決策建議,並提供相關的數據分析。
現場 Demo 展示了人工智慧對熱播電視劇《長安十二時辰》中演員鏡頭與觀看熱度的分析。
除此之外,阿里文娛摩酷實驗室這次還展示了智能對話式視頻搜索 DEMO,這是阿里在智能終端上部署的基於多輪對話的視頻搜索服務。它通過語音識別(ASR)、語義理解(NLU)和多輪對話管理(DM)等技術,在與用戶交互的過程中,可根據檢索結果自動生成用戶友好的交互內容,並利用語音合成模塊(TTS)朗讀給用戶,實現舒暢的交互體驗。
阿里智能對話式視頻搜索系統。
智能對話式視頻搜索的重要特點,是將視頻知識圖譜和多模態的視頻內容理解技術與智能對話系統結合起來,阿里的視頻知識圖譜實現了劇情/場景,角色/主演等關係的推理學習,以及對視頻中人物/動作/場景的多層級對象的識別,滿足用戶對視頻內容多維度的檢索需求。如『我想看黃曉明老婆主演的都市電影』以及『我想看易烊千璽跳地板舞的視頻』等。
據阿里文娛摩酷實驗室負責人王曉博介紹,摩酷實驗室是阿里巴巴從事文娛智能研發的頂級團隊,其研究範圍包括:計算機視覺、機器學習、搜索與推薦等,團隊擁有多位業內資深專家,並已在 IJCAI/KDD/CVPR/ICML/CIKM 等多個人工智慧頂級會議上發表了數十篇論文。
「視頻生產的整個周期,從 IP 評估、劇本創作,再到拍攝和視頻內容分發過程都應用了大量人工智慧演算法技術,」王曉博介紹道。「摩酷實驗室將打造視頻內容一站式解決方案,以技術賦能視頻行業上下游,同時積極探索行業新賽道,實現科技與藝術的深度結合。」
阿里文娛摩酷實驗室背靠阿里巴巴,聯合達摩院,面向阿里希望大力開拓的文娛場景,致力於探索「AI 如何給用戶帶去更多的快樂」這一重要命題。在國內外眾多基礎 AI 研究機構面臨轉型的當下,摩酷實驗室代表著阿里思維的轉化:今天的阿里達摩院不僅在思考前沿科技,也在更多地思考如何讓新技術落地這個問題了。
「現在,工業界和學術界的結合非常緊密,近年來淘寶 APP 的全面個性化就是其中的典範案例,而這一過程要依賴面向數據化驅動的產品設計理念,這會面臨來自商家、用戶、平台多方的挑戰。」王曉博表示。「企業有更好業務場景的時候,海量用戶的數據量會給我們帶來很多的機遇和挑戰。此前,學術界往往比較關注於新方法、新模型及新問題,而面對線上真實的用戶反饋將會是完全不同的情況。」
阿里安全圖靈實驗室:直面 AI 最大挑戰
在文娛之外,安全也是阿里極為重視的研究領域,其風險管理事業群早在 2009 年就已成立。在 IJCAI 2019 上,阿里展示了旗下機器學習研發團隊「阿里安全圖靈實驗室」的最新技術。
阿里安全圖靈實驗室負責人薛暉曾表示,安全會成為人工智慧發展最大的挑戰,而阿里提出的安全 AI 在模型韌性、多模態、小樣本學習等方面具有更強的攻防屬性以及進化能力,會成為網路安全問題的核心解法。在 IJCAI 現場,這一觀點也成為多位高校學者、研究人員和企業代表的共識。
阿里安全圖靈實驗室專門從事安全與風險方面的 AI 系統研發。其研究的核心技術包括計算機視覺、自然語言處理、生物特徵識別、圖計算以及異常檢測和分析等。所研發的 AI 產品包括:
每天掃描數十億文字圖片,識別有害信息的「綠網」
對假貨和侵權商品識別率超過 96% 的「知識產權大腦」
服務經濟體內 100 余個場景的人臉識別技術
利用視覺技術建立的新零售安防系統「天眼」
其中最近被人們廣泛關注「知識產權大腦」大放異彩——最近,由網信辦、工信部和公安部聯合主辦的中國人工智慧峰會在廈門開幕,曾被商務部發言人點贊的阿里巴巴「知產保護科技大腦」獲評「人工智慧創新之星」稱號。
「知產保護科技大腦」是由阿里近 20 年來積累的海量線上線下假貨特徵庫、打假經驗聚合而成的演算法技術系統。薛暉表示,這套系統的樣本數據總量相當於 186 個中國國家圖書館藏量,僅累積的打假圖片樣本就超過 137 億張。
據介紹,僅在過去 3 年中,阿里已使用這套技術協助全國 31 個省份、227 個區縣的警方抓獲制假售假嫌疑人 4439 人,搗毀制假售假窩點 4289 個。
阿里表示,知產科技大腦已經廣泛應用於電商領域,96% 的疑似侵權鏈接會在發布瞬間即被攔截。目前阿里旗下每萬筆訂單中疑似假貨數量僅為 1.11 筆。
在 IJCAI 大會上,阿里安全舉辦的研討會吸引了來自哈佛大學、西交利物浦大學、香港中文大學等全球學者的投稿和分享,內容包括遊戲模擬攻擊者竊取企業敏感信息、移動支付非法賬戶識別等各類問題。
為了抵禦未來 AI 面臨的安全風險,近日阿里安全還宣布與清華大學合作,以對抗樣本為核心發起安全 AI 挑戰者計劃。通過結合內容安全等場景,阿里安全從文字、圖像、視頻、聲音等多個領域針對對抗樣本賞金召集「挑戰者」,打磨安全的機器學習模型,共同建立安全研究社區。
目前,阿里旗下共設有八大安全實驗室。這家公司希望面向其整個經濟體建立全面的網路安全、業務安全、數據安全與平台治理的管理機制,並利用大數據構建強大的實時風險防禦能力。今天,阿里安全產品涵蓋的業務範圍既包括最底層的設備層、網關層以及流量層的網路威脅防禦,也包括了業務層的安全治理,例如賬號安全、假貨與欺詐識別、內容合規、數據及信息保護、營商環境治理等等。
這些安全中台能力不僅已經應用在阿里的所有電商場景中,還全面輸出給了阿里生態中的跨境公司以及其他合作夥伴。
人工智慧技術的發展為安全技術帶來了機遇,也帶來了挑戰。「從這次大會的見聞來看,我們不僅在討論 AI 解決的問題,也在研究 AI 帶來的問題。我們在討論 AI 帶來的偏見,在討論 AI 對隱私保護的問題。」薛暉表示。「新技術會帶來新的問題,我們要正視這些問題。有很多新技術在研發時是出於好意,但其用途會被人們歪曲。除了技術視角之外,我們還要有社會責任的視角。」
阿里的 IJCAI 2019
今年的 IJCAI 2019 大會共收到 4752 篇論文,其中收錄 850 篇,接收率為 17.9%。據機器之心了解,阿里在本屆會議中共有 11 篇論文入選,其中摩酷實驗室就有 5 篇論文被接收,其中包含情感分析、推薦系統等方面的工作:
Multi-View Multi-Label Learning with View-Specific Information Extraction
Multi-View Active Learning for Video Recommendation
Hybrid Item-Item Recommendation via Semi-Parametric Embedding
Multi-Objective Generalized Linear Bandits
Knowledge Amalgamation from Heterogeneous Networks by Common Feature Learning
隨著人工智慧技術不斷進入落地階段,我們正在看到學界開始擁抱業界的前沿研究——最近 KDD2019 大會將論文評選分成了「研究方向」與「應用方向」兩個平行賽道就是最好的例子。在阿里舉辦的 IJCAI 酒會活動中,摩酷實驗室負責人王曉博、圖靈實驗室負責人薛暉也與知名學者們共同對人工智慧發展趨勢,以及學界和業界的交流與合作進行了一番探討。
「人工智慧領域在近十五年來經歷了很大的變化。過去,機器學習研究使用的數據集很小,人們更關注的是演算法的精妙。而在今天,數據量的提升正讓研究趨勢發生改變,」清華大學計算機科學與技術系教授朱軍表示。「在業界人們經常會問:新的演算法雖然很有前瞻性,但是否真的實用?今天,阿里這樣的公司對新方法有了更高的追求。科研機構與公司之間的合作也在增多。公司的資源、需求,也在為研究提出新的課題。人工智慧領域的變化是全方位的。」
目前,阿里摩酷實驗室和圖靈實驗室都在招募資深演算法工程師,招收範圍包括機器學習、自然語言處理、計算機視覺等研究方向的人才。


※世界頂級電影特效公司都在讓AI「接管」特效製作
※當AI闖入藝術,它決定先為我們準備一場SHOW
TAG:機器之心 |