曠世科技孫劍:計算視覺的革命與挑戰 | CCF-GAIR 2017
2017年7月7日至9日,全球人工智慧與機器人峰會CCF-GAIR大會在深圳大中華喜來登酒店舉行。本次由CCF中國計算機學會主辦、雷鋒網與香港科技大學(深圳)承辦的大會聚集了全球30多位頂級院士、近300家AI明星AI企業 ,參會人數規模高大3000人,都是國內頂級陣容。雷鋒網記者在會議期間第一時間進行現場報告。
孫劍首先自然地吐槽了天氣導致的飛機延誤。但同時他也自然地開始考慮,如果人工智慧能夠幫助飛機規划起落,肯定會比無人車容易,而且能起到明顯的幫助。
進入正題,孫劍表示,人工智慧的分析跟大數據、計算力、演算法提升有關係,但是他覺得最重要的是計算方式的變革。神經網路雖然是人類在計算機上建立、發展的,但神經網路中激活函數、非線性單元、權重矩陣的應用可以形成非常高維的非線性函數,從而可以完成與以往天壤之別的任務。在這個之上,GPU還讓神經網路的發展如虎添翼。
Face++很早就意識到這樣的運算非常重要,所以他們自己構建了完整的運算平台,自研的深度學習框架、深度學習訓練引擎Brain++,然後花了非常多的時間去打磨。對這個方向的認可和深入的投入讓Face++取得了優異的成果。
孫劍講解道,曾經人們不相信深度學習網路是可以被訓練的。從2012年8層的AlexNet之後,一切就都變了。然而在這種範式下,網路在20層左右的表現最好。
不過Face++的深度殘差網路ResNet達到了152層,效果也得到了大幅度提高;2016年的時候甚至達到了1000層,這時候網路實現已經沒有難度了。
隨著網路研究的發展,不同的設備上開始依據計算資源的多少出現了網路的分化效果。與1000層針鋒相對,Face++新的ShuffleNet就適合非常小的計算量,但比AlexNet效果好不少。網路架構也不斷得到提升,越來越快,效果也越來越好。FGPA都可以實現30fps的1080p圖像識別。
人臉識別方面,大家在超越人類的識別精度後,繼續不斷地刷新紀錄。
依靠Face++自研的網路和智慧城市天眼系統,他們在今年MIT科技評論的最智能公司中排名第11位。
計算機視覺方面還有這樣幾個挑戰:感知問題好解決,認知&概念問題非常難解決,甚至不知道如何教機器,但計算機視覺其實也有很大一部分是認知和概念問題,比如到底什麼樣的東西是椅子,有兩個非常有力的例子,人都沒法準確地描述到底什麼是椅子。
還有弱線索、遮擋、模糊、對象追蹤等情況,人類的在識別的時候會依據常識加入豐富的想像和推理,但是很難把這些能力教給計算機,計算機在這些狀況下的識別就比人類差很多。
最後還有對精度要求非常高的場景,比如自動駕駛和醫學圖像診斷;以及基於背景知識的圖像內容描述,挑戰都是非常大的。不過這還意味著有很多的潛力可以挖掘
更多演講報道及演講圖文全文,請繼續關注雷鋒網。


※UCL 教授汪軍:多智能體強化學習的兩大挑戰 | CCF-GAIR 2017
※驚呆!人類藥丸?今天一大波機器人佔領了深圳喜來登六樓 | CCF-GAIR 2017
※「籌備三年,歷時三個月評選」AI最佳僱主50強榜單重磅出爐(國內AI領域第一份權威求職榜單)
※星河集團創始人徐茂棟:智能商業引爆產業互聯網時代 | CCF-GAIR 2017
TAG:雷鋒網 |