當前位置:
首頁 > 新聞 > 創新奇智在國際頂級視覺大賽PASCAL VOC奪冠,彰顯AI視覺演算法實力

創新奇智在國際頂級視覺大賽PASCAL VOC奪冠,彰顯AI視覺演算法實力

近日,在國際頂級的計算機視覺競賽Pascal VOC挑戰賽目標檢測comp4賽道上,創新奇智(AInnovation)研發的AInnoDetection 目標檢測演算法獲得綜合成績排名第一的好成績,超越Google、Microsoft、CMU(美國卡耐基-梅隆大學)、清華大學、阿里巴巴、平安科技、搜狗、Yi+、騰訊優圖等眾多國內外知名人工智慧企業和高校人工智慧實驗室,在Pascal VOC共20項的評測指標中,其中10項指標排名第一,充分體現了創新奇智人工智慧演算法能力,尤其是AI視覺演算法的創新和設計能力。

創新奇智在國際頂級視覺大賽PASCAL VOC奪冠,彰顯AI視覺演算法實力

創新奇智在20項評測指標中取得10項指標第一、總分第一的成績

(單項第一使用黑粗體顯示)

(圖片來源:)

Pascal VOC 數據集

目標檢測是圖像領域三大基本任務之一,同時也是圖像領域非常具有挑戰的演算法難題。Pascal VOC挑戰賽是世界最權威的三大計算機視覺挑戰賽之一,其數據集標註質量高、場景複雜、目標多樣、檢測難度大,是快速檢驗演算法有效性的首選。Pascal VOC數據量小但是場景豐富,更加考驗人工智慧演算法的設計和創新能力。ImageNet、MSCOCO數據量大,側重考查人工智慧算力的建設能力。

Pascal VOC是國內外AI公司競相展開激烈競爭的主賽場。截至目前,Pascal VOC挑戰賽吸引了全球近百支專業隊伍參賽,包括Google、Microsoft、CMU(美國卡耐基-梅隆大學)、清華大學、阿里巴巴、騰訊、搜狗、Yi+、平安科技等國內外知名圖像領域的頂尖團隊參與比賽。

Pascal VOC的數據集包括數十個類別,包括人類、動物、交通工具、室內物體等。創新奇智視覺演算法團隊參加了Object Detection (Competition4) 子任務,在20類不同的目標檢測上獲得了10個類別的檢測MAP(準確率)第一、總分第一的成績。

創新奇智在國際頂級視覺大賽PASCAL VOC奪冠,彰顯AI視覺演算法實力

Pascal VOC數據集部分樣本

創新奇智AInnoDetection演算法

創新奇智提出的AInnoDetection模型演算法,使用著名的二階段檢測演算法,採用數據增強來擴充訓練數據,包括填充小物體和mixup的方法。

創新奇智在國際頂級視覺大賽PASCAL VOC奪冠,彰顯AI視覺演算法實力

創新奇智在國際頂級視覺大賽PASCAL VOC奪冠,彰顯AI視覺演算法實力

通過以上步驟,使檢測模型能夠對小物體檢測效果更好,同時能夠使模型預測效果更好,更健壯。

模型選擇著名的二階段檢測網路,骨幹網路使用ResneXt152網路架構,使用它來提取多尺度特徵圖,頸部網路採用一個6級特徵金字塔網路(FPN),用來生成更豐富的多尺度卷積特徵金字。在這之後,連接兩個共享子網,一個子網負責分類目標框,另一個網路負責將目標框回歸到真實框,最後使用focal-loss作為二分類的損失。同時採用多尺度測試融合,這樣能夠使網路根據不同的圖像尺度來關注不同的目標框信息。

創新奇智在國際頂級視覺大賽PASCAL VOC奪冠,彰顯AI視覺演算法實力

創新奇智在國際頂級視覺大賽PASCAL VOC奪冠,彰顯AI視覺演算法實力

讓小圖片更加關注大物體,大圖片更加關注小物體。

最後採用多模型融合的方法,輸出最優的結果。

創新奇智在國際頂級視覺大賽PASCAL VOC奪冠,彰顯AI視覺演算法實力

目標檢測演算法的商用價值

創新奇智自成立伊始就瞄準高精尖的人工智慧演算法在零售、製造、金融等多個領域的商業化產品落地,重點突破人工智慧演算法的領先性和成熟性,形成具有巨大商業潛力的AI產品和解決方案。目前,創新奇智已經打造出業界領先的機器學習平台和AI工業視覺平台ManuVision,並發表了數篇頂級會議論文。這些成果實實在在提升了演算法在實際場景的精度,提升了訓練和推理的速度,並極為高效地整合了算力資源。

據悉,創新奇智的人工智慧視覺演算法已經應用在零售渠道陳列監控的商品識別、智能貨櫃、工業視覺、智慧園區社區等領域,商用效果處於行業領先水平。此次奪冠的目標檢測演算法在創新奇智的商品檢測、工業視覺缺陷檢測、渠道陳列監控等產品中已經使用。除了這次Pascal VOC賽事奪冠之外,創新奇智在多個世界頂級人工智慧演算法大賽上奪冠,比如最近,創新奇智在WIDER FACE人臉檢測賽事中奪冠。

關於參賽團隊

創新奇智本次Pascal VOC競賽奪冠隊伍由張發恩、吳佳洪、楊志錚、曹浩天、宋劍飛和范馨予組成。其中團隊Leader張發恩現任創新奇智CTO、創新工場人工智慧工程院首席架構師和寧波諾丁漢大學榮譽教授,他在人工智慧工業界和學術界成績不菲,曾任職Microsoft、Google和百度,持有多項國內外人工智慧演算法專利和發表過數篇人工智慧頂級會議論文。隊伍中其他成員也都有著深厚的人工智慧教育背景和從業經歷。

創新奇智是創新工場的AI子公司,以「人工智慧賦能商業未來」為使命,致力於用最前沿的人工智慧技術為企業提供AI相關產品及商業解決方案。創新奇智CEO徐輝在IT行業擁有20餘年的銷售、產品、技術、服務、管理經驗,歷任IBM、微軟、SAP等多家世界500強科技巨頭企業高管,對中國市場各個行業發展有著深入了解。創新奇智採用「技術產品」+「行業場景」雙輪驅動模式,商業化速度飛快。

創新奇智擁有優異的技術研發團隊,結合AI技術商業化的特點,制定了科學技術人才三級體系建設方案,三級體系形成一個金字塔結構,從頂到下分別是:「創新奇智科研委員會— 創新奇智創新研究院— 創新奇智工程演算法研發團隊」。其中,「創新奇智科研委員會」 由世界頂級人工智慧科學家及知名專家擔任,包括前騰訊AI Lab負責人張潼、 百度研究院三維視覺首席科學家楊睿剛、密歇根州立大學教授張彌、創新工場人工智慧工程院執行院長王詠剛、創新奇智CTO張發恩。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

CVPR 2019 Oral 論文解讀 | 無監督域適應語義分割
華為成最大黑馬,蘋果的可穿戴霸主地位受到挑戰

TAG:雷鋒網 |