人臉識別研究進展
近些年得益於網路架構、訓練策略以及人臉數據的發展,人臉識別技術取得了巨大的提升,越來越多地被推廣到安防領域,延伸出考勤機、門禁機等多種產品,產品系列達20多種類型,可以全面覆蓋煤礦、樓宇、銀行、軍隊、社會福利保障、電子商務及安全防務等領域,人臉識別的全面應用時代已經到來。
然而,現有方法主要關注自然環境下的人臉識別,其訓練數據大都從網路上收集而來,一般只包含中等量級的人數(約10萬人),但每類平均樣本數很多(多於20個)。然而,實際應用中的人臉識別系統通常只能獲取2張圖像,一張證件照,一張現場照。同時,系統需要面對的人臉個體數量可達到上百萬甚至是千萬級。因此,實際中人臉資料庫通常具有海量類別,但每類只有2個樣本,一般被稱之為大規模雙樣本問題。
現有方法在訓練這種數據時會遇到巨大的挑戰,例如類內變化不足使得訓練難以收斂以及海量樣本數對計算設備的極端要求。為此,中國科學院自動化研究所針對真實場景下的人證核驗問題,提出了基於深度學習的大規模雙樣本學習方法,解決了雙樣本數據帶來的類內變化不足問題和海量樣本數計算壓力大的問題。
目前,深度學習在人臉識別界具有統治地位,基於分類的訓練方法是主流,其將每個人當作獨立的類別,並使用softmax進行分類訓練。近兩年SphereFace,CosFace以及InsightFace進一步引入了邊界裕量(margin)來提高識別網路的可擴展性,在公開測試集上取得了領先性能。然而,softmax的計算消耗與類別數直接相關。在實際應用中,百萬類甚至千萬類的分類會對訓練平台產生極大壓力,普通訓練平台(如8卡TITANX)甚至無法訓練,給主流方法的應用帶來了困難。
自動化所朱翔昱、雷震等研究人員提出的大規模雙樣本學習方法包括兩個方面,一是提出了一種分類-驗證-分類(CVC)的訓練策略來逐步提高實際場景中的性能,二是針對大規模分類問題提出了DP-softmax使得深度學習在超大規模類別的分類上具有可擴展性。
在分類-驗證-分類(CVC)訓練策略中,研究人員將整個訓練過程分為三個階段。第一個階段為Pre-learning(Classification),首先在網圖人臉資料庫上訓練一個深度神經網路模型,以得到一個較好的初始人臉識別性能。第二階段為Transfer Learning (Verification),使用基於度量學習的人臉驗證方法如triplet loss在大規模雙樣本數據上進行微調,將人臉知識從自然環境遷移到人證場景下。第三階段為Fine-grained Learning (Classification),構建了一個特殊的分類層DP-softmax對百萬級類別進行分類,最終達到人證場景下的最優性能。
DP-softmax極大降低了大規模分類的計算需求,首先通過CVC策略中第二階段的模型對訓練數據抽取特徵並構建每個類別的類別模板(prototype),生成所有類別的類別模板庫。在訓練過程中,針對當前mini-batch中的樣本選擇與他們最相似的少量類別模板構建臨時分類層來完成本次分類訓練。整個過程可以在不影響訓練效果的前提下,極大降低大規模分類的計算需求。研究人員對提出的方法進行了充分的實驗,表明在IvS場景下,該方法相比現有方法有了明顯提升。
相關研究成果發表於International Journal of Computer Vision。


※預測無癥狀心梗無創貼片
※放射性核素示蹤技術應用於心臟澱粉樣變
TAG:顧建文教授醫學科普 |