AI challenger發起中國首次「零樣本學習演算法」大賽！

知識 04-02

去年，由創新工場、搜狗、頭條聯合主辦的AI Challenger（以下簡稱AIC）全球AI挑戰賽吸引了來自65個國家近萬團隊參賽。今年，AIC預熱賽零樣本學習（zero-shot learning）競賽即日起開始比賽。

據了解，零樣本學習競賽同樣發布大規模圖像屬性數據集，包含78017張圖片、230個類別、359種屬性。與目前主流的用於zero-shot learning的數據集相比，圖片量更大、屬性更豐富、類別與ImageNet重合度更低。

創新工場AI工程院運營副總裁吳卓浩表示，因為在很多情況下人們難以獲得足夠的有標註的數據來訓練識別或預測模型。受人類學習能力的啟發，零樣本學習（zero-shot learning）希望藉助輔助知識（如屬性、詞向量、文本描述等），在沒有任何訓練樣本的情況下學會從未見過的新概念。這具有重要的研究意義和廣泛的應用場景，被認為是實現大規模物體識別的一個重要方式。瞄準這個國際前沿課題，AI Challenger帶來了目前世界最大的零樣本學習數據集、以及國內首次零樣本學習競賽。

資料顯示，零樣本學習是當前最具挑戰的AI識別方法之一。簡單來說就是識別從未見過的數據類別，即訓練的分類器不僅僅能夠識別出訓練集中已有的數據類別，還可以對於來自未見過的類別的數據進行區分。這是一個很有用的功能，使得計算機能夠具有知識遷移的能力，並無需任何訓練數據，很符合現實生活中海量類別的存在形式。

傳統的「零樣本學習」方法首先是讓智能體（Agent）對類別進行語義理解。將類別標籤利用輔助知識（如屬性）嵌入到語義空間中，再利用訓練集中的數據學習這種從圖像到語義的映射關係。此後，即使遇到新的類別，只要提供了該類別的語義知識，模型即可識別該類別，這就是零樣本學習。

例如識別一張斑馬的圖片，但在訓練時沒有訓練過斑馬的圖片。那麼我們可以通過比較這張斑馬圖片中包含的屬性和各個類別的屬性定義，進而在屬性空間中找到與該測試圖片相近標籤，即為該圖片的標籤。

而零樣本學習的意義也顯而易見：在傳統圖像識別任務中，訓練階段和測試階段的類別是相同的，但每次為了識別新類別的樣本需要在訓練集中加入這種類別的數據。一些類別的樣本收集代價大，即使收集到足夠的訓練樣本，也需要對整個模型進行重新訓練。這都會加大識別系統的成本，零樣本學習方法便能很好的解決這個問題。

－馬上學習AI挑戰百萬年薪－

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 AI講堂 的精彩文章:

※注意力機制在自然語言處理中的應用
※DeepMind提出「SACX」學習範式，訓練機器人解決稀疏獎勵任務

TAG:AI講堂 |