DeepMind提出SCAN:僅需五對樣本,學會新的視覺概念!
雷鋒網 AI科技評論按:DeepMind實驗室發布名為符號-概念聯合網路(Symbol-Concept Association Network,SCAN)的新型神經網路模型,可以讓計算機模仿人類視覺和辭彙獲取的方法,通過重組學到的概念,來想像新的概念。
以下為雷鋒網 AI科技評論根據DeepMind實驗室發布內容編譯。
大約二千五百年前,一個美索不達米亞商人收集了一些粘土、木材和蘆葦,隨著時間的推移,通過這些材料,他們發明了算盤,能夠在商品交易過程中記錄貨物數量、理清資產,這帶動了經濟的蓬勃發展,也改變了人類社會。
那一刻的靈感也照亮了人類另一個驚人的能力:重組現有的概念,想像出全新的東西。不具名的的發明家思考他們想要解決的問題,建造奇妙的裝置,收集原材料來創造新的東西。粘土能塑造成算盤的框架,棍子能用來把算珠串起來,蘆葦可以編成算珠。算盤的每個組成部分都很常見,也各有區別,把他們用這種新的方式組合在一起,就出現了革命性的創造。
組合的思想是諸如創造力、想像力和語言表達等能力的核心。腦海中只要有少量熟悉的概念性模塊,我們就能創造出大量新東西。我們將概念從具體到一般進行歸類,形成不同層次,然後用新的方式重組層次里的不同部分。這種方式對我們來說很自然,但要將其應用於AI研究還是個挑戰。
在DeepMind的新論文中,提出了一種新的理論性方法來解決這個問題。此外,他們還展示了一種稱為符號-概念聯合網路(Symbol-Concept Association Network,SCAN)的新型神經網路模型,這是首次通過模仿人類視覺和辭彙獲取的方法,學習自下而上的視覺概念層次,從而能夠通過語言指令想像出全新的概念。
他們的方法可以總結為以下幾點:
SCAN模型在視覺上與嬰兒在出生前幾個月看到的世界類似。這段時期,嬰兒的視線仍無法集中在半米以外的東西上,他們成天都在觀察各種映入眼帘、移動和旋轉的物體。為了模擬這個過程,他們將SCAN模型放在DeepMind實驗室的模擬3D世界中。在那兒,模型就像是嬰兒躺在嬰兒床上一樣,不能移動,但可以轉動頭部,並觀察在各種不同顏色的背景下可能呈現在他面前的物體,例如帽子、行李箱或冰棍。和嬰兒的視覺系統類似,這個模型會學習視覺世界的基本結構以及如何用可表述的視覺特徵來表示物體。例如,當看到蘋果時,模型將會學習根據其顏色、形狀、大小、位置或明暗來表示它
圖:SCAN模型依據物體的個體區分、顏色和旋轉、牆壁顏色、地板顏色等可表述的視覺特徵等來學習,去表示視覺場景。
一旦模型能夠根據可表述的視覺特徵來解析世界,就進入學習過程中的命名階段。這相當於嬰兒的單詞學習,大人開始為他們看到的各種東西提供單詞符號標籤。例如,在這個階段,父母可能指著一個蘋果對孩子說:「看,一個蘋果!」同樣的,對SCAN模型輸入基礎語言之後,它的經驗也在增強。一張黃色牆壁背景下紅色行李箱的圖像將伴隨著「紅色行李箱、黃色牆壁」這樣的符號輸入。SCAN模型能夠通過在前一階段學習的視覺特徵來構建抽象概念,進而學習新的概念。例如,蘋果的概念可以根據其顏色、形狀和大小來說明,而諸如位置和明暗等其他視覺特徵則會被認定為與其無關。
命名階段可以從任何層次學習視覺概念,同樣也可用於向模型教授「和」、「忽略」和「共同」等這些概念重組操作,這種教授是通過向模型展示如何正確使用這些操作的例子來實現的。例如,「和」的意思可以通過向SCAN模型展示一張金冠蘋果的圖像,同時伴隨「金冠蘋果是黃色的和蘋果」 這樣的指令來訓練。
一旦SCAN模型學習了一定數量的概念辭彙,並學會通過符號性的指令來處理它們,它就能在詞語形式的指示下,將常見的概念組合成新的概念,而不需要更多的圖像作為例子。通過這些指令,SCAN可以想像出大量新的視覺概念,如藍蘋果(「藍色的和蘋果」)或不同種類的蘋果(「澳洲青苹是金冠蘋果,忽略黃色,和綠色」)
GIF/754K
圖:首先,SCAN模型通過語言指令連接概念層次——從「藍色房間、紅色地板、白色行李箱」這種具體的概念,到「行李箱」這種普遍的概念,再回到「黃色房間、粉紅色地板、綠色行李箱「這種具體的概念。在每一步SCAN系統都會被要求想像出相應的概念(如圖右所示)。最後,向它指示一個新的概念——「woog」。雖然從沒看到過「woog」的例子,SCAN系統能成功地想像出它們看起來是什麼樣的(黃色房間、粉紅色地板、綠色物體)。
他們的方法不同於以往的研究,因為它完全基於感官數據,只需要從非常少的圖像—辭彙對中學習。當其他的深度學習方法需要數千個圖像示例來學習一個概念時,SCAN模型通過非監督觀測,學習視覺特徵和抽取概念,只需五對圖像—標籤對就可以學會一個概念。一旦訓練好了,SCAN模型就可以生成與特定圖像相對應的各種概念,並且可以想像出與特定概念相對應的多種可視化示例,即使它以前從未見過此類概念。
圖:圖中左邊是SCAN模型設想的「白色行李箱」的圖像,右邊是SCAN模型從「粉色房間、橙色地板、青色帽子」這張圖像上產生的概念。
通過符號指示,來重組現有的概念,學習新概念,這賦予了人類驚人的能力,使其能夠解釋諸如宇宙、人文主義或美索不達米亞經濟案例中的抽象概念。在成功實現這些概念性的飛躍之前,演算法還有很長的路要走。他們的這項研究朝著演算法的飛躍前進了第一步,即讓演算法在很大程度通過無監督的方式學習,就像人類一樣思考,進行概念抽取。
viaDeepMind Research Blog
雷鋒網(公眾號:雷鋒網)AI科技評論編譯。


※環境也能強化學習,智能體要找不著北了,UCL汪軍團隊提出環境設計的新方法
※聯手中國電信、華為 ofo基於NB-IoT技術打造物聯網智能鎖
※廉價的小型衛星,正在帶來新太空革命
※融資過億?死於高溫?這些都不是無人零售的真實面目
※奧迪首款L3自動駕駛量產車,背後是NVIDIA提供的計算力
TAG:雷鋒網 |
※To Dear Amei:學會示弱的你一樣很美
※DeepMind推出分散式深度強化學習架構IMPALA,讓一個Agent學會多種技能
※一篇文章學會使用 Android IPC 多進程
※星座診療室05| To Dear Amei:學會示弱的你一樣很美
※簡單幾招學會PowerMILL公司logo製作
※iPhone8和X出後iPhone7銷量猛增,國內果粉學會理性消費
※學會Snapseed這個功能,新年修片不用愁!
※Oral論文:zero-shot視覺模仿系統GSP,僅觀察演示就學會執行任務
※HeartSciences宣布在《美國心臟病學會雜誌》(JACC)上發表臨床研究結果
※十個Python練手的實戰項目,學會這些Python就基本沒問題了
※Learn to be grateful 學會感恩
※Gill s nutrition I 這些對抗流感的超級食療大法,你都學會了嗎?
※iPhone用戶必看:用Safari瀏覽器學會這5招才專業
※想要學好Python開發技術 首先學會安裝Python
※僅僅學會了requests和scrapy,你以為就足夠了嗎?接下來教你一個新神器
※如今我也學會了FAKE SMILE EVERYDAY
※學會Bling bling的日常百搭眼妝,輕鬆讓你擁有迷人電眼!
※AI醫療新玩家ReviveMed獲得150萬美元種子輪,代謝組學會是好切口嗎?
※谷歌又放大招,AutoML 已學會編寫AI代碼,現在學AI還能找到工作嗎?
※孩子學會說謊了?恭喜你,Seriously!