機器福爾摩斯?DeepMind 要教會 AI 像人類一樣進行推理
邏輯分析和理性思考能力,是人類智力的核心,它們將人類與動物和大多數機器區分開。如果把這些能力賦予給 AI,它將能夠像人類一樣通過現象推理事實,甚至比人類做的更好。但是,目前的深度學習演算法還不夠先進,僅僅依賴於符號關係推理證明顯然還遠遠不夠。近日,DeepMind 發表了兩篇新的論文,文中探討了深層神經網路如何用非結構化數據進行複雜的關係推理,讓 AI 能變得更加「聰明」。
第一篇論文描述了一個用於邏輯推理的關係網路(RN),並證明用它執行一項具有挑戰性的任務的時候,AI 的表現甚至超越了人類的水平;另一篇論文描述了一個視覺互動網路(VIN),它可以基於純粹的視覺觀察來預測物理對象的未來狀態,使得 AI 能在簡單的視覺信息中進行更高級的邏輯推理。
神經關係網路(RN)
利用神經網路來進行關係推理並不是一個新的發現,近年來已經有許多團隊在研究這個領域,比如去年,馬薩諸塞大學信息與計算機科學學院就利用神經網路在他們的文章和大型知識庫中進行了關係推理。
但 DeepMind 的研究則更進一步,他們在論文中提出了 RN 這種新的關係網路進行推理。RN 模塊可以插入到現有的神經網路架構中,並且採用非結構化的輸入(如一張圖片或者一系列句子)給出對象間的隱含關係。
假設在桌子上堆放著各種形狀的物體,有球體、立方體等。為了了解他們之間的關係,RN 網路必須從這些圖像中提取像素流,確定有哪些對象內容,並進行對比。在這個過程中,網路並不會被告知物理對象是什麼,一切都要它自己弄清楚。找到對象之後,RN 需要將他們分組並通過不斷的對比建立他們之間的關係(比如球體體積大於立方體),最後輸出關係結果。
研究人員利用 CLEVR 視覺問題回答任務對這個模型進行了測試。DeepMind 發博文稱:「使用標準的視覺問題回答體系的 CLEVR 測試準確率是 68%,正常人類的準確率是 92%,而 RN 關係網路的準確率達到了 95.5%。」
視覺互動網路(VIN)
在關係推理中,另外一個重點是要預測物理場景中對象的未來狀態。在現實生活中,人類不僅可以推測出一些特定物體的位置,還能夠預測在接下來幾秒甚至更長一段時間它的狀態。比如,你將一顆足球踢向牆壁,你的大腦會預測到球撞擊牆面會發生什麼,以及之後的運動軌跡如何。這些預測是由一個複雜的認知系統引導的,
DeepMind 開發的「視覺互動網路」模擬了人類的這種能力。通過視覺模塊和物理推理模塊的配合,利用物體與物體之間相互作用的不同類型進行推理,它能在幾幀的視頻中推斷出物體的運動狀態,以及未來幾個步驟中物體的位置。
雖然論文中沒有透露視覺互動網路能夠預測到物體未來多遠的運動狀態,但是這兩篇論文都展示了解決 AI 關係推理難題的希望。
DeepMind 的高級研究科學家,英國倫敦帝國理工學院教授 Murray Shanahan 說:「我認為在機器學習領域一直存在一種缺陷,人工智慧的思想必須在神經網路的指引下進行,一些研究人員一直在探索這種方法。DeepMind 的研究是非常有價值的開始,推理是人工智慧必須掌握的能力之一。」
粹客網是國內首個關注前沿科技領域的科技新媒體和創業服務平台。我們提供最貼近商業化的前沿科技創業報道、最新最全的科技動態資訊以及深刻獨到的行業觀點。堅持挖掘有價值的創新創業項目,致力於成為創新創業者的前沿陣地。
每月精彩評論將有機會獲得神秘禮品,線下活動 or 商業合作請私信微信公眾號(cheekrnews)或發郵件到粹客網官方郵箱。
點擊展開全文
※美國蒙大拿州立基金會撥款資助當地比特幣挖礦企業
※從恢復到增強機能,賽博格技術正逐漸「入侵」我們的生活
※AMD 和英偉達布局加密貨幣市場,推出挖礦專用顯卡
※拒絕比特幣 ETF,美國監管機構能撐到何時?
TAG:粹客網 |
※英格蘭教會或使用Apple Pay/Google Pay進行募捐
※NET Core使用swagger進行API介面文檔管理
※Android Things 教程:與低功耗藍牙 BLE 設備進行通訊——Android 部分
※沃爾沃Polestar公司推Polestar Engineered 將電氣化進行到底
※蘋果推出Mac平台AI工具Create ML:可進行簡單機器學習
※【網路研討會】通過PowerVR圖形內核引入PVRTune Complete進行性能分析
※Angewandte Chemie 突破!會動的納米馬達讓CRISPR-Cas-9鑽進癌細胞心窩進行基因編輯!
※基因共享經濟平台mygenomebox 將通過ICO進行DNA交易
※使用 VS Code 進行 Python 編程
※Allevi和Made In Space合作推出新計劃:在外太空進行生物3D列印
※SteelSeries Arctis Pro旗艦耳機針對遊戲的特點進行了調整
※Reallusion推出動捕系統iClone Motion LIVE,可混合不同裝置進行全身動捕
※如何使用Reviewboard進行代碼Review?
※英國Sellafield核處理站與Createc合作,通過VR控制機器人進行核廢料處理
※SpringBoot中如何進行Bean配置
※windows下安裝HMMER軟體進行結構域模式掃描
※使用TensorFlow,Kafka和MemSQL進行實時機器學習
※通過Google Expeditions和Virtual Tours進行沉浸式教育
※美國PNC銀行將使用Ripple公司的xCurrent進行跨境交易
※Cheerble Studio推出智能骨頭Wickerbone,可以與寵物進行互動