當前位置：

首頁 > 最新 > 經過智商測試：你 100，AI 150

經過智商測試：你 100，AI 150

最新 07-22

By 超神經

圍棋也下了，DOTA2 也玩了，現在輪到讓 AI 做智商測試的推理題了。

受傳統智力測試的啟發，DeepMind 團隊最近發起了一場測試 AI 推理能力的實驗，結果顯示，AI 不僅可以理解一些抽象概念，還能推理出新的概念。

oops ，AI 又加一分~

不下棋了，用推理題考察 AI

在今年 7 月份瑞典斯德哥爾摩召開的「國際機器學習會議」上，DeepMind 發表了一篇論文，稱可以像測試人類智商一樣，通過一系列抽象元素，測量神經網路的推理能力。

研究人員將這種抽象推理能力定義為，在概念層面檢測模式和解決問題。抽象推理是人類智力的象徵之一，一個著名的例子是愛因斯坦通過電梯思想實驗推理出廣義相對論。

在這個實驗中，愛因斯坦推理出在均勻加速度下下落的觀察者和在均勻重力場中的觀察者之間存在一個等價關係。

正是這種將這兩個抽象概念聯繫起來的能力，使他得出廣義相對論，並基於此提出時空曲率，這種抽象能力就是人類智力的特徵之一。

備註：在《狹義與廣義相對論淺說》中愛因斯坦打了個比方，在一個封閉的箱子里有一個人，他看不到外面，在不受外界引力的情況下，有一個未知生物以 9.8 m/s^2的加速度向上拉這個箱子，於是箱子里的人的感受跟這個箱子靜止在地面上是一樣的，如果他手裡拿一個球，他是無法區分這個重量是因為地球引力產生的還是因為向上g的加速度產生的，所以引力質量等於慣性質量。

AI 除了處理數據也具備抽象能力

那麼，AI 是否也具備通過一些抽象元素，推理出新概念的能力呢？DeepMind 團隊的實驗證明，答案是肯定的。

團隊最初打算依靠訓練素材的形狀、位置和線條顏色等屬性來測試 AI 的推理能力，但結果並不理想，很難準確反映 AI 的推理能力。

常見的智力測試題題型

主要原因在於如果準備的實驗素材太多，或者過於具體，神經網路依靠強大的學習能力，會由於發現其中的一般性規律，而拒絕推理，人類也會如此。

對此，研究團隊的解決方案是構建一個問題生成器。這個問題生成器是由一系列抽象元素創建的問題集組成，專門用來來訓練和測試 AI 的推理能力，這些抽象元素包括關係（例如事物的發展）和屬性（例如顏色和大小）等。

大多數 AI 模型在測試中表現良好，其中一些模型的性能甚至能達到 75%。研究人員發現問題集的精確度與 AI 推斷抽象概念的能力相關性很強，可以通過調節問題集的屬性來提高其推理能力。

圖像推理題難倒了大部分 AI

相比之下，視覺推理的難度要更高，需要 AI 自己根據圖像所展現出的元素，創建問題集。不過，DeepMind 團隊稱已經有部分 AI 模型可以進行視覺推理。

為了實現視覺推理，這些模型需要從圖像的原始像素中歸納和檢驗出抽象概念，就像邏輯運算和算術級數，並將這些概念運用到從來沒有觀察過的對象身上。

圖註：DeepMind 團隊設計的機器學習模型所完成的一個視覺推理測試

整個測試證明，神經網路可以讓 AI 具備推理能力，但目前這種能力還存在較大局限，就算是當前最優秀的 Wild Relation Network（WReN）也無法完全解決。

AI 推理的局限

這個局限主要在於神經網路很難發現問題集之外的元素，這就導致它在推理過程中的泛化能力降低。

研究小組在博客中寫到：「神經網路在某些特定條件下的推理能力很好，而當條件發生變化後，推理能力就會急速下降。另外，模型推理的成功與否也與很多因素有關，比如該模型的架構、是否經過訓練等。」

若能找到一些改善模型泛化概括能力的方法，並探索出能在未來模型中使用「結構豐富，且普遍適用」的歸納偏差，或許可以解決這個局限。

不過，莫非工程師們都是抖 M ?

從圍棋到 DOTA2 ，人類一次又一次的被 AI 打敗，真的很有意思么？

送你們一句名人名言↓↓↓

超神經小百科

單詞

simulation

[?s?mj??le??n] n. 模擬，模擬

alignment

[??la?nm?nt] n. 隊列

片語

inferential capability推理能力

numerical simulation數值模擬

TensorFlow 坐莊，預測誰是最強神奇寶貝

Google 正在做的項目，可能讓索尼真的沒明天了

見字如面：AI 趕緊轉型做特工吧

超神經HyperAI

換個姿勢看 AI

關注

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 全球大搜羅 的精彩文章:

※「為了你我願意熱愛整個世界」
※陽台千萬別浪費了，軟裝這麼做好看又實用！

TAG:全球大搜羅 |