加州大學最新研究：通過模仿及無監督經驗，機器人學會使用即興工具

新聞 04-14

人類善於通過觀察和實踐，養成了操作不同工具的技能，加州大學伯克利分校（UC Berkeley）人工智慧研究院（BAIR）最新公布一項研究成果，把上述學習方式應用在機器人身上，研究人員利用演示數據集和無監督經驗，讓機器人通過模仿及互動模式來學會如何使用工具，在訓練之後，機器人儘管遇到先前從沒見過的工具，一樣會知道如何使用。

BAIR 博客文章指出，去年底 BAIR 完成一項研究工作，是讓機器人在無監督學習的情況下與環境交互，進而建立一個可預測因果關係的視覺模型，基於這個學習模型，機器人可以完成一些簡單的任務，包括疊衣服、擺放物體、或是用毛巾把物體遮蓋起來等。但是，如果要加入使用工具，以實現更複雜的互動時，如拿掃帚把垃圾掃入簸箕里，就顯得不足。

BAIR 研究人員進一步指出，許多動物利用觀察和實驗可以學會如何使用工具，比如通過觀察彼此，黑猩猩知道如何使用樹枝來捕抓白蟻，卷尾猴也懂得拿棍棒把食物「掃」過來，靠近自己，方便拿取，諸如此類使用工具的能力其實代表更高水平的智力。

因此，他們從動物的學習方式取得靈感，展開了進一步的研究：讓機器人像人類一樣，通過觀察和實驗來使用工具。通過設計出允許機器人通過類似模仿和互動模式的演算法，來掌握使用工具的技能，機器人不僅學會了把從沒見過的物體拿來當作工具，加以使用，甚至在沒有傳統工具可用的情況下，以「即興物品」來替代，例如，沒有掃帚時，推斷出瓶子等普通物品，也可作為工具使用，會更有效率地完成任務。

圖|機器人學會把不同的物體當作工具使用，以達到指定的任務，比如利用小掃帚將圓型物體推向黃色箭頭方向（來源：BAIR）

首先，他們先示範如何使用各個不同工具，每一次演示，都會把機器人攝像頭、抓手夾具位置等連續動作的圖像記錄下來，並利用這些數據建立一個動作提議模型，使機器人能夠把當前場景中的物體當作工具來使用。

但光是這樣還不夠，目前外界對於機器人的期待是可以做出超越演示的表現，例如遇到沒見過的東西，也要懂得判斷如何處理或應對，才能讓機器人技術進一步泛化到新的物體和新的場景下，如此就需要有大量不同的數據，因此，BAIR 研究人員通過讓機器人能自行收集數據來擴展其經驗。機器人以兩種不同的方式自主收集數據，一是採取隨機的動作序列，二是從上述的動作提議模型中抽樣，機器人可抓取工具，並隨機移動。

而整個數據集包括專家演示、機器人對各種工具的無監督經驗，以及 BAIR 機器人交互數據集（BAIR Robot Interaction Dataset）的數據，研究人員使用整個數據集來訓練動力學模型。