當前位置:
首頁 > 新聞 > 加州大學最新研究:通過模仿及無監督經驗,機器人學會使用即興工具

加州大學最新研究:通過模仿及無監督經驗,機器人學會使用即興工具


人類善於通過觀察和實踐,養成了操作不同工具的技能,加州大學伯克利分校(UC Berkeley)人工智慧研究院(BAIR)最新公布一項研究成果,把上述學習方式應用在機器人身上,研究人員利用演示數據集和無監督經驗,讓機器人通過模仿及互動模式來學會如何使用工具,在訓練之後,機器人儘管遇到先前從沒見過的工具,一樣會知道如何使用。

BAIR 博客文章指出,去年底 BAIR 完成一項研究工作,是讓機器人在無監督學習的情況下與環境交互,進而建立一個可預測因果關係的視覺模型,基於這個學習模型,機器人可以完成一些簡單的任務,包括疊衣服、擺放物體、或是用毛巾把物體遮蓋起來等。但是,如果要加入使用工具,以實現更複雜的互動時,如拿掃帚把垃圾掃入簸箕里,就顯得不足。

BAIR 研究人員進一步指出,許多動物利用觀察和實驗可以學會如何使用工具,比如通過觀察彼此,黑猩猩知道如何使用樹枝來捕抓白蟻,卷尾猴也懂得拿棍棒把食物「掃」過來,靠近自己,方便拿取,諸如此類使用工具的能力其實代表更高水平的智力。

因此,他們從動物的學習方式取得靈感,展開了進一步的研究:讓機器人像人類一樣,通過觀察和實驗來使用工具。通過設計出允許機器人通過類似模仿和互動模式的演算法,來掌握使用工具的技能,機器人不僅學會了把從沒見過的物體拿來當作工具,加以使用,甚至在沒有傳統工具可用的情況下,以「即興物品」來替代,例如,沒有掃帚時,推斷出瓶子等普通物品,也可作為工具使用,會更有效率地完成任務。

圖|機器人學會把不同的物體當作工具使用,以達到指定的任務,比如利用小掃帚將圓型物體推向黃色箭頭方向(來源:BAIR)

首先,他們先示範如何使用各個不同工具,每一次演示,都會把機器人攝像頭、抓手夾具位置等連續動作的圖像記錄下來,並利用這些數據建立一個動作提議模型,使機器人能夠把當前場景中的物體當作工具來使用。

但光是這樣還不夠,目前外界對於機器人的期待是可以做出超越演示的表現,例如遇到沒見過的東西,也要懂得判斷如何處理或應對,才能讓機器人技術進一步泛化到新的物體和新的場景下,如此就需要有大量不同的數據,因此,BAIR 研究人員通過讓機器人能自行收集數據來擴展其經驗。機器人以兩種不同的方式自主收集數據,一是採取隨機的動作序列,二是從上述的動作提議模型中抽樣,機器人可抓取工具,並隨機移動。

而整個數據集包括專家演示、機器人對各種工具的無監督經驗,以及 BAIR 機器人交互數據集(BAIR Robot Interaction Dataset)的數據,研究人員使用整個數據集來訓練動力學模型。

圖|機器人在無監督情況下自行與不同的物體進行交互 (來源:BAIR)

在測試時,機器人可以使用模仿訓練的模型來規划過程,預測模型則會用來決定機器人可做出哪些動作來執行任務。當用戶指定任務時,並不會告訴機器人如何使用工具、或是有哪些備選工具可以使用,機器人必須在規划過程中自己弄清楚。

圖|機器人之前從未見過海綿,也能夠知道如何使用它來清除盤子上的東西(來源:BAIR)

圖|因為機器人只允許在綠色區域內移動,它懂得利用L形鉤來移動藍色圓柱,而不會跨越綠色區域範圍(來源:BAIR)

圖|遇到瓶子時,機器人也推斷出可以利用它來完成任務(來源:BAIR)

BAIR 指出,處理過去不曾見過的物體,一直是機器人執行任務時很大的挑戰,為了研究這個問題,他們結合了模仿和自我監督的交互,並通過上述的演示,讓機器人能夠使用多個物體來完成複雜的多對象任務,甚至可以在新場景下使用即興工具,這項研究工作有助於讓機器人更加通用,在日常環境中執行實際的任務。

-End-

參考:https://bair.berkeley.edu/blog/2019/04/11/tools/


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

迄今最大規模研究發現,試管嬰兒總體患癌率比自然受孕嬰兒高出約17%
UC伯克利大牛Pieter Abbeel發布最新機器人,專為AI設計

TAG:DeepTech深科技 |