有大腦的機器人能自己拿起從未見過的物品

科技 03-19

本文由騰訊數碼獨家發布

拾取機器人指的是一種能夠拾取和放置不同東西的機械臂，這種機器人能夠執行自己已經熟悉或輸入命令的重複性操作，但過於複雜的過程和不熟悉物體的拾取，對這種機器人來說是一種非常具有難度的挑戰。其實這並不奇怪，這些機器人不僅要對物體定位並理解如何抓住它們，而且這還需要大量的訓練數據，同時還抓取之後還要將物品放下來，這樣就不會對周圍環境造成破壞或干擾。

不過，最近來自麻省理工學院計算機科學與人工智慧實驗室(CSAIL)的科研人員來找到了一種克服這些障礙的新方法。在一份最新發布的研究報告中，研究人員描述了一種新的系統，這種系統可以通過一種縮寫為「kPAM」的關鍵點操作方式，可以檢測目標坐標的集合併將其定位要點，使機器人的硬體配合軟體系統來處理目標和對象。

麻省理工學院教授、資深作家拉斯·特德雷克在一份聲明中說:「當你在YouTube上看到關於機器人的視頻時，你其實應該仔細看看它做不到什麼。雖然這些機器人幾乎可以拿起任何東西，但如果是一種它們從未見過的物體，顯然就算拿起來之後，機器人也不知道應該如何將這些東西放下。」

通常來說，大多數的拾取與定位感知以及抓取演算法的估計都是通過位置、方向和幾何形狀確定而不是點，這對於涉及到形狀奇怪目標的抓取任務來說很難理解。相反，kPAM系統繪製的3D關鍵點管道可以「非常自然的」適應對象類型之間的變化。研究人員表示，只需要三個坐標就能確定一個相對統一的目標,比如一個咖啡杯（更重要的是一個在底部中心和頂部中心),就可以確定咖啡杯的位置和放置方法。

Tedrake表示：「只要對物體有一點點了解，通過幾個關鍵點的位置就足以實現各種有用的操作任務。」

研究人員利用目前最先進的積分人工智慧模型進行關鍵點檢測，該模型以單個RGB和深度圖像作為輸入，並為每個坐標輸出一個概率熱圖和深度預測圖。後續過程還將恢復2D圖像坐標、深度值和最終的3D關鍵點)。研究人員通過將關鍵點投射到圖像空間中來收集包含感興趣對象場景的訓練數據，並根據3D重建演算法估計出攝像頭的姿態。

在實驗中使用到的庫卡IIWA LBR機器人被安裝了一套名叫Schunk WSG 50系統中,從而實現了完整的訓練系統，這套系統可以成功的引導機器手臂把鞋子放在鞋架上或者將被子順利掛載杯架上。

機器人對使用20雙鞋的測試過程沒有出現任何問題。在100次試驗中，只有兩次沒有把鞋放在鞋架上。當機械臂不小心抓住鞋跟時，就會發生錯誤，導致鞋子從原來的位置移動。

在第二個「杯子架」測試任務中，機器人對40個形狀、大小和外觀設計都不相同的水杯進行了一系列測試，當杯子垂直放置時，它能夠抓住所有杯子，但由於觸手的開口有限，水杯水平放置時只能抓住其中的19個杯子。令人印象深刻的是，除了兩次試驗(杯子被倒置放置時)，它把杯子放在距離目標位置不到5厘米的架子上。

由於有的測試杯子的手柄比較小，只有30個杯子，其中5個杯子的手柄高度和寬度都不到兩厘米。握杯器可以百分之百的將大杯子掛在架子上，但是對於小尺寸的杯子，它的成功率只有百分之五十。研究人員將失敗案例的原因歸咎於不準確的關鍵點檢測失誤。

在測試中的其他領域也有改進的空間。Tedrake指出，人類必須對其系統所需的訓練數據進行注釋，他們打算在未來的工作中逐步淘汰這一過程，用合成數據補充真實世界的樣本。研究人員也承認，即使對象類別沒有更大程度的改變，關鍵點也必須被重新標記，模型也必須進行重新訓練。

儘管如此，研究人員仍然堅持認為，與目前的大多數方法相比，這套系統提供了比以往更大的靈活性，而且他們相信未來終有一天，這套系統可能會幫助機器人完成一些更複雜、更具有靈活性的任務，比如從洗碗機里將碗取出、清理廚房太面以及在工廠和其他工業環境中進行各種複雜和不確定的取放作業。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 犀利懟數碼 的精彩文章:

※三星Galaxy S10指紋識別得使勁按？撕掉貼膜就好了
※iFixit拆解Galaxy Buds無線耳機比蘋果更好修

TAG:犀利懟數碼 |

有大腦的機器人 能自己拿起從未見過的物品

有大腦的機器人能自己拿起從未見過的物品