谷歌推出新技術，用視頻訓練機器人

最新 02-13

近期，谷歌公司的研究人員提出了一種訓練機器人的新方法，讓機器人僅僅通過觀看視頻，就能在無人監督的情況下，模擬視頻動作的全過程。目前該方法已經能成功應用於訓練機器人完成倒水、放置碗碟以及姿勢模仿等任務。

GIF

機器人可通過觀看視頻學習倒水

該方法被稱為「時間對比網路」，簡稱為TCN（Time-Contrastive Networks），主要分為兩步：

第一步

對需要模仿的動作錄製多角度的多部視頻，以時間作為參照系，讓機器人對同一動作不同角度的視頻進行分解鏡頭的識別。經過以上的視頻識別過程，產生一組嵌入向量，其中含有和任務相關的有效動作，以及一些隨機行為，來體現真實世界中的各種可能狀態。隨後，使用Triplet loss誤差函數對以上向量數據進行處理。在同一幀的多視角觀察數據的基礎上，將多視角下同時出現的各幀圖像，在嵌入向量中互相關聯起來。

學習視頻由同一動作的多角度多部視頻組成

第二步

根據第一步對真人示範視頻識別產生的TCN嵌入向量，構建一套獎勵函數。機械臂起初會嘗試一些隨機動作，然後與獎勵函數進行反覆對比修正，進而產生並保留獲得最高獎勵的動作，最後達成重現視頻任務的效果。

據谷歌公司的研究人員稱，向量模型在僅僅經歷了9次迭代後就能成功收斂，即大約相當於需要15分鐘的訓練。例如在移碟任務中，機器人最初嘗試隨機運動，然後很快就學會了拿起和移動一個盤子。

內容整理自：科普中國

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 南京科普 的精彩文章:

※輪椅也炫酷，四輪摩托型輪椅你見過嗎？
※周日節氣：立春

TAG:南京科普 |