谷歌推出新技術,用視頻訓練機器人
最新
02-13
近期,谷歌公司的研究人員提出了一種訓練機器人的新方法,讓機器人僅僅通過觀看視頻,就能在無人監督的情況下,模擬視頻動作的全過程。目前該方法已經能成功應用於訓練機器人完成倒水、放置碗碟以及姿勢模仿等任務。
GIF
機器人可通過觀看視頻學習倒水
該方法被稱為「時間對比網路」,簡稱為TCN(Time-Contrastive Networks),主要分為兩步:
第一步
對需要模仿的動作錄製多角度的多部視頻,以時間作為參照系,讓機器人對同一動作不同角度的視頻進行分解鏡頭的識別。經過以上的視頻識別過程,產生一組嵌入向量,其中含有和任務相關的有效動作,以及一些隨機行為,來體現真實世界中的各種可能狀態。隨後,使用Triplet loss誤差函數對以上向量數據進行處理。在同一幀的多視角觀察數據的基礎上,將多視角下同時出現的各幀圖像,在嵌入向量中互相關聯起來。
學習視頻由同一動作的多角度多部視頻組成
第二步
根據第一步對真人示範視頻識別產生的TCN嵌入向量,構建一套獎勵函數。機械臂起初會嘗試一些隨機動作,然後與獎勵函數進行反覆對比修正,進而產生並保留獲得最高獎勵的動作,最後達成重現視頻任務的效果。
據谷歌公司的研究人員稱,向量模型在僅僅經歷了9次迭代後就能成功收斂,即大約相當於需要15分鐘的訓練。例如在移碟任務中,機器人最初嘗試隨機運動,然後很快就學會了拿起和移動一個盤子。
內容整理自:科普中國
TAG:南京科普 |