當前位置:
首頁 > 最新 > 谷歌推出新技術,用視頻訓練機器人

谷歌推出新技術,用視頻訓練機器人

近期,谷歌公司的研究人員提出了一種訓練機器人的新方法,讓機器人僅僅通過觀看視頻,就能在無人監督的情況下,模擬視頻動作的全過程。目前該方法已經能成功應用於訓練機器人完成倒水、放置碗碟以及姿勢模仿等任務。

GIF

機器人可通過觀看視頻學習倒水

該方法被稱為「時間對比網路」,簡稱為TCN(Time-Contrastive Networks),主要分為兩步:

第一步

對需要模仿的動作錄製多角度的多部視頻,以時間作為參照系,讓機器人對同一動作不同角度的視頻進行分解鏡頭的識別。經過以上的視頻識別過程,產生一組嵌入向量,其中含有和任務相關的有效動作,以及一些隨機行為,來體現真實世界中的各種可能狀態。隨後,使用Triplet loss誤差函數對以上向量數據進行處理。在同一幀的多視角觀察數據的基礎上,將多視角下同時出現的各幀圖像,在嵌入向量中互相關聯起來。

學習視頻由同一動作的多角度多部視頻組成

第二步

根據第一步對真人示範視頻識別產生的TCN嵌入向量,構建一套獎勵函數。機械臂起初會嘗試一些隨機動作,然後與獎勵函數進行反覆對比修正,進而產生並保留獲得最高獎勵的動作,最後達成重現視頻任務的效果。

據谷歌公司的研究人員稱,向量模型在僅僅經歷了9次迭代後就能成功收斂,即大約相當於需要15分鐘的訓練。例如在移碟任務中,機器人最初嘗試隨機運動,然後很快就學會了拿起和移動一個盤子。

內容整理自:科普中國

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 南京科普 的精彩文章:

輪椅也炫酷,四輪摩托型輪椅你見過嗎?
周日節氣:立春

TAG:南京科普 |