圍觀!相撲機器人被強制對打10億次之後,結果驚艷了
如今,機器人究竟發展到什麼程度了?
你想像中的機器人也許是這樣的!
或者是這樣的:
GIF/1K
GIF/2K
而現實中卻是這樣的!
GIF/2K
GIF/1K
甚至這樣的:
GIF/2K
由圖可見,如何讓機器人變得更加靈活敏捷,這一問題仍然是機器人技術發展過程中的重中之重!
GIF/2K
這張動圖並沒啥驚艷之處?
No,no,no...這款發佈於本周三的相撲機器人遊戲大有玄機,它有機會讓人工智慧軟體變得更智能!
如何讓人工智慧軟體更智能?
在這款相撲機器人(RoboSumo)遊戲中,控制這些機器人在虛擬世界中打架的是機器學習軟體,而不是人類。與那些經典電子遊戲中的電腦角色不同,人類沒有預先為它們設定好相撲程序;相反,它們必須通過反覆試驗來「學習」這項運動。
這款遊戲由埃隆·馬斯克(Elon Musk)創立的非營利研究實驗室OpenAI開發,旨在展示強制人工智慧系統比賽會如何使它們變得更智能。
OpenAI的研究員伊戈爾·莫德奇(IgorMordatch)說,隨著對手創造出複雜的、不斷變化的條件,人工智慧系統所面臨的條件也變得更加複雜,這就創造了一種智能的軍備競賽。這可能會幫助學習軟體掌握一些技巧,讓其能夠更易控制機器人以及完成現實生活中的任務。
在OpenAI的實驗中,簡單的仿人機器人剛進入競技場時,甚至都不知道如何走路。它們通過反覆試驗可以不斷學習,而它們的目標是學會移動以及擊敗對手。
在進行了大約10億次試驗之後,這些機器人制定了一些策略,比如蹲下來讓自己更平穩,並誘騙對手出局。研究人員開發出新的學習演算法,這樣玩家就能夠在比賽中調整自己的策略,甚至預測對手何時會改變戰術。
人工智慧研究人員正在試圖克服機器學習軟體的局限性,這種軟體可以通過處理大量標記的示例數據來獲得新的技能,而OpenAI的項目僅僅是其中的一個例子。這種方法推動了翻譯、語音和面部識別等領域的研究進展。但對於更複雜的技術來說,這種方法就不實際了,比如說控制家用機器人。
強化學習也許是通往更高明的人工智慧的一個可行途徑,軟體可以通過強化學習反覆試驗來實現某個特定目標。現在,這項技術已經用來讓軟體解決更複雜的問題,比如讓機器人拿起物體。
OpenAI的研究人員認為,這種競賽方式往往帶有額外的複雜性,這與讓強化學習軟體解決更複雜的問題相比,能夠讓軟體進步更快。
研究人員還在類蜘蛛機器人上測試了這一想法,甚至在其他遊戲中進行了測試,如點球大戰。截止目前,OpenAI已經發布了兩份有關人工智慧競賽代理的研究論文,並為一些專業玩家公布了機器人相撲(RoboSumo)以及其他一些遊戲的代碼。
相撲遊戲可能並不是智能機器能為我們做的最重要的事情。但OpenAI的一些實驗表明,在虛擬競技場中學習的技能也可以應用到其他場景。當仿人機器人處於一個帶有強風的虛擬世界中時,它會努力讓身體保持直立。這表明它已經學會了以一種廣義的方式來控制它的身體平衡。
要想將虛擬世界中的技能運用到現實世界,是一個完全不同的挑戰。德克薩斯大學奧斯汀分校(University of Texas)的教授彼得·斯通(Peter Stone)說,在虛擬環境中起作用的控制系統通常在現實機器人上不會起作用——這是一個被稱為「現實差距」的仍待解決的問題。
與此同時,機器人專家麥多奇(Mordatch)想要他的虛擬的仿人機器人不只是競賽。他正在考慮讓仿人機器人參加足球比賽,這樣它們不僅要競爭,也必須合作。
想看十月份國內最熱人工智慧大會?
點擊這裡!


※11位科技大咖談人工智慧:當今AI研究的關注點是什麼?
※網路安全:人工智慧產生了什麼「化學反應」?
TAG:AI腦力波 |