當前位置:
首頁 > 最新 > 一天出道職業哥100次 OpenAI要做打遊戲界的AlphaGo

一天出道職業哥100次 OpenAI要做打遊戲界的AlphaGo

自從上一個轟動世界的AI擊敗人類事件已經過去了兩年多,人類頂尖棋手和AlphaGo的巔峰對決最終以人類完敗結尾,於是在一片「AI崛起,人類藥丸」的驚慌中,研究人員又開始牽引AI攻略下一個目標——遊戲。我們知道締造了AlphaGo的DeepMind正在想辦法攻克暴雪的RTS《星際爭霸2》,不過卻沒怎麼注意到還有馬斯克的OpenAI已能在用AI組隊擊敗MOBA《DOTA2》的高水平非職業玩家。

去年OpenAI完成的一件壯舉是在和Na』Vi戰隊的烏克蘭老司機Dendi中路1v1單挑中擊敗了後者,但《DOTA2》是5個人的遊戲,戰鬥打起來幾乎不可能只會是一對一,通常都會是四五人的合作戰鬥。為此,OpenAI在過去的一年裡進行了升級,現在它們已經能做到5個bot組隊和5名人類老手玩家組成的隊伍進行旗鼓相當的對抗。

OpenAI從0開始學習《DOTA2》的玩法,採用強化學習策略進行「練習」,掌握遊戲的機制和達成目標的手段,通過巨量的試錯和恐怖的計算力來實現暴力學習,通過設置相應的回饋函數,讓AI學習遊戲中哪些行為可以帶領己方走向勝利,然後就是日復一日的自我對戰學習。

注意,這裡的「日復一日」可不要按照我們的思維習慣來看待一天,因為OpenAI在一天內能打180年之久的有效遊戲時間,一個人類玩家要在《DOTA2》里打到職業水平通常都要花至少12000小時,對擁有暴力計算能力的OpenAI來說,它們可以在一天之內出道100次……

不過,雖然AI在操作精確度和反應速度上都遠勝人類,而且完全不會有心態因素影響,當前OpenAI也存在很多局限,例如它現在只會用一套陣容:狙擊手Carry,毒龍中單,瘟疫法師三號位,冰女和巫妖擔任輔助。然後它們的決策流程是寫死在代碼里的,缺乏變通,比如說出裝和技能天賦build都是一個套路,而且它們也無法應付隱形,召喚物,視野管控(插眼排眼)等技術。

但OpenAI的CTO堅持認為他們的AI相比以往已經是巨大的進步——還沒有哪個AI能協作完成一局時長近一小時的MOBA遊戲。同時他們也驗證了在這類遊戲AI中強化學習的可行性,缺的只是更強大的計算力。OpenAI的下一個目標是今年8月份在加拿大舉行的TI8,他們希望能在那時候能讓OpenAI組成的隊伍和世界頂尖強隊進行過招試煉。

從對《DOTA2》這款遊戲的理解上來看,就憑OpenAI現在的能力,我不看好本次對戰能夠勝出,但根據把一個人類玩家扔進4個OpenAI組成的隊伍中的體驗看,人類玩家表示被4個AI「帶得很舒服」,根據遊戲進行的時段,他想要什麼基本上AI就會幫他什麼。或許OpenAI未來的出路是技術陪練,但抹殺了「豬隊友」存在意義的AI,也許就會讓遊戲本身變得沒那麼有意思了……


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 愛活網 的精彩文章:

不聽音樂不降噪 Bose為什麼鐵了心要做睡眠耳塞?
頂級超跑和它們令人智熄的開門方式

TAG:愛活網 |