當前位置:
首頁 > 動漫 > 陽光直播:馬斯克OpenAI!擊敗DOTA2頂級隊無問題!

陽光直播:馬斯克OpenAI!擊敗DOTA2頂級隊無問題!

1、完全信息博弈,如圍棋,

谷歌的初代阿爾法狗已經擊敗人類頂級選手,而升級版則完虐初代阿爾法狗。

意味著,人類已經完全不是對手。

2、不完全信息博弈,如DOTA2,

馬斯克的OpenAI在限定規則下,在單挑賽中擊敗人類頂級選手。

在5V5中已經超越90%的人類隊伍,但跟T18級別的人類頂級隊伍還有差距。

初期靠微操佔優勢,但大局觀、策略、創新性拖後腿,容易在中後期崩潰。

但如果不限制AI的操作速度,則反應速度比人類頂級選手高三倍,完虐人類頂級隊伍是可能的。

反過來,如果取消各種規則限制,則人類也有優勢。

總體上,可能是勝負參半。

2017 年,OpenAI 在 Dota2 TI 決賽現場以 1 對 1 solo 的方式擊敗了「Dota 2」世界頂級玩家。2017年8月,在1v1單挑中AI就已經戰勝了天才少年Arteezy、神級中單Sumail、TI冠軍Dendi。

人工智慧的一個里程碑就是在星際爭霸或者 Dota 這類複雜的電子遊戲中超越人類的水平。相比於上一個里程碑,即國際象棋與圍棋,複雜電子遊戲開始反映真實世界的混亂與連續的本質。因此我們希望,能夠解決複雜電子遊戲的系統可以成為通用的、在遊戲之外有廣闊應用場景的系統。而國際象棋和圍棋都是完全信息博弈。

OpenAI Five 的平均反應時間為 80 毫秒,比人類更快。

DOTA2:人工智慧5對5打DOTA:人類輸了 AI學習一天,是人類學習了180年。

它戰勝了天梯平均分4000的隊伍,5v5。

OpenAI Five與人類隊伍的三局兩勝的Dota2比賽中以2:1獲勝,對手的遊戲水平高於99.95%的玩家

在比賽開始之前,OpenAI Five預測自己只有2.9%的機會獲勝。儘管獲勝幾率很低,比賽還是照常進行了,而且OpenAI Five比賽中一度取得進展,預測勝率上升至17%,但最終OpenAI Five在35分47秒後輸掉了第三局。

對戰中國大神再次戰敗,OpenAI Five發文告別TI8

在限定條件下,5V5已經可以擊敗90%業餘選手,但與人類頂級選手還有差距。微操優勢,而策略、大局觀弱勢。

圈內普遍認為AI的反應確實很快,而且他們對血量的把握遠勝人類玩家,可以更好的掌握進退的時機。但這其實是一些low level的動作,AI在這方面做的比人類好毋庸置疑,但是因此贏得先機會讓人覺得賴皮。

這樣的打法在前期可以和人類抗衡,而且打的還算可以,但是到了中後期的明顯弱勢,說明了AI的全局觀還差很遠,在策略這種高層次的動作上,是還有很大的改進空間。

因此,OpenAI後期肯定要改進AI的高層次的策略和大局觀。以AlphaGo為例,它的搜索樹可以在下棋的時候搜的很深,也就是說可以看到當前局面後面的很多步的各種情況,OpenAI目前在這一點上顯然還不夠好,這也是由於遊戲的複雜度要遠遠高於圍棋。

訓練時間短。短的話,訓練的局數不夠,AI沒見過的局面多,很多情況會不知道怎麼辦,也就是說並沒有收斂。所謂收斂就是說ai的表現會趨於穩定,達到一個最優解或較優解。

可以回顧AlphaGo自己給自己下棋,他是見過了各種局面,才可以應對的比較好。像這種即時戰略遊戲,動作空間更大,所需要的訓練成本也會更高,這是比較顯然的」

比賽規則與昨日與第一場比賽的規則一樣,都是選擇範圍都限定在18個英雄中,並且兩隊所使用的人物都是機選,這樣就充分照顧到了英雄陣容的勝率問題。遊戲中的限制也和昨天的一樣,沒有聖劍,沒有分身和幻象,中單英雄不允許出魔瓶;沒有掃描;依然是一隻信使。

拿職業運動員和業餘運動員作類比,職業運動員相當於訓練了很久的AI(總體來說比賽結果相對穩定),業餘運動員相當於訓練了很短時間的AI(他可能在某一次比賽中結果不錯,但總體上來看比賽結果是不穩定的,時好時壞)。從另一個角度來說,訓練時間由短到長對應於:從偶然到必然。

AI是這樣思考的:無論多好的人類選手,在1秒之內你大概只能想4~5件事。比如對方紅血但已經回塔下了,那麼我該不該越塔強殺?如果越,我要用什麼技能?這個技能在不在CD?越塔殺了我能不能回來?如果不能回來我虧不虧?人類選手在1秒內可能會想這5件事,都想明白後得出結論,可以越塔,於是就上了。你不要看這裡寫好像簡單,實戰里能1秒想明白這5件事需要非常豐富的經驗,尤其是還要算對方技能CD、有沒有被秀被反殺的可能等等,不是那麼容易算得過來的。

AI就也用這種笨辦法,比如做一個判斷:如果對方英雄血量低於30%,啟動判斷一「要不要殺」;如果啟動判斷一那麼接判斷二「是不是越塔殺」;然後是判斷三「越的塔我要用什麼技能」……就這樣把遊戲分解成無數個既定判斷的流程去操作,靠AI強大的判斷力和飛快的計算力取勝。人類其實也是這麼思考的,我們稱之為「高手的意識」。

在過程中AI也經常被坑,因為DOTA里的臟招實在是很多,防不勝防。比如繞樹林陰影就是很常見的操作。但AI的好處就是你用過的招式它全都記下來並且學習,下次就會用來對付你,這真的十分可怕。

以往7屆比賽中沒有任何隊伍拿過2次冠軍,也沒有任何選手(在不同隊伍中)拿到過2次冠軍。這足以說明DOTA的打法眾多、戰術豐富、不存在某種穩贏不輸的體系。

電腦對手套路是固定的,做出的行為根本是變數的調動,只會做出人類所寫的操作。但 AI 是更靈活的,他會自己不斷的學習新的東西,還有可能產生人類不會的東西,反過來教導人類。

AI 每 4 幀會對遊戲作出反應,選擇什麼都不做或是移動、普攻、放技能、傳送、回城、治療等等行為。在不斷地訓練中,技能的施放點,或是移動的方位, AI 最終都會找到最優解。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 遊戲山炮 的精彩文章:

盤點文字冒險遊戲之進化:從AIR暴雨行屍走肉到超凡雙生!
《使命召喚手游》實機試玩!大量給力細節曝光!

TAG:遊戲山炮 |