當前位置:
首頁 > 科技 > 資深玩家懟馬斯克:獲勝Bot僅掌握了Dota 2 的皮毛

資深玩家懟馬斯克:獲勝Bot僅掌握了Dota 2 的皮毛

整理 | 張震 、微胖

2016年11月,DeepMind 剛剛在一年一度的 Blizzcon 上宣布他們與著名遊戲公司暴雪達成了協議,在《星際爭霸》系列遊戲中進行合作,在遊戲平台中引入機器學習方法,進行人工智慧研究。DeepMind 科學家 Oriol Vinyals 說道(此人曾是西班牙頂尖的星際爭霸玩家),他們正像對待圍棋一樣認真對待《星際爭霸》,並決心以此作為機器智能研究的突破點。

暴雪的《星際爭霸》自從 1998 年發行以來,已經積累了大量的忠實粉絲。在第一個十年里就售出了 950 多萬冊的原版遊戲。2011 年發行的《星際爭霸 2》以 48 小時內售出 150 萬冊打破了即時戰略遊戲的銷售記錄。讓兩個玩家實時互相對壘,這種方式使《星際爭霸》成為首屈一指的專業視頻競賽遊戲。目前,仍然算是一個重要的世界級電競遊戲。

不過,在人工智慧可以擊敗世界冠軍的問題上,暴雪和 DeepMind 都對此持謹慎態度,都沒有給出一個確切的日期。但是,就在上周,OpenAI 機器人在單挑比賽中,大敗 Dota 2 世界頂級玩家。作為一個高調的商人,埃隆·馬斯克的推特賬號成了人們發表意見的場所,大家紛紛留言評論,一片喧嘩。

但是,內在叛逆的資深 Dota 玩家 Vlad Savov 無法苟同馬斯克的誇張言論。OpenAI 機器人的不俗表現讓任何 Dota 玩家感覺凜然,但在他看來,它僅僅觸及了這款複雜競技遊戲的皮毛。

馬斯克在推特上說,雖然人工智慧項目創造出了打敗世界級象棋手和圍棋手的計算機,但是,OpenAI 團隊的成就使之相形見絀。這款遊戲比傳統棋盤遊戲複雜多了。

Dota 確實是一款很複雜的遊戲。《星際爭霸》之所以一直被人工智慧研究者視為下一個目標,重要因素之一就是這一即時戰略遊戲(RTS)的環境複雜。另外,在同類遊戲中,平衡性也做得最好。此前,一些組織和機構發起過如 AIIDE StarCraft AI Competition 這樣的星際爭霸 AI 比賽。

有分析指出,在決策空間方面,相比圍棋只有一個落子動作,這款遊戲的決策空間相對非常複雜。在決策連續性方面,圍棋是一個典型的非同步競技遊戲,選手在做出每一個決策前具有充分的決策時間,典型馬爾科夫過程,但 Dota 2 選手需要動態做出實時決策。

DeepMind 認為,該遊戲相比國際象棋與圍棋更加接近「複雜的現實世界」。

但是,Vlad Savov 認為,馬斯克忽略了一個要點:OpenAI 的機器人玩的是一款複雜性大大降低的簡化版 Dota。

這款多人在線遊戲,類似籃球運動:五個玩家一組,有一個固定、對稱的場地,需要大量深度戰略和策略。遊戲中也有專門給予支持的玩家,就像控球後衛協助更加強大的隊友。這些助攻玩家有望將整個團隊帶向勝利,就像 NBA 得分較高的球星幫助球隊獲勝一樣。

現在,去掉團隊遊戲的所有複雜性,進行簡單一對一對決,這就是 OpenAI Dota 2 機器人的遊戲模式。雖然這仍然是個競技遊戲,但相對於團隊競技,複雜度已經大打折扣。

上周末,Dota 2 機器人的表現說明它基本上是頂級籃球比賽控球後衛。它只能扮演一個角色,但是遊戲角色有上百個,它也只能與相同的對手角色對抗。這位名叫 Shadow Fiend 的英雄角色,需要在準確的時機和位置才能發揮他的魔幻攻擊技能 Shadowraze。而且我們知道,遠超人類的機械精確性在計算機那裡,就是小菜一碟。而且,沒有一個職業玩家有時間進行賽前訓練,提前觀察或者理解機器人程序的博弈模式(與人類玩家對決之前,機器需要這麼做)。

Vlad Savov 注意到了所有這些弱點和缺陷,所以並沒有太多興奮。AI 進步是一個漸進的過程,而不是飛躍地一蹴而就。

雖然到目前為止,OpenAI 披露細節非常有限,但這並不妨礙一些專業人士的推斷分析。有分析人士猜測系統的決策空間和計算複雜度可能不如 AlphaGo,兩者並非同類進步。

OpenAI 表示,他們並未使用任何模仿學習(Imitation Learning)或者類似於 AlphaGo 的樹搜索技術,而是左右互搏的強化學習(reinforcement learning)。分析人士認為,OpenAI演算法可能涉及先驗知識與增強學習,以此獲得一個單挑能力很強的單個玩家系統。如果猜測正確,那麼,這次戰績遠沒有 AlphaGo 此前取得的成就來得困難,充其量等於訓練了一個類似 AlphaGo 落子器的應用。

「能玩《星際爭霸》的人工智慧必須能夠有效利用記憶,能夠進行長期戰略規劃,同時還得根據不斷出現的新情況做出反應調整。以這種標準開發的機器學習系統,最終完全可以應用到現實世界中的任務中去。」Vinyals說。

當然,比賽也有讓 Vlad Savov 感覺很興奮的地方。職業玩家 Danil「Dendi」Ishutin 和機器人程序 Shadow Fiend 對決,讓 Dota 玩家和科技發燒友們如痴如醉。

Dendi 是最著名玩家之一,也深受大家喜愛,他本身就特別會玩 Shadow Fiend 這個角色。結果,他在這個受歡迎的領域被 AI 打敗了。如果是資深玩家和 Dendi 對決,他感受到了殘酷無情,那麼,他可能會對其他選手做出同樣的事情,就像機器人對他做那樣。這個機器人引誘 Dendi 過度進攻,然後假裝 Shadowraze 攻擊,將其嚇跑。一次戰術至上的臨場發揮。

對於資深 Dota 玩家來說,這是人工智慧最生動的展示,絕非虛言。因為機器人可以自我學習。OpenAI 的開發人員讓其進入地圖,進行了為期兩周的高強度自我訓練,這就是它的「生命周期」——系統從蹣跚學步到被訓練成了一名冷血殺手,OpenAI 說。整個過程讓人覺得有點神奇,就像智力演化加速到我們真的可以察覺到的程度。

OpenAI 的 Shadow Fiend 知道如何迷惑敵手。它掌握了生命藥水(health potion)的機制。生命藥水在一段時間內可以讓英雄復活,它們就在這個復活期內攻擊敵手。此外,它也了解人類的伎倆,比如敵人會在地上放一個爆炸物迷惑對方。

不過,總的說來,Vlad Savov 認為自己見證的是安卓的 Dota 等價物在一對一比賽中擊敗了 Steph Curry, LeBron James 以及所有其他 NBA 球星。

機器人離開賽場時並無敗績。

但是,為 OpenAI 的表現歡呼的同時,這位資深玩家想告訴大家不要倉促下結論認為這是一款超人機器人。Vlad Savov 花了幾個月才整明白 Dota 2,更別說掌握這款遊戲了。遊戲的所有可能性加起來,比目前 AI 所能應對複雜度高出好幾個量級。如果 OpenAI 明年能夠兌現其雄心豪言,率領AI戰隊在正常(proper)Dota 比賽中戰勝世界頂級玩家,Vlad Savov 會非常高興,也願意和馬斯克一道奔走相告。但絕不是現在。

Facebook 和微軟的人工智慧研究者們都已發表過人工智慧在《星際爭霸》一代中進行遊戲的研究。一些玩《星際爭霸》的機器人已經被開發出來,但目前這樣的程序距離擊敗人類職業玩家還相去甚遠。

DeepMind 還沒有宣稱自己的程序已經能夠玩《星際爭霸》了。「要打敗人類職業選手,我們還有很長的路要走。」 Oriol Vinyals 說。

不過,對此也有不同聲音。微軟 CEO 薩提亞·納德拉對谷歌在人工智慧研究中注重遊戲的路線進行過抨擊,他曾在一次活動中告訴觀眾「微軟不會把錢花在讓人工智慧在遊戲中擊敗人類」,微軟希望把人工智慧「用在解決急迫的社會與經濟問題上去」。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之能 的精彩文章:

擬給士兵通電的美國軍方,正試圖讀取其大腦信號,增強其作戰能力
角逐人工智慧,中美製造誰勝出?
英偉達 CEO 黃仁勛談遊戲產業中的人工智慧—AI日報

TAG:機器之能 |

您可能感興趣

BitStarz:玩家在Book of Fortune中贏得了19.2 BTC 的獎金
Today Steam:壕玩家38萬買下CSGO皮膚 龍珠鬥士Z好玩到伺服器爆炸!
Chanel,Balenciaga...誰才是今年配飾界的頭號玩家?
《頭號玩家》和《貝茨旅館》里的女星奧利維亞·庫克 Olivia Cooke
Pivotal:從Cloud Foundry大佬到Kubernetes玩家
《幕後玩家》:A or B?
華碩玩家國度ROG Strix Z370-F Gaming主板 助你把把吃雞!
11款Baselworld精彩時計,藏家、玩家齊點評
時時科技-PS玩家看過來PlayStationAwards公布2017年獲獎作品
dnf團長拉個帕拉丁輔助,結果這玩家把boss全包了!
《頭號玩家》會有4位標誌性PlayStation角色登場
向90後玩家致敬——Beat Street
包包界的高級玩家,現在都玩起了背Double-Bag
Intel Optane 傲騰內存評測:大容量硬碟玩家的雞脆骨
資訊:萬代S.H.F 假面騎士Genm 動作玩家 Level 0
復古玩家的最愛!Nike Air Max2 Light 明年復刻回歸
有一種皮卡是玩家所愛,福特Ranger Wildtrak年內上市!
西班牙美少年Gehe Cosplay「頭號玩家」的Z 網友:以為是CG圖
「視頻」Windows 10 April 2018更新中哪些功能是面向玩家的?
Outlast II將讓玩家受苦 Red Barrels