資深玩家懟馬斯克：獲勝Bot僅掌握了Dota 2 的皮毛

科技 08-16

整理 | 張震、微胖

2016年11月，DeepMind 剛剛在一年一度的 Blizzcon 上宣布他們與著名遊戲公司暴雪達成了協議，在《星際爭霸》系列遊戲中進行合作，在遊戲平台中引入機器學習方法，進行人工智慧研究。DeepMind 科學家 Oriol Vinyals 說道（此人曾是西班牙頂尖的星際爭霸玩家），他們正像對待圍棋一樣認真對待《星際爭霸》，並決心以此作為機器智能研究的突破點。

暴雪的《星際爭霸》自從 1998 年發行以來，已經積累了大量的忠實粉絲。在第一個十年里就售出了 950 多萬冊的原版遊戲。2011 年發行的《星際爭霸 2》以 48 小時內售出 150 萬冊打破了即時戰略遊戲的銷售記錄。讓兩個玩家實時互相對壘，這種方式使《星際爭霸》成為首屈一指的專業視頻競賽遊戲。目前，仍然算是一個重要的世界級電競遊戲。

不過，在人工智慧可以擊敗世界冠軍的問題上，暴雪和 DeepMind 都對此持謹慎態度，都沒有給出一個確切的日期。但是，就在上周，OpenAI 機器人在單挑比賽中，大敗 Dota 2 世界頂級玩家。作為一個高調的商人，埃隆·馬斯克的推特賬號成了人們發表意見的場所，大家紛紛留言評論，一片喧嘩。

但是，內在叛逆的資深 Dota 玩家 Vlad Savov 無法苟同馬斯克的誇張言論。OpenAI 機器人的不俗表現讓任何 Dota 玩家感覺凜然，但在他看來，它僅僅觸及了這款複雜競技遊戲的皮毛。

馬斯克在推特上說，雖然人工智慧項目創造出了打敗世界級象棋手和圍棋手的計算機，但是，OpenAI 團隊的成就使之相形見絀。這款遊戲比傳統棋盤遊戲複雜多了。

Dota 確實是一款很複雜的遊戲。《星際爭霸》之所以一直被人工智慧研究者視為下一個目標，重要因素之一就是這一即時戰略遊戲（RTS）的環境複雜。另外，在同類遊戲中，平衡性也做得最好。此前，一些組織和機構發起過如 AIIDE StarCraft AI Competition 這樣的星際爭霸 AI 比賽。

有分析指出，在決策空間方面，相比圍棋只有一個落子動作，這款遊戲的決策空間相對非常複雜。在決策連續性方面，圍棋是一個典型的非同步競技遊戲，選手在做出每一個決策前具有充分的決策時間，典型馬爾科夫過程，但 Dota 2 選手需要動態做出實時決策。

DeepMind 認為，該遊戲相比國際象棋與圍棋更加接近「複雜的現實世界」。

但是，Vlad Savov 認為，馬斯克忽略了一個要點：OpenAI 的機器人玩的是一款複雜性大大降低的簡化版 Dota。

這款多人在線遊戲，類似籃球運動：五個玩家一組，有一個固定、對稱的場地，需要大量深度戰略和策略。遊戲中也有專門給予支持的玩家，就像控球後衛協助更加強大的隊友。這些助攻玩家有望將整個團隊帶向勝利，就像 NBA 得分較高的球星幫助球隊獲勝一樣。

現在，去掉團隊遊戲的所有複雜性，進行簡單一對一對決，這就是 OpenAI Dota 2 機器人的遊戲模式。雖然這仍然是個競技遊戲，但相對於團隊競技，複雜度已經大打折扣。

上周末，Dota 2 機器人的表現說明它基本上是頂級籃球比賽控球後衛。它只能扮演一個角色，但是遊戲角色有上百個，它也只能與相同的對手角色對抗。這位名叫 Shadow Fiend 的英雄角色，需要在準確的時機和位置才能發揮他的魔幻攻擊技能 Shadowraze。而且我們知道，遠超人類的機械精確性在計算機那裡，就是小菜一碟。而且，沒有一個職業玩家有時間進行賽前訓練，提前觀察或者理解機器人程序的博弈模式（與人類玩家對決之前，機器需要這麼做）。

Vlad Savov 注意到了所有這些弱點和缺陷，所以並沒有太多興奮。AI 進步是一個漸進的過程，而不是飛躍地一蹴而就。

雖然到目前為止，OpenAI 披露細節非常有限，但這並不妨礙一些專業人士的推斷分析。有分析人士猜測系統的決策空間和計算複雜度可能不如 AlphaGo，兩者並非同類進步。

OpenAI 表示，他們並未使用任何模仿學習（Imitation Learning）或者類似於 AlphaGo 的樹搜索技術，而是左右互搏的強化學習（reinforcement learning）。分析人士認為，OpenAI演算法可能涉及先驗知識與增強學習，以此獲得一個單挑能力很強的單個玩家系統。如果猜測正確，那麼，這次戰績遠沒有 AlphaGo 此前取得的成就來得困難，充其量等於訓練了一個類似 AlphaGo 落子器的應用。

「能玩《星際爭霸》的人工智慧必須能夠有效利用記憶，能夠進行長期戰略規劃，同時還得根據不斷出現的新情況做出反應調整。以這種標準開發的機器學習系統，最終完全可以應用到現實世界中的任務中去。」Vinyals說。

當然，比賽也有讓 Vlad Savov 感覺很興奮的地方。職業玩家 Danil「Dendi」Ishutin 和機器人程序 Shadow Fiend 對決，讓 Dota 玩家和科技發燒友們如痴如醉。

Dendi 是最著名玩家之一，也深受大家喜愛，他本身就特別會玩 Shadow Fiend 這個角色。結果，他在這個受歡迎的領域被 AI 打敗了。如果是資深玩家和 Dendi 對決，他感受到了殘酷無情，那麼，他可能會對其他選手做出同樣的事情，就像機器人對他做那樣。這個機器人引誘 Dendi 過度進攻，然後假裝 Shadowraze 攻擊，將其嚇跑。一次戰術至上的臨場發揮。

對於資深 Dota 玩家來說，這是人工智慧最生動的展示，絕非虛言。因為機器人可以自我學習。OpenAI 的開發人員讓其進入地圖，進行了為期兩周的高強度自我訓練，這就是它的「生命周期」——系統從蹣跚學步到被訓練成了一名冷血殺手，OpenAI 說。整個過程讓人覺得有點神奇，就像智力演化加速到我們真的可以察覺到的程度。

OpenAI 的 Shadow Fiend 知道如何迷惑敵手。它掌握了生命藥水（health potion）的機制。生命藥水在一段時間內可以讓英雄復活，它們就在這個復活期內攻擊敵手。此外，它也了解人類的伎倆，比如敵人會在地上放一個爆炸物迷惑對方。

不過，總的說來，Vlad Savov 認為自己見證的是安卓的 Dota 等價物在一對一比賽中擊敗了 Steph Curry, LeBron James 以及所有其他 NBA 球星。

機器人離開賽場時並無敗績。

但是，為 OpenAI 的表現歡呼的同時，這位資深玩家想告訴大家不要倉促下結論認為這是一款超人機器人。Vlad Savov 花了幾個月才整明白 Dota 2，更別說掌握這款遊戲了。遊戲的所有可能性加起來，比目前 AI 所能應對複雜度高出好幾個量級。如果 OpenAI 明年能夠兌現其雄心豪言，率領AI戰隊在正常（proper）Dota 比賽中戰勝世界頂級玩家，Vlad Savov 會非常高興，也願意和馬斯克一道奔走相告。但絕不是現在。

Facebook 和微軟的人工智慧研究者們都已發表過人工智慧在《星際爭霸》一代中進行遊戲的研究。一些玩《星際爭霸》的機器人已經被開發出來，但目前這樣的程序距離擊敗人類職業玩家還相去甚遠。

DeepMind 還沒有宣稱自己的程序已經能夠玩《星際爭霸》了。「要打敗人類職業選手，我們還有很長的路要走。」 Oriol Vinyals 說。

不過，對此也有不同聲音。微軟 CEO 薩提亞·納德拉對谷歌在人工智慧研究中注重遊戲的路線進行過抨擊，他曾在一次活動中告訴觀眾「微軟不會把錢花在讓人工智慧在遊戲中擊敗人類」，微軟希望把人工智慧「用在解決急迫的社會與經濟問題上去」。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 機器之能 的精彩文章:

※擬給士兵通電的美國軍方，正試圖讀取其大腦信號，增強其作戰能力
※角逐人工智慧，中美製造誰勝出？
※英偉達 CEO 黃仁勛談遊戲產業中的人工智慧—AI日報

TAG:機器之能 |

您可能感興趣

※BitStarz：玩家在Book of Fortune中贏得了19.2 BTC 的獎金
※Today Steam：壕玩家38萬買下CSGO皮膚龍珠鬥士Z好玩到伺服器爆炸！
※Chanel，Balenciaga...誰才是今年配飾界的頭號玩家？
※《頭號玩家》和《貝茨旅館》里的女星奧利維亞·庫克 Olivia Cooke
※Pivotal：從Cloud Foundry大佬到Kubernetes玩家
※《幕後玩家》：A or B？
※華碩玩家國度ROG Strix Z370-F Gaming主板助你把把吃雞！
※11款Baselworld精彩時計，藏家、玩家齊點評
※時時科技-PS玩家看過來PlayStationAwards公布2017年獲獎作品
※dnf團長拉個帕拉丁輔助，結果這玩家把boss全包了！
※《頭號玩家》會有4位標誌性PlayStation角色登場
※向90後玩家致敬——Beat Street
※包包界的高級玩家，現在都玩起了背Double-Bag
※Intel Optane 傲騰內存評測：大容量硬碟玩家的雞脆骨
※資訊：萬代S.H.F 假面騎士Genm 動作玩家 Level 0
※復古玩家的最愛！Nike Air Max2 Light 明年復刻回歸
※有一種皮卡是玩家所愛，福特Ranger Wildtrak年內上市！
※西班牙美少年Gehe Cosplay「頭號玩家」的Z 網友：以為是CG圖
※「視頻」Windows 10 April 2018更新中哪些功能是面向玩家的？
※Outlast II將讓玩家受苦 Red Barrels