當前位置:
首頁 > 科技 > AlphaStar對戰《星際爭霸 II》職業高手

AlphaStar對戰《星際爭霸 II》職業高手

在輾壓了圍棋界之後,DeepMind 團隊將目光放到了自由度更高的即時戰略遊戲,並且最近在忙著調校一個新的「AlphaStar」AI,來挑戰《星際爭霸II》的職業高手。在上月底連續兩組五局對戰中,AlphaStar 先全勝了 TLO,接著又在第二組對戰中全勝了 MaNa。唯有最後一場直播的對戰,才讓 MaNa 好歹為人類爭了一口氣,贏回唯一一場勝利。

不過,事情當然不像表面那麼簡單。 AlphaStar 相對於人類,其實是隱藏優勢的。這時候有在玩RTS 的讀者大概會猜是反應速度、或是手速,但其實都不是– AlphaStar 的「手速」(也就是每分鐘動作數)其實平均只有277 APM,比起星際職業選手的平均559 APM 要少了不止一點,再加上AI 從發現新狀況,到計算出合理的回應,中間大約要0.35 秒的時間,這也比一般職業高手差。在這部分,AlphaStar 完全是靠更有效率的操作,與更經濟的決策來彌補的。 AlphaStar 真正「作弊」之處,在於它可以同時看到整個地圖,當然戰爭迷霧還是存在,只是 AlphaStar 不像人類對手一樣,要一直不停地在地圖來回跳轉查看,自然也不容易被偷襲啦。

AlphaStar 的訓練和其他類似的AI 系統一樣,都是先由觀看無數的人類對戰視頻,來產生一個模型,再由這模型產生一大堆類似但不完全相同的「分身」,再讓這些分身下去對打,直到決勝出最厲害的五個AI「選手」為止。在一個月的虛擬對戰中,AlphaStar 的諸多分身份進行了等同於現實時間200 年的對戰時長,最後選出的五個代表每個都有不同的遊戲風格,並且是DeepMind 認為最有獲勝機會的。就是這五個代表被推上去與 TLO 和 MaNa 各對戰了一次(避免風格重複被看破手腳,同時 MaNa 面對的 AlphaStar 更有經驗一點),並取得了十戰全勝的成績。

至於最後一場呢?原來這是個「實驗版」的 AlphaStar,拿掉了上面提到的那個「隱藏優勢」,讓模型必需和人類一樣時不時地檢查一下地圖的各個角落,自然也就有錯漏重要信息的可能。雖然也有著一個禮拜的訓練時間,但 DeepMind 團隊未能讓它先與人類選手「切搓」一下,因此與 MaNa 在直播上的對戰是它與人類面對面的初戰,可惜輸給了對方。

當然,對我們一般人來說,就是真正具備高度挑戰性的遊戲AI 已經不再是個夢想,即使是即時戰略這樣沒有明確的勝敗因素、沒有完整的信息、而且需要長遠的概念的遊戲,AI 都有打敗人類的潛力了。有興趣的話 DeepMind 自己的博客上有AlphaStar 與兩位人類的對戰視頻,可以去看看AlphaStar 採取的各種奇怪的戰略啦。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 十輪網 的精彩文章:

半導體未來出路,從AI需求里找機會
由2萬個WordPress網站組成的殭屍網路正在殘害手足

TAG:十輪網 |