當前位置:
首頁 > 新聞 > 一嘗被完虐的滋味過後,不妨想一想為什麼要發展遊戲 AI?

一嘗被完虐的滋味過後,不妨想一想為什麼要發展遊戲 AI?

MaNa 是一名星際爭霸 2 的王牌選手,但他在今年一月份的一場比賽中,只堅持了五分多鐘,就在屏幕中打出了「GG」二字。

MaNa 在這場比賽中所面對的並非什麼橫空出世的天才選手,而是在圍棋界橫掃了所有人類選手的 AlphaGo 的兄弟 AlphaStar。

在這一系列的人機大戰當中,AlphaStar 也以總比分 10:1 的戰績擊敗了 MaNa、TLO 兩位知名的人類選手。

圖片來自:YouTube

而現在,普通玩家也可以和 AlphaStar 過招了。就在昨天,星際爭霸官當宣布,AlphaStar 將會以匿名的身份加入歐服的的天梯賽,與普通玩家進行較量。

相比起一月時候的 AlphaStar,現在加入到天梯賽的 AlphaStar 有了不少改變,當中有加強的部分,也有削弱的部分。

首先加強的部分是對於種族的掌握更全面了。一月份時候的 AlphaStar 只會玩神族,雖然在神族的對決中它已經擊敗了神族排名前十的 MaNa,但是要成為一名更全面的玩家,只會玩一個種族顯然還是不夠的,所以新的 AlphaStar 將會解鎖所有種族。

除了掌握全種族外,AlphaStar 也將能夠掌握更多不同的地圖,這也是 AlphaStar 進化的第二點。

至於削弱的部分,就是 AlphaStar 的手速。在職業電競中,有一個關於操作很重要的指標,就是 APM(每分鐘操作次數),簡單來講就是手速。APM 越高,代表手速越快。

對於人類來說,頂尖選手的 APM 一般能夠維持在四百左右,最極限的狀態下,會有極短的一瞬間能飆升到八百左右,而且當中還包含大量的無效操作

但在一月份的比賽中,AlphaStar 就一度被錄得了 APM 超過一千五的操作,而且持續了整整五秒時間,當中絕大部分也都還是有效操作,沒有半點失誤。

圖片來自:YouTube

這也被認為是 AlphaStar 之所以能夠大比分戰勝人類職業選手的一個關鍵因素。於是到了天梯賽當中,AlphaStar 的 APM 將被會被限制,所以操作上將會與人類玩家回到同一起跑線上。

目前,AlphaStar 已經上線最新版本的歐服,玩家只要在進入遊戲前勾選「同意與 AI 進行匹配」就有一定的幾率匹配到 AlphaStar。

當然了,為了不被針對,同時也為了讓 AlphaStar 進行最接近人類的對戰環境,AlphaStar 將會進行匿名,這也就是說人類玩家將很難從 ID 中去識別對方究竟是人還是 AI。

至於能否從操作或者戰略中識別出來?估計也很難。職業玩家 TLO 在今年一月份與 AlphaStar 交手的時候曾經表示,在與它多局的交手中,AlphaStar 無論是戰略風格還是操作習慣都各不相同,難以捉摸,感覺就像是在和不同的人比賽一樣。

實際上 TLO 猜對了,因為 DeepMind 確實不僅僅做了一個 AlphaStar 出來,而是做了多個風格各異的 AlphaStar 來與他們進行交戰。而在歐服的天梯賽當中,普通玩家與 TLO 一樣,面對的是一整支隊伍。

通過與自己的副本不斷對決,相互淘汰的方式,產出風格不同的 AI 選手. 圖片來自:YouTube

讓 AI 學會玩遊戲,並非只想自虐

大家對 AI 學玩遊戲這件事的最初認識,應該是在 AlphaGo 打敗李世石後,DeepMind 在暴雪嘉年華中宣布將會與暴雪合作,共同研發星際爭霸 2 遊戲 AI。

但實際上,人們早在 2003 年,就開始嘗讓 AI 接觸即時戰略類遊戲。當時人工智慧研究學家 Michael Buro 以及 Timothy Furtak 發表論文稱,即時戰略類遊戲,是測試 AI 性能的一個很好的平台,並提議開發一個開源的即時戰略遊戲引擎供 AI 研究使用。

而且除了 DeepMind 以外,不少人工智慧公司如 OenAI、騰訊 AI Lab 等都在致力於研究即時戰略類遊戲 AI。

圖片來自:YouTube

那到底為什麼人類如此執著於讓 AI 在即時戰略類遊戲中虐待自己?

這不妨從即使戰略類遊戲的特性說起。

與圍棋不一樣,即使戰略類遊戲,是一種「不完美信息博弈」。

在博弈論中,當參與者在做選擇的時候並不知道其他參與者的選擇時,這種博弈就稱為不完美信息博弈。

由於戰爭迷霧(指對戰雙方都無法完全掌握對方實時的操作和狀態)的存在,AI 所做的每一步選擇所帶來的效果和收益都無法馬上呈現。

這就要求 AI 不僅要以殘缺的信息去對形勢進行判斷,還要在面對很多始料未及的突髮狀況時對決策作出調整。

另外,這種策略類遊戲還要求 AI 在遊戲中除了需要進行包括運營、兵種搭配、操作等正面對抗外,還需要做到隱瞞以及欺騙。

而後兩者,也是人類的高級心理活動。

但讓人感到驚訝的是,AlphaStar 不僅在操作和運營上達到相當高的水平,在隱瞞和欺騙上同樣做得相當出色。

人機大戰的比賽現場. 圖片來自:YouTube

當然,發展即時戰略類遊戲 AI 並非需要讓 AI 來欺騙大家,所有團隊的最終目的都是一樣的,就是通過即時戰略類遊戲 AI 最終發展成通用型人工智慧。

所謂的通用型人工智慧,簡單來說就是可以做任何事情的人工智慧。目前絕大多數人工智慧,都是功能型人工智慧,即功能單一。而要發展通用型人工智慧,能看、能聽、能說還遠遠不夠,最關鍵的還是需要像人腦一樣,在面對複雜的環境下能夠做出最優決策的能力。

而訓練 AI 在未知的情況下進行規劃、在突發的時候進行決策、在決策的過後又能進行實時的調整,即時戰略類遊戲,將會是通用型 AI 一個很好的訓練場。

正如 DeepMind CEO Demis Hassabis 所說:

之所以 DeepMind 會選擇挑戰星際爭霸 2,是因為即時戰略類遊戲需要一種在不能完全獲取信息的條件下作出高水平決策的能力,這也是目前 AI 想要解決現實問題所需要的一種關鍵能力。

題圖來自:Raconteur

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 愛范兒 的精彩文章:

iOS 13 公測版體驗:16 大功能更新,今天就能直接升級
這個神奇的網站,可一次過實現你所有設計噩夢

TAG:愛范兒 |