牛津大學研究展示：人類與AI合作對抗星際爭霸機器人

遊戲 05-11

查爾星港獨家整理報道，轉載請註明出處！

昨日，在「The AI Summit」人工智慧峰會倫敦微軟站的現場，牛津大學的機器人學習研究小組帶來了他們的成果展示：人類玩家與AI合作，在《星際爭霸》遊戲中共同對抗敵對勢力機器人。

展示分為兵種模式與經典模式，在兵種模式的展示中，玩家可控制一個神族龍騎士與一個狂熱者，AI控制的單位與玩家相同，而敵方機器人也控制著同數量的部隊。在過程中，AI控制的龍騎可以對玩家的走A路線進行最優化分析，從而幫助玩家進行共同集火與配合走位，當玩家的龍騎殘血後拉時，AI控制的狂熱者還可以對敵方的追擊龍騎進行卡位以及秒殘血。

而經典流程就是星際爭霸整套流程的採礦，建築，造兵，進攻，在期間你可以體會到AI化身「神隊友」的各種助攻。

牛津大學研究展示：人類與AI合作對抗星際爭霸機器人

該實驗是由懷特森研究實驗室與牛津工程部博士生的合作項目，他們將星際爭霸作為一個Multi-Agent系統①實驗平台，研究開發和測試多智能體分層強化學習②的新方法。本次項目是基於開源的平台TorchCraft③，它在星際爭霸與深度學習環境Torch之間架起了一道互動橋樑。

牛津大學本次展出成果後將計劃公布他們的代碼庫，同時將論文提交給NIPS④。與其他用星際爭霸來研究人工智慧的機構不同的是，牛津團隊將會把他們的研究方向著重放在分散執行上，這也就意味著，在遊戲中根據地形與局勢的不同，每個單位AI都會有自己獨立的思想、判斷再到最終的行動。目前，牛津團隊已經可以將項目轉移到微軟Azure上，這為他們擴大研究數量與範圍提供了保證。

牛津大學研究展示：人類與AI合作對抗星際爭霸機器人

許多現實世界的問題，如網路數據迴路和城市交通控制，這些都是多智能體分層強化學習（RL）的研究範圍。然而由於在星際爭霸中，Agent所處的環境變化規律較大，使得它不符合經驗回放⑤的兼容。然而本次牛津團隊解決了這個問題，在星際爭霸的兵種微觀單位實驗中，證實了經驗回放與多智能體系統強化學習（multi-agent RL）可以成功結合。

牛津大學研究展示：人類與AI合作對抗星際爭霸機器人

註解：

①Multi-Agent系統：是多個Agent組成的集合，其多個Agent成員之間相互協調，相互服務，共同完成一個任務。它的目標是將大而複雜的系統建設成小的、彼此互相通信和協調的，易於管理的系統。

②強化學習(Reinforcement learning)是機器學習中的一個領域，強調如何基於環境而行動，以取得最大化的預期利益。

③TorchCraft：這是一個能讓深度學習在即時戰略類遊戲（RTS）上進行研究的庫，比如星際爭霸 Brood War。通過從機器學習框架控制這些遊戲從而使玩遊戲變得更簡單。

④NIPS：神經信息處理系統大會(Conference and Workshop on Neural Information Processing Systems)，簡稱NIPS，是一個關於機器學習和計算神經科學的國際會議。

⑤經驗回放：反覆使用經驗的方法叫經驗回放，通過經驗回放，Agent可以記住過去的經驗並反覆提供學習演算法，從過去的策略中學習。目的可以一：加速學習過程；二：使Agent有有機會更新以前學過的東西。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 愛玩網 的精彩文章:

※《閃之軌跡3》發售日公布紅毛與巨炮少女回歸
※TI7唯一指定冠軍LGD？水友搞事修改百科資料
※尼爾國區漲價領銜遊戲圈十大作死事件
※《真三國無雙8》情報匯總全新開放世界割草體驗

TAG:愛玩網 |

您可能感興趣

※科學家研究：機器人奴役人類的前景
※牛津大學中國論壇關注「建設人類命運共同體」
※模仿人類行為自我編程 NVIDIA開發機器人學習技術
※AI視野：讓數據科學家做人類該做的事、人工智慧和機器學習對交易和投資的影響、人工智慧大幅降低機場行李處理費
※牛津大學人類未來研究所：萬字長文談AI新職場方向-政策研究
※文學人類學與國學研究現代轉型
※羅嘉陵：設計研究——來自人類學的啟示PART
※英偉達研發全新機器學習方案 AI自學能力逼近人類
※對人類思想產生巨大影響的科學發現（三）——牛頓力學：天地合一，機械唯物主義的誕生（二）
※人類是否能與外星人對抗？科學家表示隕石武器將成最大威脅
※人工智慧衝擊藝術領域：AI調戲人類還是人類調戲AI
※大美學之人類戰略學美學
※人類終將成為AI機器人的寵物
※你猜在人類學家和NASA研究員眼中有沒有黑科技？
※美科學家：CRISPR-Cas9技術對人類極具威脅，可產生大量非預期突變？
※外星人五大基本特徵科學家：外星人不會主動攻擊人類
※AI對人類的啟示
※英偉達新技術讓機器人觀察人類行為來學習
※PNAS：科學家發現新型豬病毒或對人類健康帶來潛在威脅
※全球圍觀中國「克隆猴」但科研人員不考慮對人類進行相關研究