美國陸軍軍事學院重磅發布「第三次抵消」戰略報告，劍指人工智慧

科技 11-07

原文來源：U.S. ARMY WAR COLLEGE

作者：Strategic Studies Institute

「雷克世界」編譯：嗯~阿童木呀

近日，美國陸軍軍事學院（U.S. Army War College）旗下的戰略研究智庫Strategic Studies Institute（SSI）出版了一本名為《比你想得更近：美軍第三次抵消的戰略意義》（CLOSER THAN YOU THINK: The Implications of the Third Offset Strategy for the U.S. Army）的重磅報告。

其中，報告大部分內容均圍繞人工智慧以及相關應用闡述對美國軍事的戰略意義。雷克世界挑選重點內容編譯如下，感興趣的讀者可以在文末下載全文報告。

第三章精選：圍棋與人工智慧：戰略決策的潛力

相信大家都知道，圍棋（Go）是世界上最古老的棋盤遊戲。在一個19x19線的方格遊戲棋盤上，兩名玩家各執白色棋子或黑色棋子，輪番落子。將對方的棋子包圍起來，就能夠將這些棋子繳獲。在遊戲結束時，在棋盤上包圍的空間最多且被繳獲棋子數目最少的一方玩家獲勝。其實，可以這樣說，圍棋的總體目標是掌握主動權，在戳中對手弱點的同時最大限度地發揮自己的優勢，從而實現戰略和戰術上的包圍，而不足之處就是導致了一個穩定和平衡的局面。

雖然看起來很簡單，但實際上圍棋是相當複雜的。它是一個涵蓋主動性、策略性、平衡性以及人類想要控制棋盤地理位置的意志衝突性遊戲。圍棋，本質上來說就是一個具有2500年歷史的「抽象戰爭模擬」。因此，一些著名的政治思想家認為，圍棋是理解地緣政治和戰略的可行性模式。然而，很少有人知道該如何將其應用於自己的決策中。他們可以把圍棋看成是具有說明性的、內容豐富的、甚至讓人大開眼界的事物，但卻無法或是不願意採取下一步措施，學習圍棋所教授的知識，以便將其應用於自己的戰略思維中。將人類和計算機化的人工智慧（AI）結合起來是一個潛在的解決方案，它可以使人類在不需要經驗或深入研究的情況下，就像專家一樣，在圍棋或類似的決策過程中充當專家。而最近在AI領域所取得的進展在不斷表明，現如今，這些是可能實現的。

在2016年，一個計算機程序成功地擊敗了兩名世界上最好的圍棋選手，引起人們的極大關關注，而這個程序就是AlphaGo，該程序是由谷歌旗下的人工智慧研究公司Deepmind的計算機科學家編寫的。是的，AlphaGo做到了這一點，但這並不是通過預先編程的遊戲專家知識，而是通過從專家玩家對弈的遊戲中進行學習，並不斷通過自我對弈以實現能力的自我提高。這是一種既具有革命性又意義深遠的做法。雖然人工智慧在很多地方都能夠發揮作用，但是它在圍棋這種古老的戰略遊戲中的應用表明了它是如何幫助改善外交和安全策略決策的。把圍棋的戰略經驗與人工智慧結合起來，可以使這些檢驗更加廣泛地得以應用該，並在不需要文化背景或遊戲專業技能的情況下提高決策能力。而這將使人類決策者能夠更加專註於自己的長處並克服其認知上的弱點。通過創建一個基於圍棋框架的世界模型，像AlphaGo這樣的AI演算法就可以成為那個世界的專家，理解一個給定的情況，然後在很多可能的行動方針（COA）中展望未來，以幫助人類決策者確定哪一個下一步行動將能夠最好地實現其目標。通過與人類決策者合作，進行更快、更深入、更準確地思考，這種類型的人工智慧可以為那些最願意使用它的人提供決定性的戰略優勢。

人機協同決策

莫拉維克悖論（Moravec』s Paradox）指出，人類毫不費力就可以做成的事情，對於計算機來說是非常困難的。尤其是在運動技能、視覺或音頻識別等基本任務更是如此。其實，這個說法反過來也是正確的，特別是在涉及到人類的認知思維的時候。一個複雜的戰略環境可能會很（太）難讓人類的頭腦進行準確的處理。因為在一個情況中，可能會有太多的信息、太多的複雜性以及太多的變化。而這些卻正是戰略決策者所必須操作的確切環境。在這種情況下，他們承擔不起犯錯所帶來的後果，也不能屈服於人類決策這個所固有的弱點。而這正是人機合作所能完善的地方。將AI計算機思維與人類思維結合在一起、將人類的優勢與AI的優勢結合起來，從而彌補兩者之間的弱點。

其中，人工智慧可能會遇到的難題是，當它遇到超出其學習經驗或模型的情況時，除了資料庫或固有編程之外，它可能很難進行創造性地思考。與此同時，它可能也無法進行倫理思考，特別是在最具倫理性的解決方案可能不是最高效或最有效的解決方案的情況下。另外，AI需要制定一個為之奮鬥的目標（AI不是做白日夢）。這正是人機協作的人性化部分。在這種人機合作的模式中，人類將提供目標、創造力和倫理思維，而人工智慧將提供自學得來的經驗、直覺和預測能力。一個匯聚了這些元素的演算法就是實現突破的關鍵，而正是這些使得AlphaGo超出了世界上最好的圍棋選手。

覆蓋在歐洲和中東地圖上的圍棋遊戲

左邊的地圖顯示了一個基於歐洲和中東的相對影響的概念圖構建的位置。白色代表美國和北大西洋公約組織（NATO），黑色代表俄羅斯和俄羅斯的盟友。右側的地圖顯示了一個相對簡單的圍棋計算機程序操作的結果，它比AlphaGo要簡單得多，通過計算機自我對弈來放置黑白位置。雖然這個非常基本的圍棋模型有一些局限性，但是通過在中東、北非和北歐運用額外的影響力活動，計算機自我對弈確實意味著對俄羅斯的戰略有利。它還強調，美國和北約應該在整個歐洲和中東加強自己的影響力。這個簡單的實驗說明了圍棋作為在戰略環境中理解和做出決策的基礎和適用性。

通過人工智慧進行的戰略決策

像AlphaGo一樣，一個決策AI工具將由三種思維組成。第一種是經驗思維，它是基於一個經由人類戰略家的經驗、學說和範例進行訓練的人工神經網路得到的，能夠識別特定領域內的專家動作。其次是一個直覺思維，它是基於相關遊戲模型，由一個經由強化學習訓練的人工神經網路建立的，能夠使用一個獎勵函數，根據人類指定的目的或目標，從失敗的情況中分辨出獲勝的位置。而第三則是預測思維，它將利用經驗和直覺思維來縮小可能的選項，預測多種可能的未來事件序列，並提出建議，從而實現既定的目標。

可以說，前兩個思維永遠是處於學習狀態的。經驗思維將接收信息、情報和其他相關信息的持續更新；直覺思維將不斷地通過強化學習自我對弈以及獎勵標準來進行改進，其中，獎勵標準能夠隨著目標的改變而更新；而預測思維將繼續運行模擬，並隨著情況的發展更新成功的可能性。它將不斷地對決策樹進行擴展，以涵蓋更多可能的操作，並提高先前評估逼真度。其實，這就和人類的戰略決策一樣，總體的概念就是一個持續進行的評估和改進的循環。

建議

作為第三抵消戰略（Third Offset Strategy）的一部分，國防部（the Depart-ment of Defense，DoD）應該資助相關研究和開發工作，這將使得AI支持的人機協同成為戰略決策的一部分。另外還要努力嘗試將人工智慧集成到各個階層的決策過程中。這些努力應該是循序漸進的、在嘗試更為複雜的方法之前想要展示其基本能力。

國防部和軍隊應該開始進行快速的原型設計，以確定AI的哪些方面能夠取得最短期的成功。他們應該資助程序員、戰略專家和軍事專家小組，以探索這種AI輔助決策方法的可能性。對人機協作過程的研究應該確定集成、訓練和擴展這些AI工具的最佳方式。使用這些人工智慧工具的組織應該應用變更管理原則，以將其納入到它們的過程和文化中。

人工智慧的真正力量將在於把人腦與人工智慧的結合過程。這種人機協作將把目標設定、創造力和道德思考的人類優勢與通過自學的經驗、直覺和深度預測得到的人工智慧的理性思考結合起來。一個通過自學AI將人機協作涵蓋在內的決策過程將克服人類決策中所固有的弱點，並為那些使用它的人提供獨特和決定性的優勢，而這些是那些不使用它的人所不具備的。這可以用來創建一個實時的預測COP，它可以為決策者提供下一步的最佳行動，同時預測對手的下一步動向。它可以幫助各級戰略家迅速制定行動計劃，並隨著事實的變化迅速更新這些計劃。最終，通過與人類決策者一起進行更快速、更深入、更準確的思考，這種類型的AI將為那些最願意使用它的人提供決定性的戰略優勢。

第七章精選：將人工智慧（AI）集成到軍事行動中：博伊德周期框架

長期以來，美軍在實施新興革命技術方面一直處於領先地位。日益增長的自動駕駛汽車的使用就是一個很明顯的例子。這些系統為美軍提供了前所未有的態勢感知（situational awareness）和作戰能力。然而，有跡象表明，這些成熟的IT技術的採用尚未充分發揮其潛力。目前，自相矛盾的是，這些自動系統的使用廣泛地依賴於用人力資本來對其進行維護，並對其產生的數據進行處理。

隨著信息時代的日益成熟，處理和提煉信息的能力可能成為其新的界定特徵。將信息收集、通信、存儲和處理完全集成到及時而果斷的行動中的能力，可能會產生新的技術和概念上的優勢。而當這些技術體現在人工智慧和自主系統發展中時，就可能會累積起來形成所謂的第三抵消（Third Offset）。然而，實現第三抵消（Third Offset）並不是必然的結果。

如果想要利用人工智慧和自動系統的優勢，這將需要更充分地集成到決策過程（循環）中，並增強對其在沒有人工干預的情況下採取行動的能力的信任。為了檢驗它們在決策循環中的集成，博伊德循環（Boyd loop）可謂是探索AI系統的理想工具，博伊德循環相對簡單，也被稱為觀察、定向、決定和行動（OODA）循環。其直觀的四個步驟易於理解，並與人工智慧的前四個主要元素——感知、理解、預測和操作（以及學習）緊密結合。OODA循環提供了一個清晰而明顯的框架，以探索在競爭的軍事環境中集成人工智慧系統的意義。

結論

在文中，我們探討了AI系統是如何執行四個主要功能的：感知、理解、預測（和選擇）和操作（行動）。然後對在OODA決策循環中對這些功能進行檢查。OODA循環包含四個主要步驟：觀察、定向、決定和行動，與AI系統的上述四個要素緊密結合，並提供了一種未來人工智慧系統在軍事行動中應用的方法。

通過這個視角，我們可以發現，未來人工智慧系統的集成有可能滲透到整個軍事行動中。在這項研究中發現的關鍵問題涉及開發AI系統和應用程序的清晰類別的潛在需求。與此同時，這項研究也為未來的軍事行動中人工智慧系統的集成建立了一個連貫的框架。

報告PDF下載鏈接：http://ssi.armywarcollege.edu/pubs/download.cfm?q=1371

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 雷克世界 的精彩文章:

TAG:雷克世界 |