當前位置:
首頁 > 天下 > 假如戰爭明天爆發:歷史學能夠預測到嗎 |大象文摘

假如戰爭明天爆發:歷史學能夠預測到嗎 |大象文摘

原標題:假如戰爭明天爆發:歷史學能夠預測到嗎 |大象文摘


文章來源:錢超峰|量化歷史研究(ID:QuantitativeHistory)


蘇聯歌曲《假如明天戰爭爆發》海報,創作於1938年


(圖片來源於網路)


這是一個晴朗的早晨,但是這世界並不安寧,誰都不敢說明天會發生什麼。當被詢問學歷史有什麼用時,幾乎每個歷史系學生都會拋出那個經典的信條,「讀史可以明智、鑒往可以知來」。但是,假如戰爭明天爆發,歷史學真的能夠成功預測嗎?


在中國的網路或者現實生活中,一直流傳著這樣一個傳言,看每天新聞聯播能夠預測明日的股市。這不是無稽之談。新聞聯播中提到的很多要聞或者政策都會影響投資者的情緒和信息,甚至在2015年某證券機構還提出了新聞聯播信心指數,據稱還成功預警了多次股市暴跌。新聞聯播報道的往往只是剛剛過去的事情,那如果以更為廣泛的歷史資料為基礎獲取更充分的信息,豈不是能夠預測的更準確更長遠。戰爭或者說武裝衝突無疑是最重大的歷史事件,如果說歷史學真的能預測未來,那麼在這個耗費了最多心血的核心問題上應該有所突破。

大量來自不同社會科學領域的學者都致力於研究一個人類很重要的問題:什麼是戰爭根源?不少人基於長時段的歷史數據,揭示了經濟狀況、自然災害、社會矛盾等方面對於衝突爆發的影響。但是,這些研究主要是在總結歷史經驗教訓的階段,預測未來戰爭這種「為王者師」的事尚處於一個方興未艾的狀態。最近,Muelle和Rauh發表在American Political Science Review的論文,「Reading Between the Lines: Prediction of Political Violence Using Newspaper Text」,嘗試利用機器學習的方法,基於歷史文本,預測軍事衝突在何時哪國發生。


主題模型的原理簡單地來說即是,一方面,一個詞在不同的主題背景下出現的概率不同,另一方面,在不同的主題背景下存在不同的高頻辭彙。因此通過一系列詞的概率分布可以得到一篇文章的所屬主題概率分布。如果是報道特定國家的一系列文章的話,就可以得到該國在輿論報道中的主題分布。



圖1 主題模型


作者收集了新聞資料庫中三家西方主流媒體(《紐約時報》、《華盛頓郵報》、《經濟學人》)自1975年到2013年的全部文章,並且將約70萬篇新聞報道與185個國家一一匹配,假設在t年底存在一個某國領導人,他能夠了解到75年至t年對本國的全部新聞報道的主題分布和這些年中的一些自然社會狀況(來自作者和前人整理收集的其他資料庫),並且他知道過去哪幾年是有衝突哪幾年是和平的,由此這個領導人審時度勢,對明年乃至於到t+n年的局勢做出預判。

前面1975年到t年的數據就是訓練集,而未來的情況就是來評價預測結果的測試集。機器通過訓練集模擬這個領導人對過去這些信息進行訓練學習,學習的結果即預測模型再來對測試集進行預測,最後將預測的與實際的結果比對,來分析基於主題模型的機器學習是否成功。



圖2 新聞文本數據


利用新聞文本來預測政治事件這個構想本身並不令人驚奇,因為在互聯網出現之前,最重要的情報來源即是大眾傳媒,特別是對於那些較為封閉的國家而言。提取主題模型,然後再根據主題模型在某國的分布與比例來訓練機器,進行對未來該國是否穩定的預測,相當於模擬過去情報專家或者分析員對一國未來局勢進行判斷。作者認為其除了數據的廣度和精度有了進步之外,最大的貢獻是給預測模型增加了國家固定效應,從而儘可能避免了以前的工作最後結果往往出現的「亂國恆亂」,而對長期安定而突然發生動亂的國家難以做出及時預警的情況,就像2011年,幾乎沒有中東問題專家能夠預測「阿拉伯之春」的發生。也就是說,作者不僅是想要知道哪個國家會發生衝突,也想確定如果是這個國家的話,戰爭將何時爆發。


與常見的回歸模型追求的最大擬合不同,對於一個機器學習模型而言,它需要儘可能準確地預判某個情況,減少錯誤的判斷,又要在保證準確率的同時減少疏漏。簡單地來說就是要做又全又準的判斷。但是往往這很難做到兩全其美,所以常常以兩個指標得到的散點曲線(ROC)所覆蓋的AUC面積作為一個綜合考量。模型總體上是較為成功的,在真陽性率(確診率/召回率)0.8的情況下大致能夠做到假陽性率(誤診率)0.2,並且如果是預測未來的內戰衝突的話會比其他戰爭更有效一些,同樣召回率下有更低的誤診率,AUC也更高。


圖3 預測結果(真陽性率-假陽性率)


作者百般考慮的國家固定效應,在加入到預測後也確實幫助模型更優化。而其他學者提出的諸如氣候、政治制度、經濟狀況等等會影響戰爭爆發,作者也分別進行了預測,結果發現基於主題分布得到的模型預測結果會優於其他。特別是如果加入國家固定效應後,其他幾類模型會相比主題模型的預測結果遜色不少。這些工作也經得住穩健性檢驗,作者改變主題模型的參數或者改變預測的對象等,結果依然成立。總體而言,經過作者完善的模型,能讓我們有信心在允許判斷出現20%失誤的前提下,對80%的動亂成功做出預警。


那麼,作者得到的模型能夠預測到「阿拉伯之春」嗎?這恐怕還有很長的一段路要走。如果僅以過去享受持續性和平的國家作為樣本,讓模型來預警長期穩定的國家爆發的突發性衝突,因為對於這些國家而言,戰爭更是特例中的特例,所以即使是較低的假陽性率(誤診率)下為了有較高的召回率(大於0.6),它的精度也只有0.1左右;也就是說,如果讓這個預警機制真正起作用的話,它發出的10次警報可能有9次都是「狼來了」。儘管如此,十分之一的概率對於戰爭衝突如此生死攸關的事情來說依然是有意義的。畢竟虛驚一場總好過大難臨頭不自知。


圖4 預測結果(精率-真陽性率)


接著,作者考察了預測模型的決策機制,也就是哪些主題能夠讓機器更傾向於作出預警的判斷。因為存在有15個主題模型,作者使用了LASSO回歸,以調整不同回歸損失「懲罰」力度下的主題變數選擇。從不同的結果看,一個國家的輿論報道中有關於衝突本身主題的比例越大,其爆發動亂的可能性越大,而關於經濟、法治的報道越多,該國也越能夠維持穩定。如果將這些經濟、(正面的)法治等軟性報道單獨拿出來去預測衝突,結果也比較不錯。作者還發現,有關法治的報道在衝突前一年會顯著地減少,而在衝突之後幾年再次回歸穩定後顯著增加。


當然,這些發現都不同於之前研究中的因果聯繫,都是相關性層面上的。比方說很難迴避其中的互為因果問題,主流媒體報道會影響西方國家決策,而其國家意志反過來又影響媒體報道的立場等等。但是無論如何,從追求預測的角度,相關性的發現也不應該過多地求全責備。



圖5 LASSO回歸結果


當那一天真的來臨,我們能夠根據過去的歷史文本成功預警嗎?從何地的角度講,很多模型已經有較好的結果;如果要追求何地何時的話,作者通過添加國家固定效應和提取新聞報道主題概率分布,為這個問題做了新的突破。但是,如果像如歌中所唱的那樣,今天是一個晴朗的早晨,那明天那場暴風驟雨是很難意料的,假如戰爭明天就要爆發,想要在今天就有可靠的預警,還需要漫長的探索。作者的研究除了在計算社會科學領域貢獻了一個新的機器學習範例之外,也為當下不斷應用的大數據輿情分析提供了一個宏觀實證經驗。


文獻來源:MUELLER, H., & RAUH, C. Reading Between the Lines: Prediction of Political Violence Using Newspaper Text. American Political Science Review, American Political Science Review (2018) 112, 2, 358–375.


大象文摘是我們的新欄目。


在這個話題無孔不入且熱愛閱讀的新媒體編輯部,我們經常在各種五花八門的公眾號上,遇到或曲高和寡或趣味小眾、但非常有意思的新鮮玩意兒。


現在,它們都將一一出現在這個欄目里。


本文由公眾號「量化歷史研究」(ID:QuantitativeHistory)授權轉載,歡迎點擊「閱讀原文」訪問關注。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 大象公會 的精彩文章:

混音師如何拯救歌手 | 回形針
中國什麼地方的人最能打|大象公會

TAG:大象公會 |