當前位置:
首頁 > 科技 > Science 推出「預測」特刊:AI如何幫助我們預見未來

Science 推出「預測」特刊:AI如何幫助我們預見未來

機器之心編譯


在阿西莫夫的《基地》系列科幻小說中,天才哈里·謝頓幾乎完美地預測了銀河帝國的衰落和之後相當長一段時間的發展。隨著近年來機器學習技術的興起,基於數據的預測在搜索引擎、定向廣告和個性化推薦等許多特定的應用領域取得了很大的發展成果,但在更加廣泛的科學發現預測、政治預測、社會事件預測乃至人類文明發展的預測上,機器學習還能實現同樣的成就嗎?而今天我們又已經在這些領域走到哪一步了呢?今日,Science 推出了一個關於「預測(prediction)」的專題,通過多篇文章解讀了上述多個領域的研究進展和面臨的挑戰。機器之心選擇了其中幾個主題進行了詳細編譯,其餘的則進行了一些摘要介紹 (篇幅限制沒有列出參考文獻)。想要更詳細了解該專題內容的讀者可參閱:http://science.sciencemag.org/content/355/6324



Science 推出「預測」特刊:AI如何幫助我們預見未來


序言


人類從遠古時代通過薩滿煙熏內髒的方式開始就一直不斷嘗試著預測未來。正如本專題所探討的,預測現在是一門高速發展的科學。該文章探討了如下問題:怎樣分配有限的資源、一個國家是否會陷入衝突中、誰將有可能贏得選舉或發表一篇影響巨大的論文以及在這樣一個新興領域中如何建立標準。


社會科學家和機器學習社區正在學習新的分析工具,從而從亂糟糟的數據中分離出真正有意義的模式。新工具是令人興奮的,但是如果只是使用框架上的軟體包而沒有完全去理解它,那麼就會導致一些災難。這一專題的幾位作者描述了平衡機器學習方法和人類因素的現實目標的重要性。

在 20 世紀 50 年代,著名作家艾薩克·阿西莫夫想像了心理史學的圖景,其中計算機可以通過龐大的數據集預測帝國的興亡。現在科學還不能完全做到這樣,就像上一次美國大選那樣。新聞報道和相關的報告也都描述了最新的科學技術進展,科學家們也相信隨著方法的改進和驗證數據源的增長,選舉和其他社會實踐將變得越來越可以預測。


當在多學科交叉領域中努力解決問題時,如將人類對語義的理解和能處理 TB 級數據的演算法結合起來,成功似乎將會到來。研究人員可能仍然遠遠不能做出政策制定者所期望精度的預測,但是他們現在能夠預想的情景能幫助塑造一個更好的未來。


一、預測武裝衝突:是時候調整我們的期望了嗎?


摘要:這篇文章介紹了預測政治暴力(political violence)的一般性挑戰,特別是相比於其它類型的事件(比如地震)的挑戰。什麼是可能的?什麼又不太現實?我們的目標是揭穿關於預測暴力的神話,以及說明這一領域的實質進展。


如果「大數據(big data)」可以幫助我們找到合適的合作夥伴、優化酒店房間的選擇和解決許多其它日常生活中的問題,那麼它也應該能夠通過預測致命衝突的未來爆發來拯救生命。這是許多將機器學習技術應用於來自互聯網和其它來源的新且大規模的數據集的研究者的希望。鑒於世界上仍還有政治暴力所帶來的苦難和不穩定,這一願景是衝突研究者在政策影響和社會控制上的終極前沿。

話雖如此,但在學術的衝突研究上,預測仍然是非常有爭議的。僅有相對很少的衝突專家嘗試過明確的衝突預測。此外,還沒有建好的早期警報系統可以作為決策的可靠工具,儘管目前已經有一些重大努力了。


近年來,我們已經看到了一系列想要填補這一空白的文章出現,它們利用了大規模數據收集和計算分析領域內的最新進展。這些研究中的任務是預測在給定的國家和年份是否有可能發生國際或國內的衝突,並藉此創建全球暴力衝突的年度「風險地圖(risk maps)」。最開始的預測模型基於當時政治學領域新興的定量方法(quantitative methodology)且依賴於簡單的線性回歸模型。


但是,人們很快就認識到這些模型無法捕獲衝突預測的多變影響和複雜的相互作用。這種認識導致了機器學習技術的引入,比如神經網路,這是一種持續至今的分析趨勢。在這些模型中,生成暴力後果的風險因素的互動是從數據中歸納式地推斷出來的,而且這個過程通常需要高度複雜的模型。今天,衝突預測工作的主要主要部分仍然是在年度上的國家層面分析,也有一些研究已經將其預測的時間範圍推至了未來數十年。


最近,新的可用數據和改進過的模型讓衝突研究者可以理清政治暴力的時空動態(temporal and spatial dynamics)。其中一些研究可以給出月度或日度的預測。這樣的時間劃分需要修正已有預測模型。比如說,在 [5] 中提出的方法基於以色列-巴勒斯坦衝突的衝突事件數據。該分析使用一個區分高強度和低強度衝突的模型,基於 1996 年到 2009 年的數據生成了 2010 年的預測。另一些方法的目標是利用新類型的預測器(predictor),比如戰爭相關新聞報道。因為它們能夠以遠遠更高的時間頻率上撲捉到政治緊張,這些報道被證明是比傳統的結構變數(structural variables,如民主的水平)更強大的戰爭發生預測器。


其它研究則在嘗試探索暴力的地方性變化(subnational variation),不僅試圖預測衝突將在何時發生,更要預測會在何地發生。空間分解(spatial disaggregation)可以讓衝突預測按行政單位產生,比如區或市或任意基於網格的位置。這一領域已有的研究重點是特定的國家和衝突。比如 Weidmann 和 Ward 為波斯尼亞的內戰生成了市級水平的預測,如圖 1 所示。另外也有為非洲的空間網格單元(spatial grid cells)得到的類似的暴力預測 。同樣,空間預測模型的複雜性的跨度可以非常大,從空間回歸模型到更靈活但也更複雜的機器學習模型。


Science 推出「預測」特刊:AI如何幫助我們預見未來



圖 1. 波斯尼亞市級水平的內戰暴力預測。(左圖)1995 年 6 月在 7 個市級單位實際發生的暴力事件(暗紅)。(右圖)[7] 中描述的時空模型預測到的暴力(淡紅)。畫有斜紋的圖案表示不正確的預測。儘管有 4 個市級單位的衝突得到了正確的預測,但該模型還是錯過了 3 個實際發生的衝突,並錯誤地預測了 4 個市級單位會發生暴力。而且正如大多數衝突預測案例一樣,許多區域仍然是和平的而且也符合預測(以灰色表示)。


預測的願景和陷阱

很顯然,在衝突預測領域確實出現了一些可觀的進步。使用明確的和客觀的統計標準,更新的方法比傳統的解釋性模型實現更高水平的樣本外準確度(out-of-sample accuracy)。和過去的暴力案例的因果解釋相反,樣本外預測(out-of-sample forecasting)可以實現不用於擬合模型的事件預測。依賴於先進的定量技術的研究者也取得了具體的預測成功。比如,在 Political Instability Task Force 委託的一份報告中,Ward 及其團隊提前 1 個月預測了泰國 2014 年 5 月 7 日的軍事政變。


此外,在解決罕見事件預測的挑戰上也取得了一些進步。標準的、現成可用的機器學習模型通常適用於不同的輸出之間相對平衡的問題。而暴力與和平的預測卻並不是這樣的問題,其中大部分時間所檢查到的單元都是和平的。這個問題可以通過不同的重採樣(resampling)技術來解決,這能實現該模型的遠遠更高的整體預測準確度。Muchlinski 等人應用這樣技術在 2001 到 2014 年的樣本上預測了內戰。他們的模型正確地預測了 20 次內戰中的 9 次,而傳統的回歸模型沒有預測正確。


該文獻還表明以樣本外預測(out-of-sample prediction)為重心有助於防止包含進可能會惡化預測表現的解釋性的長列表。更一般而言,這樣的分析也是一個有用的提醒:過去事件和未來事件預測的因果解釋是不同但相關的實證表現的標準 。


儘管有這樣的進展,但要說能拯救生命的衝突預防(conflict prevention)已經馬上就能實現還是過於樂觀。此外,這一領域還遠遠沒有達到民意調查機構和經濟預測機構所能接受的政策影響。為什麼會這樣呢?


也許最嚴重的問題在於在完全認識圍繞和平與衝突的根本複雜性上的普遍失敗。與相對結構化的機構決策設置(institutional decision-making settings,如在微觀層面上的投票和消費者行為)相反,衝突過程通常包含一個難以處理的施動因素(actor)集合,這些施動因素以一種讓人驚訝的而且從定義上打破規則的方式交互 。這些情形可通過基本和固有的複雜性進行特徵化,其允許的是實現「模式預測(pattern prediction)」而不是準確的特定事件的經驗預測。在缺乏充分了解所有理論上的組件的交互方式以及缺乏足夠用於測量相關變數的數據的情況下,我們所能希望的只有在能增加衝突的概率的結構特徵的基礎上的風險評估(risk assessment)。因此,至少在宏觀層面上,要根據之前在稍不複雜的領域(如撞球、行星運動或交通系統、)或更簡單的政治環境(如選舉競爭)上的成功來確定未來預測的表現是無效的;在這些更簡單的問題中,理論原理得到了廣泛的了解,而且相關事件發生的頻率也很高。


即便神經網路這樣的機器學習技術能在底層數據捕捉非線性,但是地緣政治的變化改變了如國家及其邊界這樣的分析單位,這種改變帶來了一個更基本的挑戰,尤其是對於長期宏觀預測來說。大多數宏觀模型傾向於跟蹤一組給定的現有狀態到未來的屬性,而忽略了領土變化的可能性,比如分裂與統一。然而,正如前蘇聯和南斯拉夫冷戰結束帶來的變化所展現的那樣,這些國家的國家層面上的數據幾乎沒有為冷戰結束後的預測提供指導。地域的變化之外,這些隱含的恆常性假設更普遍地適用於單位和因果機制效應之間的互動。這個問題阻礙了「交叉驗證」的使用,這種方法會將數據集分成若干部分,其中一些是用來「訓練」預測演算法,還有一些是作為「抵抗(holdout)」部分,後面會用來測試演算法。在一些將歷史切成碎片這種做法的情況下,關於長期趨勢的有價值信息會丟失,因為這種方法打亂了歷史時期,把它們看成了是 等效的(equivalent)。


數據質量進一步阻礙了政治暴力預測的進展。與撞球或行星運動軌跡不同,測量衝突的發生、地點和時間要難得多,而且這些預測與相當大的不確定性有關。對於許多暴力的決定因素,如經濟狀況,類似的問題也同樣存在。即使在過去事件的統計解釋測量上誤差不是個問題,但它仍然對未來暴力行為的預測構成了挑戰,同時還常常會降低暴力發生地點和時間預測的置信度。如果暴力測量結果與一個或更多的預測指標變數呈現系統性相關,那麼會產生類型更多的嚴重錯誤。因為政治暴力往往是從新聞文章這樣的次要來源(如新聞文章)編碼而來的,所以高水平地暴力觀察可能是源於高水平的實際暴力或者概率更高的報道(或者兩者都是)。這使得預測很困難。擴大數據集——如在使用自動事件編碼的幾個項目中——可能加劇這一問題,因為它同樣依賴次級來源。


即便在預測研究上的最近進展很有前景,我們還是要警告從理論和政策上高估其重要性的傾向。如上面所討論,樣本外預測有助於理論建設,但是,這並不意味著有效的解釋必須始終是預測性的。根據達爾文的理論,一些高度依賴路徑的過程只允許特定情況下的事後解釋。鑒於衝突過程的複雜性特徵,特別是在宏觀層面,這樣的解釋仍然可以提供關於具體機制和政策有效性的關鍵信息。此外,將預測表現作為唯一有效的經驗評估標準是不明智的,特別是在預測模型非常複雜和不透明,以至於尚不清楚預測成功的驅動因素是什麼的情況下。例如,模型集合上的貝葉斯平均是一種優雅歸納技巧,它從競爭模型中匯聚了大量數據,但除非理順理論上的問題,否則整體結果可能只不過是理論上的黑箱而已。


做政策相關的預測需要謹慎的原因研究還有一些。學者們給出的預測通常都假設政策制定者最要想要的是預測性的風險評估,因為這些東西能讓他們通過配置預防性資源和干預減少潛在衝突。然而,這些希望假定了政策干預的效用已被廣為人知。事實上,無理論的預測在不了解衝突的驅動因素的情況下很少能指導干預。因此,謹慎執行政策分析評估衝突減少措施帶來的因果效用是有效政治宏觀預測的先決條件。考慮到獲得關鍵社會指標的可靠信息是有困難的,尤其在發展中國家,在許多情況下,一些基本描述和解釋建模可能比預測更迫切需要。


推薦


有許多方法可以改善現有的衝突預測工作,例如,涉及到方法論和結果的溝通。在一些情況下,這需要更多用戶友好的方式來呈現結果,比如報告現有和預測的趨勢,而不僅僅是基於花哨估計技術的接收者操作特徵(receiver operating characteristic,ROC)曲線。透明性還要求關於採樣周期的關鍵假設和不確定性測量在多個場景中基於備選假設的情況下能被明確陳述和經過魯棒性測試。否則,研究者的錯誤估計可能會傳達一種錯誤的確定感。


為了評估新方法的附加值,分析師們需要更好地比較他們從複雜的預測機制中得出的預測與簡單的基線模型。它最純凈的形式,比如一個基線模型,能簡單地預測出過去沒有給現在帶來變化。例如,Lim 等人用一個基於 agent 的複雜模型預測了前斯拉夫種族暴力的位置。雖然該模型的預測精度乍一看令人印象深刻,進一步的檢查發現,這種表現與一個在地圖上隨機標出暴力事件(塞爾維亞和黑山共和國除外)的模型差不多。


最終,在政治暴力這個問題上,希望大數據通過某種無理論的「蠻力」產生某種有效的預測是錯誤的想法。自動的數據提取演算法,比如基於社交媒體的網頁抓取和信號探測,可能會加劇政治緊張局勢,但這並不意味著這些演算法能以較高的時空精度預測低概率衝突事件。只有研究人員考慮到數據質量和代表性的局限性,大型自動編碼的數據集才能發揮用處。這樣一來,團隊工作的人類「超級預測員」仍然能在一般政治事件預測上擊敗的不僅是更專業的專家,還包括預測市場和其他自動化的方法就不足為奇。


總體上看,我們堅決相信衝突預測非常有用,也值得投入研究。但是,未來的預測研究需要識別由人類系統的大量歷史複雜性與偶然性導致的內在局限。如冷戰的結果和更多的最近歷史事件表面,像「英國退歐」和「特朗普大選勝利」這樣的歷史性「事件」經常會諷刺脫離語境的樣本外的推算(out-of-sample extrapolation)。討論經濟發展長期預測的難度時,Milanovic 提醒我們「可以也確實會改變的變數數量,歷史中(『自由意志』)人物的角色」,以及戰爭和自然災害的影響是如此之大,以至於即使是一代人中最優秀的頭腦所作出的大趨勢預測也很少正確。


然而,同時,時空範圍更有限的預測——例如預測的一個給定的處於內戰的城市的短期暴力軌跡——是完全可能的,因為它們不太可能受到這些發展的影響。因此,該領域的挑戰是,要在社會和政治世界固有的複雜性與我們準確預測政治暴力的能力的相關局限之間找到一個平衡點。最近收集衝突事件的非總體和空間直觀(spatially explicit)的數據加快了,結果表明,在有限的時空半徑內,政策相關的預測是可行的,同時潛在用處也非常大。然而,超出這些限制,大量的理論和經驗的不確定性往往壓倒了預測的嘗試。在這樣的情況下,在生成可能的情景這個任務上,預測建模作為一種啟發式工具,而不是作為具體政策建議的生產工具,或許會更有用。


二、科學學領域中基於數據的預測研究


摘要:想要預測發現的願望——提前知道將由誰在何時何處發現什麼,幾乎滲透了現代科學的所有方面:從個人科學家到出版商,從資助機構到招聘委員會。本文調查了「科學的科學(science of science,科學學)」的新興和跨學科領域,以及使我們得知科學發現的可預測性的因素。而後我們將討論改進源自科學的科學的未來機遇及科學社區中積極和消極的潛在影響。


想要預測發現的願望——提前知道將由誰在何時何處發現什麼,幾乎滲透了現代科學的所有方面:從個人科學家到出版商,從資助機構到招聘委員會。本文調查了「科學的科學(science of science,科學學)」的新興和跨學科領域,以及使我們得知科學發現的可預測性的因素。而後我們將討論改進源自科學的科學的未來機遇及科學社區中積極和消極的潛在影響。


目前,對預測發現——對何人何時何地發現何物提前有些想法——的渴望幾乎遍及現代科學的所有方面。個人科學家通常預測哪些研究問題或課題會是有趣的、有影響力的,並且可獲得資金支持。出版商和資助機構評估手稿或項目意見書時,部分是通過預測其未來的影響力進行的。員工招聘委員會也會預測哪些候選人員會在其職業生涯中作出重要的科學貢獻。對於通過稅費資助大部分科學研究的社會大眾來說,預測也是重要的。我們能使科學發現過程更有可預測性,就能將資源更高效地用於推動有價值的技術、生物醫學和科學方面的進步。


儘管存在這種普遍的需求,我們對如何發現的理解仍然是局限的,並且個人、出版商、資助機構或招聘委員會做出的預測中相對來說極少是通過科學方式做出的。那麼,我們如何能知曉哪些是可以預測的,哪些是無法預測的?儘管將發現與發現者相分離會存在困難,但該論文的首要關注點是科學的科學:為科學性地理解導致科學發現的社會過程(social processes)而進行一種跨學科工作。(是為了對科學哲學的現時思考及科學家如何在個別科學挑戰方面取得進展,請看(1)


這種預測發現的興趣可以向前追溯近 150 年,一直追溯到哲學家 Boleslaw Prus (1847–1912) 和經驗主義學派的社會學家 Florian Znaniecki (1882–1958) 的作品。特別是 Znaniecki,在其倡議下,設立了對科學社會進程的數據導向研究。在 20 世紀的大部分時間裡,該目標進展緩慢,部分是由於好數據難獲取,且大部分人滿足於專家評判。


今天,科學圈是一個巨大而又多變的生態系統,包含著數以百計的互相關聯的研究領域,數以萬計的研究人員和每年層出不窮眼花繚亂的新結果。這樣驚人的體量和複雜度進一步擴大了對科學的科學研究的呼聲並激發了對這種類型測量量化方法的研究,比如對過去成果的引用、新成果的產生、職業生涯軌跡、資金贊助、學術獎勵等等。數字技術使得這些信息的生成量巨大,而研究人員則正在開發新的強大的計算工具來分析這些信息。舉個例子,為了自動量化某些專業科學問題研究的進展,自動提取和分類論文中的相關內容。


目前普遍認為,通過挖掘這些信息所得到的預測遠比專家的意見更為客觀精確。書目資料庫和在線平台——比如,Google Scholar、PubMed、Web of Science、JSTOR、ORCID、EasyChair、和「altmetrics,」——正在使研究人員對科學進展的深入洞見進入一個新的時代。


這些努力也帶來了一個引人爭議的問題:我們最終能夠預測重要的發現和它們的發現者嗎?就像 Yoshinori Ohsumi 的諾貝爾獎——對動物細胞的自我吞噬系統的相關工作。我們還不知道答案,但這項工作肯定會使我們在科學研究這一社會活動的理解上更進一步。舉個例子,一些科學發現是很容易被預測的(圖.1)。隨著理論和證據的累積,很明顯一個發現將迫在眉睫,就像一幅拼圖中間就缺了那一小塊一樣。人類基因序列的確定和引力波的觀測就是這種發現的很好例子。另一方面,一些發現似乎不可能被預測,因為它們可能代表了促使我們重新思考整個問題的那一小塊拼圖或者是發現了正在發掘的那一部分的新用法。儘管隱喻著這樣的關鍵創新的小塊有時是當下顯而易見的,就像基因編輯技術,而有時這些隱喻又需要時間以使得其餘的相關部分進入我們的視野,就像青黴素(第一種抗生素)的例子,我們用了 15 年才實現它。



Science 推出「預測」特刊:AI如何幫助我們預見未來



圖 1:多意外才能算是一項發現?


科學發現在相對於它們各自的已知知識的不可預見性這一問題上而各有不同。為了說明這一觀點,我們把 17 個主要科學發現的例子從完全無法預計(如抗生素、基因編輯技術、以及宇宙微波背景輻射)到可以預知(如引力波、DNA 的結構、人類基因的編碼)進行排列。


通過使用已發表成果以及科學生涯中的現代數據,科學學的研究人員們已經開始定義一些在各個領域內普遍認同的量化特徵,而這些洞見正重新定義科學學可預見性的極限。以下四個領域具體體現了這些成果:對過去發現的引用量、誰得到了相關的研究職位、科學的生產力以及在職業生涯中主要發現的時機。但是,基於這些方面的工作同樣也暗示了它受限於數據驅動的對科學發現的預測。


現代的文獻資料庫允許研究者輕鬆匯總和研究引用量,這提供了一種方便但也有爭議的科學影響力測量方式。50 多年之前,de Solla Price (1922–1983) 在許多知名的成果中識別出了驅動引用量的基本機制,其中當前可見度和幸運事件能驅動一個正向反饋循環,這能放大未來的可見性 (4)。這種「擇優依附(preferential attachment)」機制解釋了論文之間的引用如此不均衡的原因,為什麼有的論文能夠得到比典型論文多數百倍乃至數千倍的關注。這個模型也能對一個發展中的領域內的引用積累情況能做出非常好的預測。一個帶有論文的新舊程度及其固有吸引力等控制量的修改過的版本能為單篇論文的長期引用量估計提供預測,其能表明引用達到峰值的時間以及需要多少時間才能將一項發現變成一個常識 (6)。


但是,一些發現並不遵循這些規則,這些例外表明,除了可見度、運氣和正向反饋,還存在更多與科學影響力有關的因素。比如說,一些論文遠遠超出了由簡單的「擇優依附」所做出的預測 (5,6)。另外還有科學中的「睡美人」:在很長一段時間內休眠不被人注意的發現,之後突然得到了很大的關注 (7-9)。一項在過去 100 年來的近 2500 萬份自然科學和社會科學出版物上的系統性研究發現「睡美人」在所有研究領域都有出現 (9)。比如,愛因斯坦、波多爾斯基和羅森在 1935 年的關於量子力學的論文;Wenzel 在 1936 年關於防水材料的論文;Rosenblatt 在 1958 年關於人工神經網路的論文。沉睡的論文的覺醒可能從根本上來說是無法被預測的,部分原因是在一項發現的影響顯現之前,科學本身也必須取得進步。


做出什麼樣的發現部分取決於誰在做這個發現以及他們接受的是什麼樣的科學家訓練(10)。科學家生產力隊伍的這些特點是受一小部分頗有聲望的研究機構的博士項目驅動的,這是由用來訓練大多數職業研究者的數據揭示出的。(11)作為這一優勢的結果,研究議程以及少量項目的博士生人口統計學趨於驅動著科研偏好和整個生態系統的生產力構成。除了這一穩健的模式——85% 的新教員是來自博士項目到不同層次聲望的研究機構——之外,到目前為止,教員安置顯然是難以預測的。利用了職業生涯早期生產力、博士後訓練情況、地理位置、性別方面等更多方面數據的模型幾乎很難改善有關最終職位安置的結果,跟了解這個人的學術血統後的預測效果差不多(12)。這一背景下的準確預測或許需要不同的、更少接觸到的數據,或者安置結果根本就是難以預測的,因為這取決於潛在不可測量的因素。


通過測量科研生產力以及發表作品被引用情況,研究人員也已經調查過了科學家個人在職業生涯中的表現和成就的可預測性。一般常識認為生產力——粗糙得說就是發論文的數量——會在職業生涯早期趨於高峰,接下來是一條長長的、逐漸下降的曲線(13),或許日益增加的教學和服務任務影響了科研作品的數量,降低了創造力等。不過,近期的一項對四十多年的生產力數據分析(針對 2300 名計算機科學教育人員)表明,個體生產力存在巨大差異性(14)。通常,最富生產力的時間集中在成為首席研究人員的最初 8 年中(圖 2),生產力高峰通常出現在首次升職之前。同時,近一半研究人員生產力最高峰的一年會出現得晚一點,有些研究人員的生產力最高峰出現在職業生涯晚期。



Science 推出「預測」特刊:AI如何幫助我們預見未來



對於絕大多數研究人員來說,生產力高峰很早就出現了。


(左)熱圖表明 2300 名計算機科學教員職業生涯中,生產力最高峰年份出現的時間(以發表作品數量為準),從第一份教職開始,從左到右依次列開。(右)直方圖對熱圖的橫向進行了總結,表明,對於絕大多數 研究人員來說,他們生產力達到最高峰的一年通常出現在創立自己實驗室的 8 年內。


過去的作品也意味著,職業生涯的早中期更有可能做出科學家個人最佳科學發現,比如,被引用最多的作品(15,16)。這一模式意味著主要發現的出現時間多少是可以預測的。不過,針對 10,000 名科學家發表作品歷史的分析表明,實際上,一項發現的影響力和它在職業生涯中出現的時機,並無相關性。也就是說,當這位科學家論文按照從第一篇到最後一篇的順序進行安排時,他們引用率最高的發現就是第一篇論文的可能性大致等於可能是第二篇、第十篇甚至最後一篇的可能性(圖 3)。年輕科學家傾向於成為絕大多數最主要發現的發起人——這一發現因此也是他們通常更富生產力這一事實自然而然的結果,並不必然是職業早期能力提升的一個特徵。僅憑簡單的機會本身,個人的最佳發揮更有可能出現在這位科學家職業生涯更富創造力的階段。



Science 推出「預測」特刊:AI如何幫助我們預見未來



圖 3. 在一位科學家作品序列上任意一點的主要發現。


這幅柵格圖展示了隨機挑選的 150 位 物理學家(17)所有作品的順序,從第一篇到最後一篇,每一行圓圈代表了一為科學家發表作品的順序。一行當中,藍色圓點標記的是最高影響力的作品。藍色圓點在表格里的不一致分布以及對應 10,000 調查者(頂部)柱狀圖的平坦表明,主要科學發現什麼時候出現,並無規律可循。


雖然每位科學家影響最顯著的論文的相對時間可能無法預測,但預測論文會被引用的次數和它是兩碼事(17,18)。具體來講,援引已發表論文會以系統、持續性的方式因科學家而異,這與科學家工作主體的可見性相關,但與研究領域無關。這種模式使我們能夠預測一個科學家最優論文的被引用量。關於科學家個人巔峰時期和幅度的兩個結果表明,個別科學家成就的某些方面極難預測,而在其他方面更容易些.


生產力和影響力當中,強健以及場外獨立(field-independent)模式,以及研究建議評估中有關偏差的證據,對目前為大多數科學研究提供資金的方式提出了質疑。比如,觀察及實驗研究表明,女性、非白人研究者(19,20)或側重於跨學科研究(21)的項目申請獲得資助的可能性更低。同樣,最具創造力與影響力的時間集中於科研生涯的前十年,這似乎證明將資金從較年長的科學家向年輕科學家轉移的舉措具有合理性。NIH 長期支持早期研究者便是一個顯著實例,儘管其成功很有限——因為 NIH 對 40 歲以下科學家的獎勵數量仍低於 30 年前的峰值(22)。另一方面,有人可能認為儘管外部資金不平衡,年輕的研究人員往往更有成效。科學的科學根據這些情況確定了一個重要的模式,但根本原因的確定則需進一步調查與主動性實驗。


引用、出版量、職業發展、學術獎項以及其他通用度量是最佳原始數量,而如今我們可能正在接近它們能夠告知的關於科學生態系統及其發現生產的信息極限。這些度量是科學前沿進展的滯後指標,它們能夠預測新領域的出現或重大發現的可能性也許會很低。科學的科學中存在一個根本問題:能否使用更及時或具體情境的科學家的工作數據來進行更準確的預測,例如論文的內容、預印本數據、科學研討會、科研團隊溝通、被拒稿件、資助申請及其同行評議,甚至是社交媒體。我們應當使用控制實驗來揭示大型數字資料庫中所觀察的模式中的因果機制,並探討可測量的量與我們的解釋之間的關係,如引用計數如何反映感知的科學影響(23)。


「... 我們有責任確保使用預測工具不會阻礙未來的發現,將弱勢群體邊緣化...」


其中引用和出版量是以往成功的度量,它們展現出創造愈發豐富的動態的反饋循環。當與具有現代科學出版、投資和聘用特性的超競爭力相結合時,由於在未來成功的機會的分配中有一部分基於最近成功的標記,這種反饋循環則可能在成功中產生顯著的不平等。然而貫穿科學發現許多方面的深度不可預測性表明,過度依賴這些度量能夠產生自我實現的預測(24),這最終縮小了科學創新的範圍,並將注意力從潛在、基本但不可預測的進展中移走。未來研究的一個重要方向必定是制定成功的度量和不易受反饋循環影響的評價系統。


而存在的一個隱患是:資助者、出版商和大學可能利用大型書目資料庫來創建新的系統,自動評估項目申請、手稿或年輕學者的未來「影響」。這種數據挖掘工作應當非常謹慎。它們的使用由於側重與以往成功的原始指標相關的細微相關性,便可能輕易對創新造成阻礙,並加劇現存科學系統的不平等。畢竟新的發現由於從未被看到過而非常有價值,而數據挖掘技術只能了解過去做了什麼。自動化系統的必然出現使得科學界必須指導他們的發展與使用,以便納入機器學習中的公平、問責和透明的原則(25,26)。我們有責任確保預測工具的使用不會阻礙未來的發現、邊緣化弱勢群體、排除新想法或阻礙跨學科研究與新領域的發展。


就像生物生態系統適應選擇壓力一樣,科學生態系統最終將適應不斷變化的科學激勵和需求(27)。隨著壓力改變,科學家們將適應或者退休,將生存與增殖的實踐親身傳授給他們的學生。然而令人不安的是,諾貝爾獎獲得者幾乎每年都聲稱他們最大的發現在現存的研究環境中本不可能。2016 年,Ohsumi 聲稱「如今科學家愈發需要為他們的研究提供即時而明確的應用」(28)。這類對於未料想到的可預測型發現的普遍重視會孕育出另類的、更具冒險精神的科學家。而結果可能會是凈化選擇的一種危險形式,這種形式下的年輕科學家會優化他們的研究並向一種趨勢靠攏,這種趨勢與我們每年評出的具有突出科學貢獻的科學家類型不相適應.


根據生態學及進化理論改進觀點在更好地整體性理解並預測科學生態系統方面極具潛力。這方面的進展將有助於我們避免由於多樣性的喪失而造成的創新上的損失。作為共同體,我們必須制定培養一個多元化的科學生態系統的制度,包括 Freeman Dyson 談到的俯瞰遠方的鳥和探索細節的青蛙(29)、逆向、流浪者、工具建設者等。然而,在科學家之間實現這種多樣化選擇的實際細節仍不清晰。真正的生態研究依賴於觀察研究與主動性實驗的結合。然而,科學的科學中的大多數工作純粹是觀察性的,並且增加主動性實驗(30)將需要源於定義適應性景觀的資助機構、出版商和管理員的關注、魄力和勇氣。如果說科學的科學能夠教我們什麼,那便是科學本身可以用科學的方法探測,而我們定會愚蠢地忽略實驗。


在新的數據源、新實驗和新想法的驅動下,我們期盼科學的科學可以產生更多有關社會過程並能導致科學發現的振奮人心的洞察。研究已經表明,這些發現的某些方面是可預測的,並且它們在很大程度上與以往發現的引用隨時間積累的途徑相關。然而在其他方面可能根本上就不可預測。這些限制在如今的大數據與人工智慧時代是微不足道的見解,並表明用於產生科學發現的更可靠引擎可能是培養和保持科學家健全的生態系統,而非專註於預測個體發現。


三、超越預測:使用大數據解決政策問題


摘要:從醫學到分配城市火警、衛生監察點等應用領域,機器學習預測方法碩果累累。不過,在預測和決策之間仍然存在不少鴻溝,我們需要了解基本假設以優化基於數據的決策行動。


最近,科學、產業以及政府領域分析的爆炸增長,以尋求「大數據(big data)」的幫助來解決各種問題。日益增長的大數據應用使用了有監督的機器學習(SML/supervised machine learning)工具。在描述這一工具有望用來解決臨床醫學問題時,Obermeyer 等人評論到:「機器學習……就像醫生通過實習獲得進步那樣來解決問題:從數據中學習規則。開始是病人觀測值,然後演算法篩選大量變數、尋找可靠的預測結果的組合……機器學習的優勢就是可以處理大量預測因素(predictor)——有時還驚人地預測因素比觀測值還多,並以非線性、高度交互的方式將它們組合起來。」


SML 技術最初出現在計算機科學和工程學領域,已被廣泛用於工程應用,比如搜索引擎和圖像分類。最近,用這一方法解決科學和政策問題的應用數量也越來越多。在公共領域,這一方法模型已經被用於刑事司法制度(2);使用移動數據、衛星圖像或谷歌街景(3、4、5)預測經濟狀況;分配城市火警、健康監察點等,以及各種城市應用。該技術已經被用於分類文本中的政治偏見(8)以及評論中的情感分析。在醫學領域,基於有監督的機器學習預測演算法已經被醫院用於按照病人的併發症的風險預測病情,優先安排病人的醫療干預 (10),該技術還被廣泛用於多種其它醫療應用,包括個性化醫療(1)。


有監督的機器學習的迅速普及部分歸功於數據、計算技術以及資源、數據分析技術、開源軟體方面的進步。另一個因素這些技術被設計用來解決的問題很簡單。現成的預測技術要發揮作用幾乎不用什麼假設(assumption):環境必須穩定、其行為正被研究的單元個體不會互動或相互干擾。在許多應用中,SML 可以被對問題領域所知甚少的科學家成功地加以應用。比如,Kaggle 公司主辦的預測競賽(www.kaggle.com/competitions)中,贊助商提供數據組,來自世界各地的選手提交的作品常常能成功預測,無論其關於問題的背景多麼有限。


然而,對純預測方法的局限性的關注要少得多。當這一方法被用於現成的預測,而沒有理解基本假設或確保滿足諸如穩定性等條件時,結論的有效性和有用性就會受到損害。一個更加深入的擔憂時,只使用預測技術是否就能解決給定問題,或者是否需要對干擾的因果效應(causal effect)進行評估的統計方法。


Kleinberg 等人(11)強調了這一情況,現有的 SML 技術可以部分(但無法全部)解決健康政策領域的資源分配問題。他們考慮的問題是決定是否通過醫療保險給否則不合格的病人做髖關節置換手術。他們使用 SML 預測概率(一個要進行關節置換手術的患者是否會因其他因素在一年內死亡),以及識別那些處在特殊高風險,不該進行關節置換手術的患者。他們認為:「好處會隨著時間的推移自然顯現,因此,如果某人能獲得夠久來享受手術的好處,那麼手術才有意義;給不久就會死亡的病人置換關節沒什麼價值——浪費金錢,給生命的最後徒增不必要的痛苦。」


這類問題中,聚焦預測的基本原理是很明顯的;我們知道,一個干預的平均影響,在某種世界狀態下,也是負面的(如果病人很快死亡),因此,預測世界狀態足以用來預測是否放棄手術這一決定。不過,作者強調了這一事實:純粹的預測方法並不能解決更加複雜的問題,比如,在那些可能存活超過一年的病人中,哪些病人該被給予最高的手術優先性。一個完整的資源分配問題需要評估手術效果的異質性,比如,因為一些病人有更高的手術併發症。將稀缺資源優化分配給手術效果能最大改善其福利的病人,是一個更加困難的問題,這個問題太長需要回答反事實的問題:採取那些以前從未實施過的各種替代分配政策後,會發生什麼?


在另一個資源分配樣例中,產業領域很常見,就是使用 SML 預測客戶流失(即消費者放棄一家公司服務)的概率,然後公司對那些具有高度流失風險的用戶給予干預(比如擴大銷售人員的服務範圍),以這樣的方式解決問題。Ascarza (12) 記錄了採取這類舉措的公司,然後使用借鑒自因果推理論文獻的方法提供了經驗證明:根據一個簡單的預測模型來分配資源,並非最優的做法。高度流失用戶組群和最優可能回應干預組群之間的重合只有 50%。因此,將留住用戶的問題視為一個預測問題,為公司帶來了更低的回報。


公共領域的資源分配問題是指一個城市應該優化分配監察點的地點,以最小化安全或健康問題。紐約的 Firecast 演算法是根據預測的違反概率來分配火警監察點。Glaeser 等人 (6) 發明了一個類似的系統用於分配健康監測點(這對波士頓餐廳)的位置,該系統得到了應用,初步估計每次檢查後,30% 到 50% 的違法情況得到了改善。


如何優化監測點分配的決策問題將直接歸於預測領域——如果以下簡化假設為真:(1)被檢查單個單位的行為是固定的;(2)識別出問題時,能立刻低成本加以解決,成本並不因為單位(unit)不同而所有不同。知道哪個單位更有可能違法,等於知道哪個單位應該得到監察。不過,更加現實的環境還集成了不同單位的異質性:一個建築可能因為老化的電路而處在更高的失火風險中,但另一些考慮會讓置換老線路變得困難。另一些單位的預測風險更低,但是,更容易做出實質改善,改善成本也低廉。另一個考慮是回應(responsiveness)。如果違法被處以罰金,一些公司會比其他公司對罰金更加敏感。整體說來,解決城市監察點分配的問題包括評估監察政策的因果性:在新的監測點分配機制下,你希望這個城市裡單位(比如,食物中毒率)的整體質量有什麼樣的提升?


因此,預測和因果推論是本質不同的兩個問題(儘管密切相關)。只有分析師超過這些預測方法來做出假設時,因果推理才是可能的;這些假設通常不能被直接測試,因此需要領域專家來進行驗證。已經有關於因果推論的橫跨多學科(社會科學、計算機科學、醫學、統計學、工程學以及流行病學)大型文獻來分析這類問題(參看 Imbens and Rubin (13))。使用並非從隨機測試中獲取的數據來評估因果關係的辦法之一就是針對導致微分檢測概率(differential inspection probabilities)的因素進行調整,然後根據特定餐館健康結果 預測檢查的效果(或許使用審計)。近期的方法進展關注的是調節大數據應用中觀察到的混雜因素(比如,14–16)這一文獻的主題之一就是現有的來自 SML 的預測模型招致了因果效果預測中的偏差問題,但是,持續有效的因果估計能夠通過修改 SML 技術得以實現。


另一個用於估計因果效應的方法就是利用設計好的實驗。Blake et al. (17) 使用了一個以城市為基礎的雙重差法(difference-in-difference methodology)來評估 eBay 的搜索廣告的效果(因果)。就像許多搜索廣告商,eBay 靠歷史數據來測量搜索廣告的好處,不過,也確實試著區分開因果性和關聯性。而且,eBay 使用一個簡單的預測模型(其中,點擊被用來預測銷售)測量了廣告的效果,他們發現廣告點擊的投入回報(也就是說,由點擊所貢獻的 eBay 銷售與廣告點擊成本之比)大約為 1400%。


通過使用實驗數據測量廣告效果,作者發現真實的投入回報為 63%。天真的分析和實驗結果之間存在鴻溝的部分原因是許多點擊 eBay 搜索廣告的用戶本來是要從 eBay 買東西的。儘管點擊廣告強烈預示著一次交易——消費者通常會在點擊之後迅速購物——實驗揭示出,一次點擊很難說有大的因果效應,因為不管怎麼說,點擊的消費者很可能要購物。


除了資源分配問題之外,純預測和因果推斷之間的區別幾十年來一直是很多領域內方法和經驗研究的主題。經濟學對這個區別特別關注,或許是因為一些最基本的經濟問題,如在不同的價格下消費者的需求變化,不能通過純預測模型來得到答案。舉個例子,同一個產品在不同(假定的)的價格水平下,消費者的購買量是多少?雖然這個問題似乎看起來可以直接套用 SML,將價格水平設置為一個說明性的特徵(feature)來預測出銷售量的「結果」。在實際操作時,如果 SML 被用作一個估計價格與銷售量之間的因果效應的方法,這個方法將會很失敗。假設,一個分析師有酒店價格和入住率的歷史數據。一般情況下,價格和入住量是正相關的,因為酒店既有的價格政策(經常通過利潤管理軟體來制定)明確規定當酒店預訂越來越滿時酒店提高價格。直接套用 SML 技術的應用是為回答以下類型的問題所設計:如果一個分析師被告知在某天,客房價格非比尋常的高,那麼這天最準確的入住量預測是多少?正確的答案是入住量將很可能很高。相反,改變價格政策的影響問題是一個因果問題,並且一般經驗表明如果公司執行一項新政策來系統性的提高酒店所有服務價格的 5%,那麼酒店將很可能會有更多房間被入住。另一個不同系列的統計技術將可以用於回答這樣的問題,或許可以利用數據中「自然的實驗」即一個被稱之為「工具變數」的方法 [13 是對這些技術的回顧]。最近,一些作者將 SML 的優勢同這些傳統小數據系列的方法結合起來了,為了用於估計典型因果效應和私人化的因果效應估計。


預測與因果推斷之間的區別之外,僅為預測而做的方法優化也不能顧及到其他因素,這些因素可能在數據驅動的政策分析或者資源分配上很重要。例如,動機和可操控性可以很重要。如果一個建築或者餐廳所有者依據這些特徵,預料到被審查的可能性很小,他或她將減少安全措施上的投入。


在一個數據驅動政策的例子中,可操作性發揮了作用,不列顛哥倫比亞的市場定價系統(MPS)被用於對國有土地的木材收購的定價,這些國有土地是在長期租約下被分配給木材公司的。MPS 構建出一個可以預測的模型,這個模型所運用的數據來自拍賣中木材的售價,該模型可以用於預測如果將長期租約下的一片土地的收穫木材拍賣所可能達到的價格。但是,一個租約持有者潛在很可能有在拍賣中人為低價競標的動機,從而達到影響模型對長期租約下收穫木材的價格預測,也即降低了他們長期租約下收穫木材的成本。作為模型選擇過程的一部分,MPS 的預測模型服從於模擬情境,使得任何單個大型木材公司都能實現各自的可操作性。這個已經實現的模型並不是一個具有最好的預測性能的模型,最好的預測模型具有期望擁有的魯棒性而不是可操作性。


在實際運用統計模型時,很多其他需要考慮的問題湧現出來。有時候讓利益相關者理解一個已做出的決定的緣由是很重要的,或者決策者可能需要記住一個決策規則(如醫生)。基於透明度和可解釋性的考慮,或許會導致分析師們偏好模型的簡單性而犧牲模型的預測能力。另外一個需要考慮的是公平性或者說歧視。美國貸放款的消費者保護法禁止實際應用中有依據種族的歧視。一些公司可能希望運用 SML 方法從工作申請者中挑選出可以面試的申請者;但是他們可能希望在演算法中設置多樣性目標,或者最起碼可以阻止性別和種族的不平等。在 SML 的文獻中可以看到這些問題在最近受到關注(如 21)。


總的來說,大數據如果想要在商業、科學以及政策上實現其全部潛力,從有監督的機器學習的文獻來看,需要有由新的計算機演算法所構建的多學科方法;同時還能帶來使用經驗證據來引導政策的數十年多學科研究的方法和實際學習。一個不成熟的但是快速成長的研究採取了這樣的一個方法:例如,2016 年的 ICML(International Conference on Machine Learning)對 SML 方法的因果推斷(casual inference)、可解釋性(interpretability)以及可靠性(reliability)分別組建研討會,雖然谷歌(22)、Facebook(23)和微軟(24)的多學科研究團隊已經開發出了可以使用的工具包,且這些工具包擁有為實現因果推斷、實驗性的設計以及估計最優資源分布政策的可擴展演算法。隨著其他領域持續加入和 SML 研究團體一起用大數據來尋求現實世界政策問題的解決方案,我們預計數據驅動的政策在演算法提升和成功實現上將會有更大的機會。


四、預測人類行為:下一個前沿


機器學習的進步正在變革我們對線下(offline)和線上(online)人類行為的理解。從訓練集中分類我們感興趣的對象,無論這些對象是恐怖分子、需要維護的機器或包含惡意鏈接的電子郵件,其都代表了這一領域內的巨大成功。或許不存在一種機器學習演算法能將所有都做好。雖然精度是至關重要的,但是可接受的精度程度是隨著研究問題的變化而變化的,僅僅只有精度是遠遠不夠的。研究人員經常解釋為什麼他們的預測是正確的,但是從不解釋為什麼他們的預測可能也是錯誤的。那麼決策制定者同時了解這兩部分的原因將有利於他們制定更好的決策。特別是在高風險的情況下,預測必須同時提供相應的解釋,這樣才能為進一步研究提供更深入場景理解。


預測模型還必須為潛在的未來行動提供一個或多個解決方案,這樣決策者才能更好地決策。如今的機器學習方法並不一定滿足這三個標準。因為構成理想的預測演算法還是取決於現實應用。通常,利益相關集團(如社會媒體平台和搜索引擎)將對精度有不同的定義,從而滿足其特定的需求。此外,行業專家可以使用領域內廣博的知識建議在數據集內包含相關的獨立變數。通常,他們將使用由預測模型生成的技術精度測量和他們的學科中的內容結合起來解釋預測結果,所有這些都表明在現實世界體系中,計算機科學家需要和其他利益相關者進行合作而取得深遠影響的結果。


在我們看來,下一代的預測模型需要解決以下四個主要的挑戰。


首先,更多數據總會獲得更好的預測模型這一格言並不總是正確的,因為數據中的噪點可能會壓垮預測模型。處理噪點、不完整和不一致數據的能力將會是下一代預測模型的核心。例如,在推特上識別「bots」就是尋求在政治候選人上持正觀點,而忽略尋求其它結果的大量「bots」。例如傳播垃圾郵件、尋求在其他主題上影響他們的觀點或欺騙用戶點擊鏈接從而為他們創造利潤的機器人。此外,許多推特的數據是受到限制的,在一些情況下甚至會故意產生誤導。所以機器人開發者就需要確保他們的機器人逃避檢測。


第二個挑戰是罕見事件預測。例如,公司監控其內部網路來識別可能會竊取機密的用戶將會包含所有公司僱員的在公司內部網路活動的信息,其範圍包括從對員工的郵件分析、上傳(到網站)到下載到內存存儲設備等。許多僱員對公司是誠實的,只有一小部分可能會存在問題。在這樣一個案例中,機器學習演算法將很難從無辜用戶(這種情況下,數據稱為「不平衡」)中分離清楚那些「稀有」的個例,並且預測模型一般表現不太好。


預測新現象時保持模型的準確性是重要的第三步。社會運動常被分為五個步驟:導火索、社會動蕩增加、發展組織核心成員、組織的維持和終止(假如運動最終消亡了)。當事件還處於早期階段(如有人開始在 Twitter 上抱怨),準確預測之後發展的動向可以讓我們在其後更加激烈的衝突中受益。


第四個因素是人類的行為是動態變化的。我們的對手(如惡意軟體開發者或恐怖分子)會不斷適應環境。因此,高階預測(關於預測模型的預測)的形式成為了關鍵。我們需要預測模型何時出錯,或何時人們行的為將發生改變,因此我們在太多錯誤發生之前就可以開發出新的預測模型。OpFake Android 惡意軟體的開發者最初設計這個病毒自動從受感染的手機發送簡訊給高價付費服務號碼。後來,開發者調整了策略,也開始涉足銀行卡欺詐。我們迫切地需要開發可以在發生時或甚至在發生之前識別這些危險行為的預測模型。


開源數據的爆炸和機器學習的發展徹底改變了我們分析人類行為的方式。在未來的幾年裡,隨著物聯網的發展,這種多樣性會出現又一次爆炸——異構數據。我們可能會遇到與不完整,不一致,不平衡和混亂數據相關的問題。生成準確預測和高質量分析的能力,包括對預測的支持和證據,以及提供可操作決策的能力,將是決定性的,因為機器學習系統將無處不在。一個數據驅動,多學科,多利益相關者的方法對於預測未來的模型而言至關重要。


五、特刊其他幾篇文章的摘要


(一)在線民調:人民的脈搏


在線民調系統會成為民調預測工具,甚至替代品嗎?傳統的民意調查,無論是通過電話還是面對面的問詢都是費時費力的方式。而且這類方式的有效回復率已經下跌至 10% 以下,只能為分析者提供一個帶偏見的小型樣本。而在線民調的方法,如 Twitter 分析可以讓研究人員直接研究數百萬群眾的政治觀點,實時更新,而且數據是免費的。然而無論傳統還是 Twitter 民調都沒有預測出去年 11 月份的美國大選結果。網路看起來仍然無法讓我們摸清人民的脈搏。但社會科學家相信它終究會是正確的方式。


(二)社會系統的預測與解釋


社會科學研究者一直在尋求人類和社會現象機制的合理解釋,卻往往忽視了預測準確性。我們認為,社會科學越來越多的計算性質已經開始扭轉對於預測的偏見了。但是仍有三個重要問題亟待解決:首先,目前用於評估預測的方法必須進行標準化;第二,複雜社會系統中預測準確性的理論限制必須得到更好地表徵,從而設置對可以預測或解釋的預期;第三,在評估解釋時,預測準確性和可解釋性必須被視為補充,而不是替代。解決這三大問題將使我們獲得更好,更可重複和更有意義的社會科學。


(三)通過預測競賽將概率判斷用於政策辯論


政策辯論經常會受到不準確預測的影響,這讓決策者難以評估和改進政策。一項由美國情報機構贊助的錦標賽展示了人們可以通過使用概率模擬來進行預測——即使是那些看似「獨特」的事件。同時,它也證明了比賽是生產知識的有效工具。根據關於問責制影響的文獻,作者認為競賽具有很大潛力,可以作為消除政治辯論和解決政策爭端的工具。

您的贊是小編持續努力的最大動力,動動手指贊一下吧!


本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

現實版《降臨》:機器破譯古文能否找回逝去的人類文明?
人工智慧從入門到進階,機器之心高分技術文章全集
深度強化學習綜述:AlphaGo到學習資源分享
機器之心發布吉祥物,你猜到了嗎?

TAG:機器之心 |

您可能感興趣

Current Biology 特刊:如何製造一棵植物?
Nature特刊:再生醫學如何讓你滿血復活
《Love Live!Sunshine!》特刊雜誌發售 可愛小姐姐換上新裝
《Love Live!Sunshine!!》特刊雜誌發售 可愛小姐姐換上新裝
Science特刊:人體能不能完美修復與再生?
Science特刊:人體內神奇的修復再生系統
【萬聖節特刊】【女孩Birdie】BIRDIE S HAPPIEST HALLOWEEN
Nature推出單細胞生物學特刊
Nature特刊:6篇綜述讓你認識「神經……病」
《Vanity Fair》打造《星球大戰 8: 最後的絕地武士》主題特刊
Nature最新特刊:關於單細胞生物學
特刊:Blue Apron:生鮮食品行業的攪局者,被攪局了
吳亦凡成為 BoF 紙質特刊封面人物,CLOT 2017 秋冬 Lookbook 糅合中西文化 | HB Daily
Science特刊:失眠、肥胖、癌症……萬能的生物鐘如何掌管我們的身體?
退役一年了 你們想他嗎?KOBE 24 特刊
Cell 特刊:以毒攻毒,砒霜變良藥
Nature特刊:圍繞食品的現代技術革命
大陸style 《幻寵大陸》手游時尚特刊
Nature計算和理論神經科學特刊:剖析機器學習推動下的神經科學進展