陳志武：量化歷史研究的過去與未來

文史 12-10

量化歷史研究的過去與未來

作者 | 陳志武

【作者簡介】陳志武（1962—），男，耶魯大學金融經濟學教授、香港大學馮氏基金講席教授、北京大學經濟學院特聘教授。

一、引言

二、量化歷史研究方法

三、歷史研究能夠量化嗎？

四、量化歷史研究不只是「用數據說話」

五、量化史學帶來新認知

六、結束語

【摘要】近六十年來量化歷史研究拓展並加深了我們對歷史的認知，使歷史研究向科學靠近。不管哪個領域，科學研究的基本流程應該保持一致：首先，提出問題和假說；第二，根據提出的問題和假說去找數據，或者通過設計實驗產生數據；第三，做統計分析、檢驗假說的真偽，包括選擇合適的統計分析方法識別因果關係、做因果推斷，避免把虛假的相關性看成因果關係；第四，根據分析檢驗的結果做出解釋，如果是證偽了原假說，那原假說為什麼錯了？如果驗證了當初的假說，又是為什麼？這裡挖掘清楚「因」導致「果」的實際傳導機制甚為重要；第五步就是寫報告文章。傳統歷史研究在第二至第四步上做的不夠完整。所以，量化方法不是要取代傳統歷史研究，而是對後者的補充。本文通過一些現有成果說明，量化史學不只是「用數據說話」，而是通過統計分析，既可令人信服地證明或證偽現有假說，也可以從歷史現象中發現全新的認知。

一、引言

2013年，筆者與清華大學龍登高、倫敦經濟學院馬德斌、香港科技大學龔啟聖等教授一起舉辦了第一屆量化歷史講習班。之後，我們每年辦一屆。與四年前相比，報名人數越來越多，國內學界對量化歷史研究的認知和興趣已有了很大的變化。雖然參與過講習班和量化歷史年會的同仁還未必都能用量化方法研究歷史話題，但至少都了解到了量化方法的優勢和不足，也不乏對量化史學的質疑。

按照經濟史學者諾斯的追溯（Douglas North，1977），用量化方法研究經濟史問題大致起源於1957年，當時幾位學者嘗試研究美國黑奴歷史的經濟邏輯。隨後，量化方法也用到了其它歷史研究領域，包括諾斯對歐洲政治制度史（North Thomas，1973）、西波拉對西方的教育史與宗教史的研究（Cipolla，1969）。到1960-70年代，量化史學變得流行，這股風潮後來有所消退。但是，1990年代中期後，新一輪量化歷史研究熱潮再度崛起，引人注目。就以國際五大量化歷史資料庫為例（Integrated Public Microdata Series, BALSA Population Database, Historical Sample of the Netherlands, Scandinavian Economic Demographic Database, Utah Population Database），2006—2010 年間，新發表的學術論文中運用這些資料庫的就達2360餘篇（梁晨、董浩、李中清，2015）。催生新一輪量化歷史研究的經典作品主要來自經濟學領域。而且，在如何利用大數據論證歷史假說方面，經濟史學者做了許多方法論上的創新，改變了以往社會學家、人口學家只注重歷史數據描述性分析、相關性分析的傳統，將歷史研究進一步往科學化的方向推進。期間，三組不同團隊起了關鍵作用：在哈佛和芝加哥大學的La Porta, Lopez-de-Silanes, Shleifer, Vishny（慣稱「LLSV」）（La Porta, Lopez-de-Silanes, Shleifer, Vishny，1998,1997），哈佛和麻省理工學院的Acemoglu, Johnson, Robinson（Acemoglu, Johnson, Robinson，2001），以及繼諾斯與托馬斯《西方世界的興起：新經濟史》和德弗利斯的《工業革命與勤勞革命》（De Vries，1994）等著作之後，於2000年出版《大分流》的彭慕蘭（Pomeranz，2000），雖然該著作本身在量化方法方面停留在簡單描述性數據層面，沒有做更深層的計量分析，但它引發了眾多學者對「工業革命為什麼發生在西方而非中國或伊斯蘭國家」的研究興趣，大量學術著作因此產生，而且這些著作幾乎沒有例外地都基於某種程度的量化方法。

今天，計算機和互聯網已相當普及，不僅許多歷史資料的資料庫化變得可能，而且使這些歷史資料庫的跨地區、跨國共享成為可能。在互聯網上有數不清的各國歷史資料庫可以免費得到，用起來方便，成本也低。這是以前的歷史學者做夢也想不到的。

當然，眾多量化歷史資料庫只是研究的基礎，關鍵要看研究方法與分析框架是否跟得上。許多同仁說：量化史學不是曾經時興一段，但後來勢頭下降了嗎？這次為什麼會不同呢？我們必須看到，1980年代之前電腦沒有普及，更沒有互聯網，那時整理歷史大數據很難，做統計回歸分析並檢驗假說也很難。但是，現在沒有這些問題了。今天「大數據」是個時髦話題，可是，很多人沒有看到歷史資料是真正的大數據。比如，僅清代刑科題本檔案就有近60萬本，平均每本大約30頁手稿，加在一起就是1800萬頁資料。更不用說其它明清及民國期間留下的奏摺、公文、實錄、文書、契約、方誌等史料，加在一起至少有數億頁。如果舉一極端例子，正如哈佛大學包弼德(Peter Bol)所說，僅2013年那一年，世界上的網站數量超過5億、共480億網頁，相當於6720億GB的信息量，是所有美國圖書館藏書總和的50萬倍！將來研究今天世界史或中國史的學者會如何作為呢？

首先要看到，採用細讀個案的傳統歷史方法，不僅會讓我們偏重樹木而忽視森林，而且，在歷史資料規模超過一定水平時，這種方法很難行得通。海量歷史資料帶來兩個現象：一是近代史比遠古史更難研究，因為明清資料太多而古代資料很少。傳統方法強調細讀一手史料，遠古資料少，使其相對可行，近代史海量資料反倒使其不好研究，只有靠引入新的研究方法才能改變這種奇怪局面；另一現象是由於傳統方法強調個案細節、不強調大樣本，但歷史上的社會現象又錯綜複雜，研究者很多時候都能根據需要挑選到「合意」的歷史案例。所以，在不同學者根據需要去找合意個案的習慣下，得出的結論當然各異。於是，就有了「歷史被任意打扮」的嫌疑。我們需要改變這些現象，這就要靠大樣本量化方法。

中國歷史資料豐富，這是中華文明的優勢。但是，要發揮這種優勢、增加我們自己乃至全人類對我們過去的認知，就必須改進研究方法。量化歷史方法既受益於現代互聯網技術，也受益於現代社會科學分析範式的進步，是歷史研究領域的與時俱進。

接下來，本文分別回答以下幾個常見疑問：第一，量化歷史方法跟傳統歷史方法是什麼關係？第二，歷史能夠量化嗎？第三，1990年代末期以來的量化歷史研究方法跟之前的量化方法區別在哪裡？最後，量化史學除了證明或證偽傳統史學提出的假說外，能帶給我們對歷史的新認知嗎？

二、量化歷史研究方法

量化歷史方法不是要取代傳統歷史研究方法，而是對後者的一種補充，是把科學研究方法的全過程帶入歷史領域。整理考證史料、注重文獻是歷史學研究的傳統，量化史學同樣注重對歷史文獻的考證、確認，這一點沒有區別。如果原始史料整理出了問題，不管採用什麼研究方法，由此推出的結論都難言可信。兩者差別在於量化方法會強調在史料的基礎上儘可能尋找其中的數據，或者即使沒有明顯的數據也可以努力去量化。

不管是自然科學還是社會科學領域，科學研究方法的基本流程是一樣的（King、Keohane、Verba，1994）。其中，第一步是提出問題和假說；第二步是根據提出的研究問題和假說去找數據，或者通過設計實驗產生數據；第三步是做統計分析、檢驗假說的真偽，包括選擇合適的統計分析方法識別因果關係、做因果推斷，避免把虛假的相關性看成因果關係；第四，根據分析檢驗的結果做出解釋，如果是證偽了原假說，那原假說為什麼錯了？如果驗證了當初的假說，又是為什麼？這裡挖掘清楚「因」導致「果」的實際傳導機制甚為重要。為給出令人信服的解釋，既可通過統計方法認證邏輯傳導機制，也可通過簡單數學模型驗證傳導機制的邏輯一致性；第五步就是寫報告或者文章，把科學過程研究出的結果報告出來。

傳統的歷史研究範式基本停留在上述科學方法的第一和第二步，也就是要麼先提出問題或假說，覺得「歷史應該是這樣」，然後去找歷史個案或少數幾個案例，只要假說與這些個案相符，就認為假說對歷史的解釋是成立的。或者，先通過對歷史個案的透徹研究，學者得出關於歷史現象中因果關係的假說或猜想，認為歷史中就是這樣由這個「因」導致那個「果」的，然後研究就到此結束。——但是，從上面講到的科學研究流程看，這顯然只是研究過程中的一步或兩步，不是全部過程。史料整理是建立歷史資料庫的基礎，在沒有經過大樣本檢驗之前，這些假說和猜想還僅僅是假說，不一定真的成立。

量化研究是在傳統研究方法的基礎上，把科學方法中的第二步（收集大樣本數據）做好、做完，並且把第三、第四步也做完。只有這樣得到的對歷史現象背後的「歷史規律」，才讓人能接受，才能避免「以偏概全」。所以，量化歷史方法是對傳統方法的補充，而不是取代。量化歷史研究也不只是簡單的「用數據說話」。數據是量化研究的基礎，但這只是其中一個環節，同樣重要的是要根據歷史大數據對我們感興趣的猜想進行統計檢驗，看這個猜想是否能得到大樣本的支持，而這一點是傳統歷史方法難以做到的。過去，胡適也講過「大膽假設，小心求證」，只不過當時他所講的求證，還只是一般的尋求證據（主要是文獻方面的），並不是統計學分析與大樣本檢驗。比如說，到底是什麼導致清朝滅亡？一種假說（僅僅為假說）是：因為晚清立憲改革所致，並據此得出結論說「不能進行憲政改革，因為憲政改革導致國家滅亡」（King、Keohane、Verba，2012，2004）。根據清朝的個案經歷得出這樣的結論，就好比「阿炳二胡拉得好，是因為他是瞎子，所以任何人要拉好二胡，必須先把眼睛搞瞎」，這顯然有問題，是以點帶面。我們必須先收集中國與其他國家的憲政改革歷史樣本，進行系統統計檢驗，排除個案的特殊因素，讓樣本中的共同因素——憲政改革——突出出來，凸顯「歷史規律」的內涵，只有這樣才能知道這個假說到底能否站住腳。

三、歷史研究能夠量化嗎？

在歷屆量化歷史講習班和年會及其它交流中，一個經常聽到的問題是：歷史能夠量化嗎？初看，這問得有道理，因為許多歷史現象和因素確實難以量化，即使是今天，有許多事物，包括情感等因素都難以量化。但是，難以量化不等於都不能量化，尤其不等於要放棄想像力、放棄創新的努力。只要努力創新，很多因素還是能夠量化的，儘管有時候並不一定那麼完美。

以香港科技大學龔啟聖和山東大學馬馳騁最近的一份研究為例，他們的核心問題是如何測度儒家文化的影響並評估其實際貢獻（Kung、Ma，2014）。我們都說儒家文化過去兩千多年對中國社會貢獻巨大，是中華文化的基礎。但如何證明儒家文化的積極作用？其發揮作用的方式或者說機理到底是什麼呢？儒家文化的成本很高，尤以對個人自由與權利的壓製為突出，其核心原則是以君與臣、父與子、夫與妻的「三綱」為基本出發點，把每個人從出生到死都固定在一個根據輩份、年齡、性別決定的名分等級秩序之中，並基於「父為子綱」的原則推演出「孝道」規則，要求子女對父母無條件服從、聽話；基於「夫為妻綱」推演出「在家從父，出嫁從夫，夫死從子」的「三從四德」婦道規則。再在這些原則上輔以「父母在，不遠遊」、「父母之命、媒妁之言」的「包辦婚姻」等「仁義理智信」細則。雖然各社會都會倡導「仁義理智信」，但其仁、其義、其理、其智、其信的內涵既有共同普適性，又有每個文化特定的基本原則下所要求的獨特內容。比如，按照儒家的「禮」，在清代，如果父親打死兒子，未必會上刑，但在西方文化體系里，「禮」的範疇就不會這麼容忍，這就會上刑。那麼，基於儒家名分等級秩序所實現的資源分配結構、收入分配體系，要求個人特別是女性犧牲這麼多、代價這麼大，帶來的貢獻是什麼？貢獻有多少？學術領域鮮有對這些問題的量化答案，原因當然是文化很難量化。

龔啟聖、馬馳騁嘗試用間接代理指標來量化「儒家文化影響的強弱」，亦即，用各縣文廟或孔廟數量測度儒家文化的影響強弱：孔廟越多，儒家在當地的影響就越強。此外，自漢代開始政府實施旌表節烈婦女的制度，但直到宋代以前，婦女守節、殉節的現象有但並不普遍，再嫁、改嫁行為也還經常發生。宋代理學家程頤、朱熹按照「存天理，滅人慾」、「餓死事極小，失節事極大」的思路，強調寡婦再嫁就是失節。朱元璋1368 年創立明朝後，即頒布詔書：「民間寡婦，三十以前夫亡守志，五十以後不改節者，旌表門閭，免除本家差役。」（郭松義，2001）1723 年清廷規定將旌表標準縮短至守節十五年，其後又分別於1824 和1871年進一步縮至十年和六年。正因為守節是儒家「養子防老」體系的價值延伸，一個縣的列女數量也大致能反映當地人對儒家文化看重、遵守的程度。就這樣，他們找到了量化儒家文化的兩個代理變數。

龔啟聖、馬馳騁研究的目標是清代1644-1910年間山東107個縣的農民暴動情況，看儒家文化是否會顯著降低各地遭遇災荒衝擊時農民暴動的衝動。通過檢索《清實錄》等資料，他們發現，清期間山東南部各縣農民暴動最頻、次數最多，其次是青島周邊山東東北角的這些縣；而孔廟數量的分布則倒過來：中部各縣孔廟數量最多，以南部和北部縣為最少。在排除各種其它因素的影響之後（包括每個縣的收入水平、起初發達程度、教育水平、社會流動性等），受儒家文化影響越深的縣（即孔廟數量或列女數量越多），即使遭遇災荒衝擊（通過糧價高低測度災荒嚴重度），其在清代農民暴動的頻率也更低，尤其以南部縣域孔廟少、暴動頻，而中部縣域則反之。而之所以有這樣顯著的結果，機理在於：儒家文化影響深的地區，家族宗族網路越強，在面對災荒衝擊時宗族內部互通互助的程度就越高，亦即隱性互相保險的程度就越強；這就減少災荒迫使農民走投無路、求助於暴力的必要性。在缺乏保險市場等金融產品的社會裡，儒家文化就是這樣促使社會穩定、減少暴力衝突的。

或許我們可以對他們的量化研究提出質疑或者提出改進建議，但是，他們的創意價值顯而易見，不僅增加了我們對清朝歷史的理解，而且給我們提供了研究儒家文化以及其它文化的新方法，深化對文化影響社會、影響生活的機理的認知，不再泛泛而談。

另一個用量化方法研究文化史的範例是針對韋伯《新教倫理與資本主義精神》中學說的研究。在1905年出版的這部經典著作中，韋伯基於個案定性論述了資本主義之所以發生在西方，是因為16世紀「新教改革」。但是，他的學說在當時沒有得到量化檢驗，只是解釋資本主義為什麼發生在西方的眾多學說之一。

那麼，如何檢驗韋伯的新教倫理命題呢？由於今天沒有哪個國家是純粹的新教國家，所以，只能大致上按新教徒是否佔比最高把基督教社會分為「新教」和「天主教」兩組，同時在量化研究中盡量以新教徒占人口之比為反映新教文化的代理變數。這樣，英國及其前殖民地美國、加拿大，荷蘭、丹麥、瑞典、挪威和新教改革發源地德國等，這些以新教為主的國家構成「新教」國家組，其中美國、英國、加拿大、澳大利亞、瑞士受加爾文宗影響尤深。相比之下，歐洲南部國家及地區，如義大利、西班牙、葡萄牙、法國南部，還有各拉美國家、菲律賓等西班牙與葡萄牙的前殖民地，都以天主教為主，這些國家構成「天主教」國家組（亦即，拒絕16世紀新教改革的社會）。

到20世紀，這兩組國家的差別顯而易見：新教國家的人均收入最高、金融市場最發達、民主法治最完善。天主教國家雖然總體上也富有，但在許多方面落後於新教國家，尤其是西班牙，直到1975年才走出長達幾世紀的混亂（La Porta, Lopez-de-Silanes, Shleifer, Vishny，1998，1997；Acemoglu, Johnson, Robinson，2005；Woodberry，2012）！佩雷菲特在《信任社會》中，從多個維度比較16世紀以來新教國家與天主教國家的差異表現。在20世紀里每百萬人口得諾貝爾獎人數（佩雷菲特，2005）、20世紀人口密度與城市化（佩雷菲特，2005）、政府清廉指數以及綜合競爭力（佩雷菲特，2005）這些指標上，新教國家都排在前面。

為什麼20世紀新教國家表現那麼突出，超越天主教國家那麼多呢？歷史學者結合定性和定量分析對其做了深入闡釋。16世紀新教改革前，天主教主導並規範歐洲社會的方方面面，連笑都受管制，追求利潤的商業行為和金融就更受羅馬教廷的規制了（佩雷菲特，2005）。在哲學層面，對人際間的互助與社會關係，天主教跟儒家的主張基本相同，就是以「義」而不是以貨幣化的市場交易規範人與人之間的互通互助，這就導致天主教對商業和金融的排斥，反對任何以利潤為目的的商業。在孔子看來，「君子義以為上」(《論語·陽貨》)，「君子義以為質」(《論語·衛靈公》)，即君子立身行事應以道義為本，道義價值重於物質利益。在天主教里，教會法第142條明確規定，「嚴禁神職人員自己或替別人從事批發交易或經商，不論這是為自己還是為第三這謀利。」這道禁令雖然不是針對一般教徒，但對於教徒的要求也基本類似，認為一個人不可能同時既做商人又是好基督徒，「經商的人幾乎不能，甚至從來也不能令上帝滿意」（佩雷菲特，2005），死後會被打入地獄的！天主教對商業的敵視，受亞里士多德的影響很大，他在《政治學》中論述道，「以鞋為例：同樣是使用這雙鞋，有的用來穿在腳上，有的則用來交易。那位把鞋交給正在需要穿鞋的人，以換取他的金錢或食物，固然也是在使用『鞋之所以為鞋』。以有餘換不足，『交易』原來是自然地發展起來的。」但如果交易的目的不是滿足自然需要而是為了贏利，則交易是不自然的，因此要受到禁止。

既然對待一般商業利潤的態度如此，對待「用錢賺錢」金融交易的敵意就更不奇怪。在《聖經·申命記》第23章中，第20段說「借給你兄弟銀錢、食物，或任何能生利之物，你不可取利。」第21段說「對外方人你可取利，對你兄弟卻不可取利，好使上主你的天主在你要去佔領的地上，祝福你進行的一切事業。」正因為教會理念中天下人都該兄弟姐妹，所以，相互無償幫助才體現「義」和「禮」，而假如在他們面對困難、需要幫助之時你還收取利息，這絕對不是上帝容許的；如果你取利，在死時你會被打入地獄，而不是進天堂！如果教義不鬆動有關商業利潤、出借獲利的金科玉律，經濟尤其金融市場是難以突飛猛進發展的，資本主義自然受到教義的阻止。

雖然基督教教義如此排斥商業和金融，但是，到了16世紀，人們的現實生活已經離不開商業甚至金融，儘管這些活動只能在教會禁令的陰影下進行。這個背景加上羅馬教廷的腐敗為16世紀的新教改革奠定了基礎，其中有三位牧師發揮了關鍵作用，他們的論述構成了韋伯談到的「新教倫理」的核心。首先是日內瓦教堂的加爾文，他整個重寫了基督教的商業倫理。在1560年《基督教原理》第三卷第14章中，加爾文說到：「那些富有的人，現在心有慰籍的人，喝得酩酊大醉的人，開懷大笑的人，睡在象牙床榻上的人，財富應有盡有的人，他們的宴會有豎琴、詩琴、鈴鼓伴奏，還有玉液瓊漿，這些人為何要遭詛咒呢？誠然，象牙、黃金和財富皆為上帝的美麗造物，允許、甚至是專供人享用的。開懷歡笑，一醉方休，購物置產，奏樂助興，暢飲美酒，在任何地方都不遭禁。這是確實的。但是，一個大富豪，尚若沉湎於尋歡作樂，醉心於及時享樂，並無休止地追求新的享樂，那麼他離健康、正當使用上帝的恩賜就相去甚遠了。」（佩雷菲特，2005）加爾文的口號是：讓上帝的所有恩賜都產生效益，包括個人的天賦（即人力資本）。加爾文也為有息放貸正名，因為在他看來，既然把房子租出去可以收房租，把土地租出去可以收地租，為什麼把錢租出去不能收息呢？

另外兩位是伊拉斯謨和馬丁·路德，這兩位神學大師聯合起來對羅馬教皇發動攻勢。1516年2月，伊拉斯謨倡導結束教會對《聖經》闡釋權的壟斷，並挑戰道：「為何把屬於所有人的共同信念局限在少數幾人身上？將教義交給神學家或僧侶等少數人掌握是不合邏輯的。」「那些想禁止無知者閱讀譯成通俗文本《聖經》的人，我與他們的意見強烈地不同……我期望所有的女子都能閱讀《聖經》。」（佩雷菲特，2005）馬丁.路德跟伊拉斯謨一樣，認為教皇過度腐敗，並通過他的多部著作告誡人們不要聽信羅馬教廷，尤其不要相信教皇是上帝在人世間的代言人，呼籲所有人自己去閱讀《聖經》並直接跟上帝對話，而不是經過教會這些中間人！

因此，歷史學者看到新教倫理跟傳統天主教的主要分岔在於兩方面：一是新教允許甚至鼓勵信徒發揮才華去經商，追求利潤，包括從事金融放貸事業；二是鼓勵信徒接受教育，讓自己有能力讀《聖經》並與上帝對話。根據這兩點，量化歷史學者得到的假說是：在16世紀之後，新教國家的識字率和一般教育水平開始超前於天主教國家，在人力資本方面取得優勢，由此在之後幾個世紀里在人均收入、社會綜合發展等各方面超越天主教國家。

這樣，研究的焦點就集中比較在新教與天主教國家之間人力資本，即識字率的差異上。但問題是識字率、教育普遍性這些歷史數據如何獲得呢？歷史學者查到歐洲各社會婚書檔案，看個體在婚書上是正式簽名，還是只畫了個「十」字或乾脆聲明「不會簽字」（Emmanuel Todd，1990），這跟中國人以前不讀書識字的人畫押簽字一樣。如果一個人能簽名，就認為他能讀書；否則，就認為他是文盲。圖1根據每個國家超過50%的男子（以20—30歲年齡段為樣本）脫離文盲為時間標誌，標記西歐各國。可以看到，新教為主的瑞典、丹麥、荷蘭、德國以及英國一些地方在1700年以前就達到半數男性脫盲，而英國北部、法國北部、比利時、奧地利則是18世紀完成半數男性脫盲，而義大利、西班牙、法國南部這些天主教社會則要等到19世紀甚至20世紀了！

陳志武：量化歷史研究的過去與未來

圖1 歐洲不同地區哪個時期實現了年輕人掃盲過半？

（圖片來源：佩雷菲特《信任社會》，第72頁）

以瑞典為例，那裡的路德宗（新教派之一）在17世紀發動了多次掃盲運動，到1700年超過80%的青年能讀書寫字（佩雷菲特，2005）。而另一個極端是義大利，義大利是文藝復興的發源地和中心，於14、15世紀翻譯、印刷了大量古希臘著作。在新教改革運動之前的1480年，義大利比任何其它地區都擁有更多活字印刷機，引領著歐洲文化發展。可是，義大利社會在16世紀的新教改革中堅決站在天主教保守派一邊，不鼓勵人們自己去閱讀《聖經》，對教育不熱衷。要到19世紀末期、20世紀上半葉，義大利才實現半數年輕男人掃盲的目標（佩雷菲特，2005）！在800—1600年間，西方科學發現與科技發明中有25%到40%是義大利人做出的，而1726年後，他們的貢獻下降到3%左右（佩雷菲特，2005）。可見，在新教改革後，選擇守住天主教對義大利帶來的代價很大，倒退嚴重。

圖2引用佩雷菲特《信任社會》統計表3中的數據，表明到1850年為止，文盲人口佔比跟新教徒佔比之間是嚴格負相關的，也就是說，由於新教教義反對教會的壟斷，主張教徒自己讀《聖經》，新教社會對教育的重視就顯得很自然。到1890年，以小學教師占人口比例算，總體上仍然是新教國家排在前面，天主教國家落後（佩雷菲特，2005）。

陳志武：量化歷史研究的過去與未來

圖2 1850年歐洲文盲率與新教徒人口比的關係

（數據：佩雷菲特《信任社會》統計表3）

所以，針對分別受新教文化和天主教文化影響的兩類國家做的量化對比研究，發現主要因為兩個體系對教育的態度和政策決然不同，導致這些國家在16世紀後發展路徑的大分流（Cipolla，1969）。也就是說，韋伯命題得到了教育歷史數據的支持（Becker、Woessmann，2009）。在一份基於歐洲的量化歷史著作中，Van Zanden、Buringh, Bosker對比西班牙、義大利等天主教國家跟英國、荷蘭這些新教國家的議會制度發展史（Van Zanden、Buringh、Bosker，2012），發現：雖然議會於12世紀首先出現在西班牙，並隨後從歐洲南部往其它城邦擴散，但從16世紀開始出現嚴重分化，根據議會每年實際開會次數和對國王的權力制衡程度評估，到18世紀末期，西班牙等天主教國家的議會已基本不發揮太多作用，而英國、荷蘭等國家的議會對王權構成實質性制約。議會權力的差別導致了新教國家和天主教國家之後的發展差異。Woodberry用跨越五大洲的樣本，更系統地對新教、天主教在不同國家的傳播史所帶來的人力資本與發展史影響做量化研究，並以此解讀各國今天的民主民生差別（Woodberry，2012，2011）。

實際上，白營和龔啟聖在他們2015年發表的論文中（Bai、Kung，2015），研究了基督教在中國傳播兩個世紀後帶來的影響，樣本為1175個縣。他們發現：到1920年為止新教徒越多的縣，其城鎮化率和總體發達程度越高；相對而言，天主教徒的數量多少對一個縣的發展的影響並不顯著。而之所以新教的影響很顯著，也主要是因為他們在當地辦學校、開醫院，既育人治病又傳播知識，影響當地的人力資本發展，這些影響持續到了今天。這些研究加深了我們對基督教在中國的發展史的理解。

當然，我們可以例舉更多文化史量化研究的著作，但基本結論是一樣的：有許多表面看上去不能量化的研究課題，其實只要我們發揮想像力，還是可以找到代理變數，或者通過創造性研究設計把不容易量化的研究變得可以量化。其中，經常跟蹤研究文獻、了解其他同仁的研究動態，也可以拓展自己的視野，增加研究想像力。

四、量化歷史研究不只是「用數據說話」

1950年代以及之後的幾十年里，如果歷史學者能用數據說話，那可能就算很前沿的量化歷史研究了。諾斯、麥迪森、西波拉等歷史學家，以及中國史學界的吳承明、何炳棣、趙岡、郭松義、李伯重等史學家，都是這方面的開拓者，包括估算GDP、收入、識字率、經濟規模、耕地面積、城市化率、家庭數據等等。他們通過收集資料、量化各種指標，然後計算相關係數或者通過畫圖展示相關性，並把相關性看成因果關係，得出結論。相對於早期的定性研究而言，他們做的已經是非常量化的研究。當然，我們知道相關性不等於因果關係，他們做的主要是描述性的，完全的量化研究必須做更多，需要對因果關係進行統計檢測。

也正因為以上原因，許多歷史學者就說「量化史學只是把歷史學家已經知道的結論用數據說一遍」！但這是一個比較普遍的誤解。統計檢驗的價值之一是讓我們在針對同一歷史現象的多種假說中排除一些假說、支持一個或幾個其他假說，而如果沒有量化檢驗的方法就很難做到這一點。比如，最近南京師範大學地理學教授吳慶龍領導的考古學家和地質學家團隊在《科學》（Science）雜誌發表一篇文章（Wu et al，2016），稱已經找到發生過一場大規模洪水並由此導致夏朝誕生的證據，說這可能就是一些中國史書中提到的那場大洪水。之所以大洪水會發生，是因為地震引起山體滑坡，形成了橫跨黃河的巨型天然堤壩，使從青藏高原流過來的黃河水無法穿過積石峽，這樣，在6至9個月時間裡，河水都匯聚在壩體後邊新形成堰塞湖。接著，壩體在湖水漫過壩頂之際迅速潰決，這是過去一萬年來規模最大的洪水之一。潰壩洪水可能向下游奔涌了2000公里之遠，沖毀了黃河的天然河岸，令許多地方被淹，甚至導致了黃河改道，使接下來的治水挑戰史無前例，催生夏朝的形成。

我們況且不管吳慶龍教授團隊的結論能否最終得到更多證據的充分證明，他們的研究之所以引起轟動，就是因為到目前為止還沒有考古證據證明夏朝的存在，同時關於其存在過的假說很多。那麼，如果有任何考古證據排除其中一些假說並同時支持另外一些假說，其學術貢獻就很大。許多歷史事件的解釋也面對同樣的挑戰：假說或學說很多，但難以找到公認的方法和證據排除一些、保留另一些。

比如，關於傳統中國社會的高利貸，解釋就很多，既有剝削論，也有道義經濟論、市場供需關係論等等。那麼，到底哪一種假說更接近真實呢？以前，許多歷史學者通過個案做了解釋或佐證，但，不管清代、明代還是其它朝代，借貸交易全國每天有千千萬萬起，交易關係和交易結局千差萬別，佐證學者自己觀點的例子應該都能找到。所以，各種學說都有提出，都難以被否定。但是，哪種假說最能反映其中的主要規律呢？陳志武、林展和彭凱翔利用清代1732—1895年間刑科題本中近5千命案記錄（陳志武、林展、彭凱翔，2015），對民間借貸雙方的關係進行了定量分析。他們發現，在借貸糾紛引發的命案中，一旦借貸利率高於零，被打死方為貸方的概率為60%，而且利率越高，被打死的是貸方的可能性也隨之增加，這說明一旦發生債務違約，貸方面對包括生命風險在內的違約成本是不對稱地更高。這一發現與傳統「高利貸剝削」論和放貸者「超經濟強制」論的推斷相反，但道義經濟論可能最接近歷史真實，因為在他們的借貸命案大樣本中，如果借貸是無息，被打死的一方更可能是借方，但借貸利率越高，被打死的一方越可能是貸方。而之所以是這樣，一個重要原因還是在於哪一方有「道義制高點」、「哪一方理虧」。這些基於量化研究的結論，一方面說明歷史現象遠比簡單假說要複雜，另一方面說明高利貸的成因之一是民間借貸背後包含了不小的生命風險，這些高生命風險迫使借貸利率必須高，否則沒有人願意把錢放貸出去，這符合我們今天熟悉的市場邏輯。如果忽視契約執行時可能的暴力衝突所要求的風險溢價，人們可能難以完整解釋民間借貸的高額利率。

在本節結束之前，我們用一篇經典著作說明為什麼量化史學不只是簡單的用數據說話。還是回到歐洲何以崛起的話題，Acemoglu、Johnson、Robinson於2005年發表的《歐洲的崛起：大西洋貿易、制度變遷與經濟增長》（Acemoglu、Johnson、Robinson，2005），在經濟學界和史學界產生了轟動，也大大強化了筆者對經濟史話題的興趣。關於歐洲的崛起或說西方的興起，有許多不同學說，韋伯將其歸結於新教改革，諾斯和托馬斯在《西方世界的興起：新經濟史》將其歸結於16世紀之前就已經在西歐開始的產權制度發展，Mokyr將其歸結到西方學術自由和學術共同體的出現與深化發展（Mokyr，2016），等等。單純從相關性指標看，這些因素的變遷在時間上大致都與西方的崛起相重疊，高度相符。那麼，到底哪個學說更站得住腳呢？

Acemoglu、Johnson、Robinson從大西洋貿易的角度提出新的假說並對其進行系統量化驗證。首先，他們發現並不是所有歐洲國家和城市都在同時同步崛起，歐洲從1500年到1850年的興起主要是因大西洋貿易國家（英國、荷蘭、法國、葡萄牙、西班牙）而起，跟沒有參與大西洋貿易的歐洲國家或地區關係不大。以城市化率為發展的衡量指標，那麼，1300年時，大西洋貿易國的城市化率為8%，低於其它西歐國家的10%平均城市化率），到1500年為10.1%（也低於其它西歐的11.4%平均水平），但到1850年升到24.5%（遠高於其它西歐的17%平均值）。如果以人均GDP衡量，對比基本一樣：從1500到1820年間，大西洋貿易國人均GDP翻了兩倍，而西歐其它國家則只累計增長30%！這些數據說明，在16世紀後期大西洋貿易開啟之前（以與美洲、亞洲和非洲的貿易為主），大西洋國家並不領先於歐洲其它國家，但之後卻大為不同，出現騰飛。所以，16世紀之後的增長特點顯然不同於之前，跟諾斯和托馬斯講的「16世紀之後的增長只是延續了之前的增長結構」相矛盾。

第二，同一時期，大西洋海港城市的增長遠高於歐洲內陸城市的增長，而地中海海港城市的增長跟歐洲內陸城市並無明顯區別。

當然，僅僅上面這些結果還不能完全告訴我們這種大分流背後的形成機制。尤其是他們注意到，O』Brien 等歷史學者估算到來自大西洋貿易的利潤實在太小，即使把黑奴以及從美洲運回的金銀財寶包括其中，總的利潤也太小，其本身遠遠不足以給歐洲帶來大幅經濟增長（O』Brien，1982）。鑒於這一點，Acemoglu、Johnson、Robinson提出新的學說，認為大西洋貿易帶來的直接利潤只是一個方面，對長久發展更為重要的是這些利潤培植了一批新富商人群體，這些新富會推動制約王權、保護私有產權的制度變革，使進一步的經濟增長有了更好的制度保障，有恆產才有恆心！

那麼，大西洋貿易模式以及16世紀之前各國的制度就很重要。這三位作者接著把英國、荷蘭跟西班牙、葡萄牙、法國進行對比。西班牙、葡萄牙從15世紀末一開始海洋貿易探險，就是完全由王室壟斷，只有王室和利益相關者才能參與大西洋貿易，利潤由他們獨享，難以培植新的商人群體，也就不容易產生限制王權、保護私有產權體系的變革。相比之下，在16世紀之前，英國、荷蘭的王權就不是那麼絕對，其議會對王權多少有些制約，王權不能輕易侵犯私有產權或禁止私人參與大西洋貿易，這樣，在英國、荷蘭，大西洋貿易更能培植王室圈子之外的新富商人群體，由他們自發產生限制王權、保護私有產權的壓力，促成體制變革。

為了驗證這一假說，三位作者把各歐洲國家在1500、1600、1700和1800年的制度進行量化打分，一國制度中每增加一項對王室權力的限制（比如，只有議會通過才能加稅，大西洋貿易權由議會而不是國王控制）就加一分。結果，他們發現，一方面，參與大西洋貿易的國家在16世紀後對王權的限制顯著增多，而且越往後增加越多，另一方面，在考慮到新教和天主教國家的差別後，大西洋貿易繼續是非常顯著的影響。也就是說，新教和大西洋貿易都對16世紀後的西歐產生顯著影響，但彼此又不相同。

從Van Zanden、Buringh、Bosker的研究中也能看到新教的影響（Van Zanden、Buringh、Bosker，2012），圖3摘自其研究，其中展示了南歐、西北歐和東歐各國議會在不同時期發揮的作用。圖中活動指數越高，表明對王權的限制越多。可以看到，西班牙、葡萄牙、義大利、法國等南歐諸國的議會在15世紀後作用越來越小。大西洋貿易反而使西班牙、葡萄牙、法國變得更加集權，義大利則沒有直接參与大西洋貿易。英國、荷蘭的經歷則和南歐各國恰好相反。

陳志武：量化歷史研究的過去與未來

圖3 12到18世紀歐洲議會活動指數

（以議會每年開會的次數、議案數量為準）

Acemoglu、Johnson、Robinson 進一步通過加入「16世紀之前對王權的限制指數」跟「大西洋貿易量」交互項的回歸證明：歐洲崛起的主要驅動力是大西洋貿易和16世紀之前的制度條件。歐洲崛起的主力是那些16世紀初就不那麼集權的、瀕臨大西洋並參與大西洋貿易的海洋國家。其中原因在於這些國家通過參與大西洋貿易培植了一大批新富商人，他們推動建立了有利於長期發展的產權保護制度，加強了對王權的制約。相比之下，新教改革發揮了一些作用（韋伯學說），但不如貿易與初始制度條件的交互作用那麼顯著。另外，他們的結果否定了歷史學家Kennedy等的學說（Kennedy，1987），他們認為戰爭迫使國家要變得強大，以增加競爭力。可是，當把一國近年戰爭頻率放進歷史回歸分析中時，這個解釋變數的係數是負值但不顯著。

因此，量化歷史方法不僅僅是「用數據說話」，而是提供一個系統研究手段，讓我們能同時把多個假說放在同一個統計回歸分析里，看哪個解釋變數、哪個假說最後能勝出。相比之下，如果只是基於定性討論，這些不同假說可能聽起來都有道理，無法否定哪一個，使歷史認知難以進步。

五、量化史學帶來新認知

有一個流行的說法，「量化歷史研究只能對已有的假說做認證，但出不了新東西」，從前述Acemoglu、Johnson、Robinson的研究中，我們已經看到這類質疑站不住腳。筆者用自己近幾年的一些合作研究說明這一點。

在學界甚至社會中，對中華文明的悠久歷史論著很多，也有大量中西文化對比的論著，但是這些論著基本停留在對中西文化經典的對比、定性討論上，沒有落實到具體的量化指標上。各文明的經典之所以為經典，是因為它們彙集了人類真善美的理想願景，反應了各版本的「仁義理智信」，所以，如果只是停留在基於價值觀的定性判斷上，的確難以有令人信服的比較結論。於是，就有了文化多元論的說法，「不同文化各有各的好」。但是，一個文化體系的優劣、一個社會文明還是不文明，最好是依據量化業績指標來評估。而在這一方面，經濟史文獻做的比較多，從斯密到馬克思、韋伯、諾斯、以及包括Acemoglu、Johnson、Robinson在內的新一批經濟史與社會史學者，都以經濟表現尤其以生產率的量化指標對文化體系做評估比較，於是，哪個文明體系下的人均收入、城市化水平最高或增長最快，那麼，那個文明體系就最優。

可是，除了物質收入、貨幣化收入之外，人類關注的還有「安全感」、「幸福感」這些未必跟物質收入100%相關的發展維度。比如，社會是充滿野蠻暴力、缺乏安全感，還是平和、安定？這些維度可以落實到文明化的具體數據指標上，比如每年每十萬人口中有多少死於兇殺等暴力，一個「更文明」的社會應該是命案率更低的社會，「文明化」應該是一個命案率、暴力率不斷降低的歷程，而文字上「文明了」並非等於事實上的文明化。關於暴力史的研究，到目前基本都集中於歐洲社會，比如Gurr、Eisner、Elias等等（Gurr，1981；Elias，2000；Eisner，2003），他們發現，自1200年以來，歐洲社會的命案率大約下降了60到100倍，文明化進程顯而易見，普通歐洲人的安全感顯著提升！

但是，關於中國的普通暴力史、命案率史，就我們所知，這還是一個空白，沒有系統的研究。基於此，陳志武、彭凱翔和朱禮軍做了嘗試（Chen、Peng、Zhu，2016），利用清代命案要案檔案中的黃冊統計和題本數據等資料，建立並研究了1661—1898年間清代的命案率歷史。他們發現，從康熙朝到嘉慶朝末年,中國命案率（不包括戰爭死亡）一直呈上升趨勢，1820年後開始下降。可是，即使在普通人命案率達到高峰的1820年左右，每年十萬人中只有1.6個死於一般暴力，而西歐同時期每年每十萬人有4到8個死於一般暴力。也就是說，雖然歐洲自中世紀中期開始命案率一直在下降、文明化進程在進行，但是，到17至19世紀，其暴力死亡率還是遠高於同期的清朝中國，到19世紀末才接近中國。在這個意義上定義的「文明化」程度，西歐社會落後於中國，後者比歐洲社會更顯得「溫情脈脈」。

雖然在比較中國和西歐普通人、普通社會的命案率時有以上發現，但是，在更高制度建設層面，結論又大為不同。陳志武和林展對中國自秦朝以來658位皇帝是如何死的進行了系統研究（陳志武、林展，2016），發現38%左右的皇帝死於非命，其中71%是死於親戚或宮廷大臣之手。歷代皇帝的平均統治時間為12.5年。在中國朝代歷史中，每年皇帝死於非命的概率大約是十萬之三千一百左右，比普通人死於非命的概率高一千多倍。按照劍橋大學對現代戰場的定義，每年死亡概率超過十萬分之五百的地方就是「戰場」（battlefield），那麼，中國歷代皇宮裡死於非命的概率是現代戰場標準的六倍！

根據Eisner對600至1800年間歐洲1513個國王的死亡經歷研究（Eisner，2011），22%的歐洲國王死於非命，是中國皇帝死於非命比例的一半多一點；每年國王死於非命的概率大約為十萬分之一千，是中國曆朝皇帝面對的暴力死亡率的三分之一。比較積極的一面是，中國和歐洲的君主所面對的暴力死亡率，從一千多年前開始都在逐步下降，說明中西制度文明都在進步。

同樣有意思的是，當陳志武和林展把900至1500年間中國、伊斯蘭國家和西歐國家的君主平均統治時間做比較（以一百年內的平均統治時間為準），那麼，他們發現，西方國王的平均統治時間在900年時大約為15年，之後一直穩步上升，到1500年左右達到23年；而伊斯蘭國家的君主平均統治時間，在此期間則從當初的18年一直下降，到1500年時降到11年左右（Blaydes、Chaney，2013）；相對而言，中國皇帝平均統治時間既不像西歐國王那樣一直穩步上升，也不像伊斯蘭君主那樣一直穩步下降，而是從隋唐以來，一直在上下波動，沒有達到一個穩定均衡狀態。

按照Blaydes、Chaney所論述的，君主死於非命的概率、君主平均統治時間反映了一個國家的上層制度建設的狀態。權力制衡、權力交接的制度架構越完善，君主權力越小，那麼，君主死於非命的概率會越低（因為在那種情況下，殺死皇帝帶來的好處越少，而代價可能越高），其執政時間也會越長，政局越穩定。在這個意義上，陳志武、林展的研究表明，在上層制度建設方面，西方很早走上改良的發展軌道，而中國皇權體制卻一直在搖擺中停止不前。

這些量化研究結果表明，或許由於在儒家文化之下，祭拜祖先帶來的好處是普通鄉村裡「誰是權威」完全由三綱五常名分等級秩序決定，沒有含糊性，這使得鄉村社會秩序很是穩定，暴力、命案率就不會太高，並且可能很早就低於同期歐洲的普通暴力水平，這是中華文明好的一面。但是，在國家治理層面，儒家建立的「真命天子」的權威並非不可以挑戰，使君主的權威性很模糊、充滿不確定性，所以，君主的生命安全和統治時間遠不如同期的西歐。

從這些量化研究看，西方和中國的文明化歷程很不同。儒家文化早於歐洲解決了社會底層的治理秩序問題，基於中華文明的命案率低於同期歐洲，這個局面一直維持到19世紀末、20世紀初，但儒家沒有解決好國家治理問題，在君主傳承等制度文化建設方面，歐洲更早地發展起來，使權力的分享與交接秩序更早地文明化，致使西歐君主的暴力死亡率很早就遠低於中國皇帝。制度文明秩序降低了君主面對的兇惡風險。由此，我們看到，量化歷史研究不只是幫助證明、證偽歷史學者過去提出的假說，而且也會帶來對歷史的全新認識，引出新的研究話題與視角。

六、結束語

未來十年、二十年會是國內量化歷史研究的黃金期。原因在於兩方面，一是對量化方法的了解、接受和應用會越來越多，特別是許多年輕學者會加入這個行列。二是中國史料很多，但絕大多數史料以前沒有被資料庫化。隨著更多歷史資料庫的建立並且可以低成本地獲得這些資料庫，許多相對容易做的量化史學研究一下子就變得可行，所以，從這個意義講，越早進入這個領域，就越容易出一些很有新意的成果，也越容易發表，十幾、二十年後情況就會不同。

公認、統一的歷史資料庫對量化歷史研究來說非常關鍵，是基礎建設工作。就以金融經濟學為例，1960年由芝加哥大學建立的「CRSP證券價格資料庫」（Center for Research in Security Prices）對之後世界金融學術研究起到了革命性的貢獻，1960年代是金融學研究正式開始從經濟學剝離出來的起點，而如果沒有CRSP證券資料庫，實證金融學的突飛猛進可能要大打折扣！原因在於，有了公認、統一併且學者都很熟悉的資料庫之後，各路學者就不用花時間去爭論數據來源是否可靠了，而是把精力和爭論都集中在所研究的問題上。金融學的經歷對量化史學有很高的借鑒價值。

沒有充分、完整、公認可信的史料（包括能量化和不能量化的史料），研究當然無法做。所以，過去十幾年我們團隊一直致力於建立基礎資料庫，希望更多同仁也能共同努力，挖掘出更多歷史資料庫資源。這也需要各家歷史檔案館、博物館、文物館給予幫助，如果他們把更多史料開放並電子化，那會是對歷史研究、對中國社會功德無量的事情。特別是對於年輕學者而言，由於他們經費和時間都有限，更多歷史檔案的電子化以及成本壁壘的降低都是非常關鍵的，這些會決定國內學術事業是否能順利發展。在這些方面，技術條件都已經成熟，只是歷史檔案是否能開放、是否有經費的問題。

量化歷史研究的發展也需要各家學術期刊的支持，需要他們開放更多空間讓這類論文發表，激勵更多學者熱情加入。同時，這也對歷史系教學課程提出新的要求，就是歷史學生都應該學習數理統計課，而不是像現在很少或沒機會跟統計學沾邊，這個局面要改變。

最後，我們也應該看到，雖然量化史學強調使用現代社會科學尤其經濟學的分析範式、重視大樣本與統計方法，但是，量化歷史研究不只是找到一組歷史數據並對其進行回歸分析，然後就完成研究了，而是也要認真考究史料、摸清史料的歷史背景與社會制度環境。只有這樣才能更貼切把握所研究的因果關係鏈條和傳導機制，增加研究成果的價值。

關注訂閱號的同時，我們也誠邀八方學人發送電郵建言獻策。「量化歷史研究」旨在凝聚一批對歷史研究有激情、有熱情的朋友，共同推動以量化研究方法研究經濟史，金融史、政治史、社會史、文化史等各類歷史題材，分享觀點，共享資料。我們的郵箱：lianghualishi@sina.com。期待您的聲音！

輪值主編：何石軍責任編輯：彭雪梅

請您繼續閱讀更多來自 量化歷史研究 的精彩文章:

※降低收入差距真的需要打土豪嗎？──來自滿鐵的調查證據
※一朝被蛇咬，十年怕井繩：個人經歷與擔保貸款風險承擔
※高校質量對博士生的培養重要嗎？基於納粹德國驅趕教授的證據
※影子銀行：銀行危機的放大器
※集體主義與個人主義的歷史起源：來自新石器時代的證據

TAG:量化歷史研究 |

您可能感興趣

※陳志武：量化歷史研究的過去與未來（上）
※致勝未來：彭博量化組合管理研討會
※馬德斌：量化史學展示更立體的歷史影像
※丁榮晶：從最佳心臟康復研究談行為干預需要量化
※《建軍大業》任何事情都可以娛樂化、流量化，唯有歷史不可以！
※袁姍姍把負能量化為正能量
※從騰訊到高盈量化雲，看人工智慧的燎原之勢
※經濟學必須超越螞蟻的視野——「不能量化」證偽了勞動價值論嗎
※用科技量化無形的心理亞健康，心潮科技另闢新思路
※蔚來聯手康得復材，推進輕量化車身規模量產
※機器的意識可以量化嗎？馮諾依曼體系無法誕生超級智能
※量化投資的進化之路（二）
※長線穿越歸來談談惡劣天氣下的輕量化裝備
※PPT|污泥處理如何減量化？桑德勞逸帶來電滲透污泥高幹脫水新技術
※李靖：人工智慧技術高速發展環境下量化投資的新視角
※遊走在城市與戰術邊緣：輕量化主義者所青睞的TT基礎雙肩包
※定位四步驟和八方法-《可以量化的管理學》
※粉煤灰資源化、無害化、減量化處理
※如何量化考察航天技術民用的經濟效益？