文獻介紹:社會科學研究中的因果推論
文獻來源:
1.中室牧子、津川友介『「原因と結果」の経済學:データから真実を見抜く思考法』ダイヤモンド社、2017
2.飯田健、松林哲也「選挙研究における因果推論の研究動向」『選挙研究』27巻1號、2011
《「原因與結果」的經濟學:從數據看透真實的思維方式》
本書一開始便向讀者提出三個問題:定期接受體檢的話會變得更加長壽嗎?讓小孩看電視會使其學習成績下降嗎?上了錄取分數線較高的大學以後的收入會更高嗎?雖然很多人的回答會是Yes,然而經濟學的有力研究卻對這三個問題全部給出了否定的答案。
對以上三個問題給出肯定答案的人,錯在混淆了「因果關係」和「相關關係」兩個概念。所謂因果關係,是指兩件事情當中一件作為原因發生,另一件便會作為結果出現。而所謂相關關係,是指兩件事情看上去雖然一方變化另一方也會變化,但其中並不存在原因和結果的關係。雖然定期接受體檢與長壽之間存在一定相關關係,然而我們卻不能據此就說「因為定期接受體檢,所以壽命會變得更長」。
確定因果關係一般需要確認三點:第一,是否純屬偶然;第二,是否存在「第三變數」;第三,是否存在「相反因果關係」。美軍情報分析員泰勒?維根(Tyler Vigen)在其著作《虛假相關》(SpuriousCorrelations)中介紹了大量令人咋舌的相關案例,例如1999年至2009年美國在科學、太空、科技方面的投入與同年度通過上吊和窒息方式自殺的人數的相關係數竟高達0.9979!然而即使如此,我們也不能說「因為美國在科學、太空、科技方面的投入增加了,所以通過上吊和窒息方式自殺的人數變多了」,他們之間的這種關係完全是偶然存在的。
在社會科學中判明因果關係絕不是一件容易的事情。原因在於,要證明因果關係的存在,就必須將原因發生情況下的「事實」結果與原因不發生情況下的「反事實」結果進行比較。但是,人類無法通過時光機回到過去,因此也就無法製造並觀察「反事實」情況下的結果。為了克服這一困難,社會科學家一般通過「最佳相似值」來替代反事實的結果。例如,一家連鎖珠寶商店部分店鋪進行了廣告推廣,部分店鋪沒有進行廣告推廣。雖然我們不能直接觀察到進行廣告推廣的店鋪如果不進行廣告推廣的營業額會是多少,但是我們可以用未進行廣告推廣的店鋪的平均營業額來代替這一反事實結果。
進行因果推論的一種比較理想的形式是「隨機化比較試驗」。例如,在測試新葯時通常會把生病的小白鼠隨機分為兩組,然後比較使用藥物的「實驗組」和未使用藥物的「控制組」之間的治癒率,以此來確定藥物是否有效。之所以必須將「原因」進行隨機分配,是因為按照人類自身意志所做出的選擇往往會出現「選擇性偏差」(selection bias)。例如,定期接受體檢的人往往具有更高的健康意識,而不進行體檢的人往往健康意識比較淡薄,因此我們無法直接將兩者進行簡單的比較。
運用隨機化比較試驗的一個經典案例是「蘭德醫療保險實驗」。該實驗是美國經濟學家約瑟夫?紐豪斯(Joseph Newhouse)在蘭德公司工作期間帶領進行的,於1971~1986年間以美國6個城市2750戶居民為對象實施。為了進行該實驗,紐豪斯團隊專門開設了一家民間醫療保險公司,為研究對象提供免費的醫療保險。然而,保險的醫療費個人負擔比例是由紐豪斯團隊隨機進行分配的。其中,控制組的醫療費個人負擔比例為0,三個實驗組的醫療費個人負擔比例分別為25%、50%、95%。研究結果表明,醫療費的個人負擔比例越高,每個人的年均醫療花費便會越少,並且每個人的年均就診次數也會更少(負擔為0與負擔為95%的組間差距大約有30%)。然而,醫療費的個人的負擔比例和健康狀態之間卻並沒有發現因果關係,在高血壓等30項健康指標方面,控制組和實驗組並沒有表現出具有統計顯著性的差異。也就是說,提高醫療費的個人負擔比例並不會導致健康狀況的惡化,相反卻可以防止小病大醫,節約國家總體醫療費用。不過需要注意的是,如果只看低收入人群樣本,個人醫療負擔比例的增加確實導致了健康狀況的惡化。
「隨機化比較試驗」雖然較為理想,然而卻並不容易實施。將作為研究對象的人進行隨機分組不僅難以操作,而且可能招致研究對象的反感,甚至出現有違倫理的情況。相比從隨機化比較試驗中獲取的實驗數據,研究者更經常使用的是從日常經濟活動的結果中得到的數據、從政府的統計調查等得到的數據等觀察數據。在使用觀察數據的時候,我們首先應該考慮的是能不能找出「彷佛進行了人為試驗一樣」的情況。例如由於法律或制度的變更、自然災害、衝突等任何人都想像不到的變化,導致類似進行了隨機化比較試驗一樣的情況出現,因此可以判明兩個變數之間的因果關係。這種方法可以稱作「自然試驗」。例如,如果想探究「醫生性別」與「患者死亡率」之間是否存在因果關係,我們可以將美國的院派醫生(hospitalist)制度看作一種自然試驗。由於院派醫生不能主動選擇自己的患者,患者也不能主動選擇自己的院派醫生,因此可以將此看作是將患者隨機分配到男性醫生和女性醫生中的一項自然試驗。根據學者津川有介的研究,女性醫生擔當的患者要比男性醫生擔當的患者30日死亡率低出0.4%,這一死亡率差大致相當於美國10年時間通過各種努力所降低的患者的死亡率。
《選舉研究中因果推論的研究動向》
在日本的政治學和社會學研究中,高根正昭1979年的著作《創造的方法學》對因果推論的方法進行了最為權威的說明,至今為止仍作為經典教材被眾多大學使用。高根指出了因果關係的三個條件:第一,自變數的變化要發生在因變數的變化之前;第二,兩個變數之間要存在共同變化的關係;第三,其他重要的變數沒有發生變化。其中,高根最為重視的是第三個條件,即是否排除了其他重要變數的影響。考慮到實驗方法在社會科學中應用的困難,高根主要介紹了通過多變數分析對變數進行統計控制的思考方法。然而,通過這種方法進行因果推斷仍存在一些弊端,例如缺少關於需要控制的變數的取捨標準、投入回歸模型的變數過多(有的模型自變數數量甚至超過了20個!)、數據不滿足統計模型的前提等等。
在統計學和計量經濟學中,基於潛在結果模型的因果推斷方法近年來成為主流趨勢之一。潛在結果模型強調觀察同一單位在接受干預和未接受干預狀態下的不同結果。例如,要推斷大學教育對政治知識量的影響,我們就需要觀察同一個人接受大學教育後的政治知識量和沒有接受大學教育的政治知識量。但是,這種觀察其實是不可能的,因為同一個人不可能同時接受大學教育而又不接受大學教育。也就是說,兩種潛在結果中我們只能觀察到其中一種,而另一種可以看作是缺損數據問題。通過數學計算可以證明,如果對眾多樣本隨機進行干預,我們便可以通過比較干預組和控制組的結果來對所有單位根據潛在結果模型計算的因果關係進行一致性和無偏估計。(詳細可參見李文釗:《因果推理中的潛在結果模型:起源、邏輯與意蘊》,載《公共行政評論》2018年第1期)也就是說,如果可以由研究者隨機決定高中畢業生是否進入大學學習,那麼便可以在4年後通過比較進入大學者和未進入大學者的政治知識量,來確定大學教育和政治知識量之間的因果關係。然而如果不進行隨機分配的話,便存在大學入學者在入學之前政治知識量便高於非大學入學者的可能性,即計量經濟學中的選擇性偏差問題。為了克服選擇性偏差,可以選擇在回歸方程中添加一些控制變數。在大學教育與政治知識量的例子中,我們可以將大學入學前的政治關心度以及父母的經濟地位兩個變數投入回歸方程之中。然而,要考慮到影響原因和結果的所有變數是非常困難的,並且有時會存在一些難以觀察的變數(例如一個人的智力水平),因此通過控制變數和回歸方程來推斷因果關係並非易事。
基於潛在結果模型的因果推斷有三類研究設計是比較理想的:實驗設計、准實驗設計(quasi-experiment)、傾向值匹配。研究者能夠通過人為操作的方式對干預變數進行分配的研究設計便是實驗。實驗一般可分為實驗室實驗、田野試驗以及調查試驗。堀內勇作、今井耕介和谷口尚子通過網路調查試驗的方法驗證了政治信息量與投票參與的關係。他們將被調查者隨機分組,分別接觸關於自民黨的信息、關於民主黨的信息、關於兩黨的信息、完全無關的信息。由於分組是隨機進行的,因此可以認為被調查者除了政治信息量之外的屬性是基本近似的,由此可以推論各組之間投票率的差異是由於政治信息量造成的。在准實驗設計中研究者雖然不能直接控制干預變數的分配,但是卻利用因為各種原因產生的近似於隨機分配的狀況作為事例,來做出近似的控制組和干預組。關於准實驗設計時使用的方法,有面板數據分析、工具變數法、斷點回歸等(此處就不一一詳細介紹)。傾向值匹配法是一種基於能夠觀察的性質而人為製造出比較組的方法。例如如果只有性別和年齡會對干預變數的分配產生影響的話,我們便可以找出年齡和性別相似但是干預狀態不同的分組,從而對結果變數進行比較。但是,如果有不可觀察的變數發揮重要作用的時候,由於不能對該變數進行匹配,所以可能會產生選擇性偏差。
(本文作者系政觀特邀作者 神戶大學法學研究科周源)
編後記:
上周,政觀編輯部經過討論決定對政文觀止Poliview的推送制度實行進一步的創新,在堅持編輯部全體成員負主要責任的原則下,試行特邀作者不定期撰文制度,我們也誠懇地歡迎海內外從事社會科學研究的同仁通過我們平台發表高見,但內容需與比較政治經濟學、當代中國研究與政治科學方法論密切相關(我們強調議題導向必須始終遵循高度學術化而非「公知化」的原則)。當然,各位讀者朋友的寶貴意見和善意批評都將一如既往地受到我們的歡迎。


TAG:政文觀止Poliview |