當前位置:
首頁 > 知識 > 爭議與裁決:放棄對因果關係的追尋,就是人類的自我墮落

爭議與裁決:放棄對因果關係的追尋,就是人類的自我墮落

爭議與裁決:放棄對因果關係的追尋,就是人類的自我墮落 點擊播放 GIF/602K



001

說起「因果」,相信更多的是與宗教相關,因為:因果凈土,為成佛之根本。


佛家的因果論一般是指,前世種因,今世得果。今世種因,下世得果。教導人們今世種種全因前世所致,若人們想下世得善果,請今世種善因。


各位模友以為,這期超模君要講佛學?No,No,No…..


超模君借宗教因果論,想引入今天的話題是:數據中的因果關係。

超級數學建模|超模君


邁爾舍恩伯格在《大數據時代》里說,「要相關,不要因果」,在大數據時代,有相關,就夠了。

爭議與裁決:放棄對因果關係的追尋,就是人類的自我墮落



周濤則在《為數據而生》一書中說,放棄對因果關係的追尋,就是人類的自我墮落相關性分析是尋找因果關係的利器。

爭議與裁決:放棄對因果關係的追尋,就是人類的自我墮落



相關性和因果性之間的聯繫,從統計學教材到大數據著作,都有著廣泛的探討,甚至爭議不斷。


其實,相關關係和因果關係,在人們的工作和生活中,都扮演著極其重要的角色,它們單獨或共同影響著我們的行為去向。比如說,經過千百年來的觀察,人們發現,「燕子低飛」和「即將下雨」存在相關性,因此,一旦看到「燕子低飛」,人們就知道「天將下雨」,該收衣服了。


至於因果關係,對我們的影響,就更加明顯了。一方面,做某個事情前,我們總習慣「給我個理由先」。事後,也愛給自己的行為「結果」,找個「原因」。

比如說,「因為我要早晨去上班,所以我必須6點鐘起床」。倘若上班遲到了,給老闆解釋,「因為鬧鐘沒有響,所以我沒能準時起床」。


千百年來,因果關係,已經深深地寫入了人們的思維基因里。


1


何謂因果關係


現在因果關係有著非常明確的定義,通常來說,原因是指引起一定現象的現象,結果是指由於原因的作用,隨之串聯而引起的現象。


因果聯繫的特徵就是,原因在先,結果在後,前者的出現,導致後者。但千百年來,有關因果關係的認知,卻爭議不斷。


下面我們就用一個例子,來說明常規意義上的因果關係。


假設你每天都要到單位上班。顯然,如果交通堵塞,會導致你上班遲到。此外,如果家裡的鬧鐘不響(因此你沒能準時起床),也會導致你上班遲到。於是,我們就用一個如圖1所示的關係圖,來描述這這三者(鬧鐘、交通和遲到)之間的關係。

爭議與裁決:放棄對因果關係的追尋,就是人類的自我墮落



圖1


上圖僅僅列出了兩個最常見的上班遲到原因。實際上,遲到的原因可能還包括,車在路上拋錨了,給孩子們做早餐耽擱了,早起看新聞分心了等等,諸如此類。圖1不可能把所有的這些小因素都包括在內。


為了抓住主要矛盾,認知的模型必須精簡,如上圖所示的模型,只能包括在那些最常見的影響我們上班遲到的因素。那些被我們忽略掉的大量的小因素,可以將其視為「噪音」,將其過濾掉。


事實上,我們還可以進一步構建一個更全面的「因果關係」的模型圖。比如說,我們繼續追尋,交通阻塞的原因是什麼?鬧鐘不響的原因是什麼?


倘若有一場意外災難(如龍捲風),它導致電力中斷,從而鬧鐘不響了(假設鬧鐘是插電式的)。意外災難同樣也導致了交通堵塞。於是我們重新更新圖1,給出了鬧鐘失效和交通堵塞的原因,如圖2所示。

爭議與裁決:放棄對因果關係的追尋,就是人類的自我墮落



圖2


如果時間軸線足夠長,我們可以收集到大數據集合,然後分析發現,在你家的鬧鐘不響時,交通也發生阻塞了,很顯然,這兩個原本「風馬牛不相及」的事物,存在相關性。但我們也清楚地知道,鬧鐘是否響起,和是否有交通阻塞,它們之間是沒有因果關係的。


這就是「相關性並不意味著因果性」的本質。


更明確點來說,相關性是統計上的概念,數據多了,A發生時B發生的概率,足夠顯著,那麼A和B就是相關的。而因果性是邏輯上的概念,A發生導致B發生。類似的還有,例如,看見閃電(A)和聽見雷聲(B)是高度相關的,但它們二者相互之間並沒有因果關係。


相關性分析,不是殺死因果關係的兇手,恰恰相反,它是尋找因果關係的利器。相關性的背後,一定有導致「看見閃電(A)和聽見雷聲(B)」發生的共同原因在起作用。


這些背後的原因,可能不是直接原因,它可能處於「因果關係圖」的「上游」某處。例如,自然災難就是「鬧鐘不響」和「交通阻塞」的背後共因。雷雨天氣是「打雷」和「閃電」背後的共因。


那麼,現在問題來了。


如果那些隱藏於相關性背後的共同原因,能找到則罷,但我們又沒有「天眼」,不能次次都看透相關性背後的玄機,怎麼辦?


不用太擔心,下面我們看看,我們所依賴的科學,是如何工作的,了解之後,你就會對這個問題更加坦然。


現在,假設我們認識的世界,就是根據下圖所示來運轉的。

爭議與裁決:放棄對因果關係的追尋,就是人類的自我墮落



現在,我們想驗證這個假設。在一定程度上,上圖所示的世界是「足夠好」的,因為「鬧鐘不響」是能作為「遲到」的原因的,同樣,「交通堵塞」也可以解釋「遲到」。


因為災難性事件是非常罕見的。所以,一開始,我們很難發現「鬧鐘不響」和「交通堵塞」二者之間,存在什麼相關性。但隨著時間的推移,時間軸線越來越長,在時間域內,越來越多的災難數據可以被採集到。於是,「鬧鐘不響」和「交通堵塞」同時出現的情況,愈發頻繁,並達到了統計上的顯著性。那麼,如果我們還用圖1來解釋整個世界,就顯得有點搖搖欲墜了。


於是,就需要更新我們的認知模型,即用一個雙向端箭頭,把兩個相關的事件連接起來,如圖3所示。圖中雙頭箭頭是表明,有某些不常見的原因,驅動著的「鬧鐘不響」和「交通堵塞」這兩個事件相關。

爭議與裁決:放棄對因果關係的追尋,就是人類的自我墮落



圖3


自然,我們很希望這個背後的原因範圍,能縮小到下圖所示那麼精確。但現實是殘酷的,很多時候,我們所認知的世界是懵懂的。

爭議與裁決:放棄對因果關係的追尋,就是人類的自我墮落



但是,即使我們沒有得到一個上圖所示的精確認知,即使丟失了一些鏈接和變數,在很多時候,這樣的世界已經「足夠好」了。


但科學的進步,就是對「足夠好」的不滿足(Goodenough for Science is not good enough)。


所以,從上面的討論可知,相關性的確並不意味因果性,但卻意味著,在認知圖譜的上游,可能蘊含著某些非常見的共因。對這些非常見共因的探尋,能拓展我們的認知圖譜。


在大多數情況下,一旦我們完成了對大數據的相關關係分析,而又不再滿足於僅僅知道「是什麼」時,我們就會繼續向更深層次研究因果關係,找出背後的「為什麼」


因果關係還是有用的,但是它將不再被看成是意義來源的基礎。


在大數據時代,即使很多情況下,我們依然指望用因果關係來說明我們所發現的相互聯繫,但是,我們知道因果關係只是一種特殊的相關關係。相反,大數據推動了相關關係分析。


相關關係分析通常情況下能取代因果關係起作用,即使不可取代的情況下,它也能指導因果關係起作用。


在日常生活中,我們會習慣性地用因果關係來考慮事情,所以會認為,因果聯繫是淺顯易尋的。


但事實卻並非如此。與相關關係不一樣,即使用數學這種比較直接的方式,因果聯繫也很難被輕易證明。我們也不能用標準的等式將因果關係表達清楚。


因此,即使我們慢慢思考,想要發現因果關係也是很困難的。


因為我們已經習慣了信息的匱乏,故此亦習慣了在少量數據的基礎上進行推理思考,即使大部分時候很多因素都會削弱特定的因果關係。


不過,科學家已經克服了用實驗來證明因果關係的難題。


科學家是如何做的呢?


實驗是通過是否有誘因這兩種情況,分別來觀察所產生的結果是不是和真實情況相符,如果相符就說明確實存在因果關係。


這個衡量假說的驗證情況控制得越嚴格,你就會發現因果關係越有可能是真實存在的。


而現實是,在探究因果關係的過程中,科學家們經常遇到的問題是小樣本集合,所探究的因果數據很多處於長尾部分的案例由於發生概率極低,極有可能無法觀察到


所以,近年熱門的大數據會對因果關係的發展,有著很重要的一個優勢:


就是在長尾應用中,發現稀疏而珍貴的價值——對某些罕見結果的可解釋性,比如某些低頻癌症的病因等,這是極其有用的。


而上文提到的,「相關性並不意味著因果性」,是否有誘因?誰是誘因?誘因的驗證模型是否有概率依據?


這一系列的問題,對探索因果關係時候的求解,提出了數據量(More)和計算效率(Fast)的要求。


文章較長,能看到這裡超模君的小夥伴們,絕對是真愛!


為了深入了解因果關係在國內的應用發展,超模君特意專訪了在因果關係中做出了傑出貢獻的的青年學者蔡瑞初教授(蔡sir,30歲就已評上正教授!)。


2


實驗室專訪



2015年,蔡教授提出了因果關係問題求解的通用方案,使得可求解問題的規模提升了兩個數量級,使得整個研發效率提升100倍,該研究成果得到了學術界的認可。

爭議與裁決:放棄對因果關係的追尋,就是人類的自我墮落



蔡瑞初|廣東工業大學教授


DMIR實驗室科研導師


探索事物背後的因果機制


對於因果關係的8年研究,蔡博士提出了因果結構分解理論並設計了大規模因果關係問題求解的通用方案, 將可求解問題的規模提升了兩個數量級,並被應用到多個領域。


2014年,醫療信息專家堪薩斯大學Liu Mei教授將該演算法應用到藥物不良反應挖掘,發現並驗證了10餘種藥物的不良反應的因果機制,結果可靠性較經典演算法提升50%以上。


2016年,蔡博士提出致病基因發現演算法 MaxS、 MinSC 及其開源工具 GEMINI被領域專家多次引用並重點評價。


下為專訪內容


超模君:當初為什麼會想到往因果關係進行研究?


蔡瑞初教授:最開始時候是做基因表達數據挖掘,想通過相關分析發現與特定疾病,比如癌症的相關基因。在做這個問題的時候,發現大量的基因具有同樣的相關稀疏/支持度/置信度,根本無法發現真正有意義的結果。後來,我們才發現,我們要尋找的應該是致病基因,也就是真正導致疾病發生的基因,而不是與疾病相關的基因。而採用相關分析的方法,會導致少量的原因變數淹沒在大量的相關變數之中。


超模君:在研究過程中,因果關係的研究是否符合預期,最難攻克的點在哪裡?


蔡瑞初教授:應該說取得了一些進展,基本符合預期的,但是距離問題的真正解決還是有很長的路要走。最大難點在於因果關係的驗證,因為因果機制是事物發展背後的東西,是不可見的,很多問題背後的因果機制目前仍然是不清楚的。比如說如果我們已經很清楚的知道某種疾病的致病基因了,那麼這個問題也就不需要研究。很多時候,我們做出了一些結果需要,問題領域專家進行長時間的實驗與分析。


超模君:因果關係的研究中,是否發生過一些有趣的事情,對研究發展是否有影響?


蔡瑞初教授:是的,非常多有趣的事情。比如說,我們在做社交網路行為分析的因果分析的時候,我們發現微博中的大V薛蠻子的行為是受一些小V影響的,但是覺得很奇怪,以為是我們演算法的問題,後來發現這些小V是典型的上訪戶,他們總是喜歡發一些上訪相關的東西,然後@薛蠻子,讓他轉發。後來,還在薛蠻子在被抓以後的採訪中驗證了「像皇上批閱奏章」。


超模君:在研究過程中,是否遇到一些外部因素,影響研究進度?


蔡瑞初教授:那肯定的,有很多正面,也有很多負面的因素。負面方面首先就是各種雜事和各種表格填寫等,耽誤了大量做研究的時間。正面方面,我覺得一些合作這對我的幫助是非常大的,比如我adsc的合作者張振傑,從07年開始,我們一直有合作,對我的很多研究幫助很大。也包括國際上因果關係做的很好的CMU的張坤老師,對我們團隊也給了很多的指導,對於了解這個領域的核心問題有很大幫助。


超模君:關於因果關係的研究目前應用於哪些領域,效果如何?


蔡瑞初教授:目前來說,我們團隊的工作主要應用在生物醫學領域、社交網路行為這兩個領域。其中生物醫學領域是比較認可這個概念的,比如說通過我們的因果關係挖掘,對FDA的藥物不良反應報告數據進行挖掘,發現了很多不良藥物反應機制的因果機制,這個成果是被美國醫療信息學會會刊發表的,圈內比較認可。社交網路行為方面,我們是希望發現一些人行為的背後因果機制,與這個對應的其實是行為經濟學,也就是如何通過一些廣告干預人的行為。


超模君:從您的角度來看,因果關係的研究未來的發展趨勢如何?


蔡瑞初教授:一定程度因果關係屬於起步階段和快速發展階段之間。目前,國內做這個方向團隊比較少,國際上主要一些很牛的團隊在做比如,UCLA的pearl Judea團隊(圖靈獎得主),CMU,馬普學會Berhard團隊(相當於德國的中科院)等。目前逐步有很多團隊在逐漸開始這個領域的研究,所以我覺得因果可能會是下一個熱點。因為現在很多人說大數據只要相關不要因果。但是,隨著相關關係的獲得,對於因果的渴望會更加迫切,因果的發現的機會會逐漸成熟。


超模君:DMIR實驗室的研究氛圍如何,是否對研究成果的產生有影響?


蔡瑞初教授:我們實驗室是2010年成立的,目前有廣東省複雜過程信息物理融合系統工程技術研究開發中心等平台。總體氣氛還是非常濃厚的,現有教授2人,副教授3人,講師4人,博士後3人,博士研究生6人,碩士研究生40人的一個研究梯隊。


實驗室還與新加坡高等數字科學研究中心(ADSC, 伊利諾伊大學和新加坡科學發展局聯合建立研究機構)的戰略合作協議,每年開展近10餘人次的博士後,研究生聯合培養和互訪,對於研究開展的也起到非常積極的推動作用。


3


最新消息



現在DMIR實驗室公開招聘優秀博士後,期待您的加入!

爭議與裁決:放棄對因果關係的追尋,就是人類的自我墮落



註:(DMIR實驗室承諾招收數據無誤,為其真實性負責,超模君已與蔡教授取得聯繫,為內容客觀真實性背書)


設想一下,大數據中因果關係的研究成果,在醫學研究中得以不斷釋放,當人類疾病、生命衰老背後的所有因果奧妙都被解開,整個人類生命的壽命將會大大延長。知因果而知者,始得真知,上帝的真理就隱藏在因果關係的背後。


請您繼續閱讀更多來自 超級數學建模 的精彩文章:

震驚整個世界的新發現,科學界的大騙局
傳說中的貝葉斯統計到底有什麼來頭?
所謂名垂千史——那些名字用做物理量單位的科學家
為什麼這十個公式是世界上最美的
有一個學統計的學生,開車總是喜歡在十字路口加速的原因是……

TAG:超級數學建模 |

您可能感興趣

崔順實女兒被無罪釋放,是否有朴槿惠幕後力量在主導裁決?
版權侵權的裁決能否在域外被認可與執行?看看這個案例就知道了
日本戰敗後唯一沒有被裁決的部隊:曾用中國人做實驗,殘忍無比
安理會又通過了「史上最嚴」對朝制裁決議,朝鮮卻在……
歐盟委員會將在未來幾個月內對谷歌的反壟斷案作出裁決
朝鮮:史上最嚴重對朝制裁決議進一步堅定我們的意志
使用手機會導致患上腦瘤?意法院裁決:是的
我的鄰居高大又帥氣 由於他是天體愛好者 他將面臨法庭的裁決
敵軍攻打甚急,急等皇帝裁決 后妃:再來一次嘛 皇帝:好
希拉里和特朗普面對最終裁決,誰準備好了總結陳詞?
LOL腳本外掛猖狂,裁決之鐮真的有效?
魔音糯米開掛事件官方給出最終裁決,鬥魚你怎麼又打臉了
要不是歐洲法院出了個裁決,你會知道魔方實際上是個公司嗎?
此將太會打仗四人爭,毛主席裁決後他用好兵換其傷兵
fate中的裁決者可不只有貞德!讓你看看故事中到底有多少裁決者!
《人民的名義》作者周梅森:我這個人不好惹,除非法院裁決不然不改小說
朴槿惠已經無力回天,命運已經被最終裁決
韓本周或向朝提議軍事會談,朝稱若通過新制裁決議將採取後續措施
安理會一致通過涉朝新制裁決議,首次對朝限油