當前位置:
首頁 > 健康 > 學習因果關係和基於因果性的學習

學習因果關係和基於因果性的學習

學習因果關係和基於因果性的學習

人們在日常生活里以及各種科學探索和決策過程中,都常常追問「為什麼」這樣的因果性問題。為了能干預當前系統從而達到特定的目的,我們需要透過相關性,找到並利用因果性。還有一些問題看似無關「為什麼」,但其實答案也存在因果關係中。比如在評價特定人或事的時候,我們往往需要想像在同樣的環境中,如果換了一個人或者那件事沒有發生,結果又會如何。拿這個假想結果和現實情況對比,人或事所起到的因果效應就顯示出來了。按卡爾·榮格的說法,正是對因果關係的在意,催生了現代科學的誕生和發展。目前的因果性研究致力於回答以下問題:通過分析觀測的數據,我們能精確地找出數據背後的因果關係嗎?如何使人工智慧系統理解環境並具備外推能力?如何能在複雜、可變的環境里做最優預測和控制?因果關係有哪些我們還未察覺的用途?

《國家科學評論》最近發表了美國卡耐基梅隆大學張坤、Peter Spirtes、Clark Glymour和德國馬普智能系統研究所Bernhard Sch?lkopf共同撰寫的觀點文章「Learning Causality and Causality-Related Learning」(National Science Review 2018; 1: 26-29. https://doi.org/10.1093/nsr/nwx137),簡要闡述了該研究領域的一些進展以及目前大家比較關注的方向。找因果關係的傳統方法需要做人為干涉或隨機實驗,這個過程非常昂貴,有時甚至無法做到。因此,人們需要從觀測數據中找出因果關係,這個問題統稱為因果發現。得益於過去30年數個領域在此問題上的進展,即使沒有時間先後信息,現在也有一系列方法能在特定前提下解決這個問題,這也提供了另一個分析「大數據」的途徑。在20世紀90年代,學者們發現雖然相關性不直接蘊含因果性,但如果引入一些普遍能接受的假設,就可以從變數的條件獨立關係中找到他們之間的因果信息。遺憾的是,這類方法一般不能找出唯一的因果圖,而是找到一類圖,它們有同樣的無向連接,但一些因果方向未必相同。

過去10年的研究把這個結果往前推進了一步——假設因果過程服從某些函數模型,那麼在一般情況下,反方向是不可能服從這個模型的。具體來說,在反方向,我們是找不到獨立的雜訊的,這就直接給出了「因」和「果」在統計意義上的不對稱性。其中,後非線性因果函數模型(post-nonlinear causal model)在NIPS 2008因果挑戰賽中,在所給數據集上都正確區分出了因和果。這個結果改變了一些人的看法——原來單純從獨立同分布的數據中是可以看出誰是因誰是果的。如圖1所示,如果因果過程為線性且「因」X和因果過程中的雜訊是非高斯的(圖中它們是均勻分布的),「因」X和「果」Y具有不對稱性。為了實現更魯棒、實用的因果發現,文中還列出了5個近年來已經引起重視的現實問題,包括:確定性因果關係,如何使用非平穩或異質數據更有效地找到因果關係,以及如何處理非理想數據採集方式帶來的觀測雜訊和數據選擇偏差等。

文章還探討了如何從因果關係的角度去理解以及解決某些機器學習問題。大致來說,傳統機器學習往往假設數據的分布不變,而目前隨著機器學習的廣泛應用,我們需要考慮更實際的包含異質數據的問題,比如半監督學習和遷移學習。這類問題的解決可獲益於因果系統的性質:首先,我們可以「以不變應萬變」——即使數據分布發生變化,因果關係是相對穩定的,因為它對應著實際的物理過程;其次,我們可以「分而治之」——一般來說,因果系統里「因」的產生過程和「因」產生「果」的過程是沒有聯繫的,即使這兩個過程都發生了變化,我們也可以把它們各個擊破;再次,我們可以「四兩撥千斤」——因果過程對應著實際的物理規律,順著這個過程去構建數據的分布特性往往更簡單。目前,該領域的很多研究人員致力於找出更廣泛實用、更高效的因果發現方法,以及從因果的角度去開發更具智能的機器學習系統。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 今日科學 的精彩文章:

科學家公布人類基因數量引發爭議
人腦中有獨立區域控制音調

TAG:今日科學 |