利用數據挖掘來理解氣候變化。新方法強調數據以測試氣候模型
利用數據挖掘來理解氣候變化。
新方法強調數據以測試氣候模型。
大數據和數據挖掘在衛生信息學、智慧城市和市場營銷等領域都取得了一些突破。然而,同樣的技術並沒有為氣候變化提供一致的關鍵發現。
有幾個原因。最主要的是以前的數據挖掘工作在氣候科學,特別是在氣候電話會議的分析中,依賴於提供相當簡單的「是或否」答案的方法。
喬治亞理工大學地球與大氣科學學院教授Annalisa Bracco說:「在氣候方面,這並不是那麼簡單。」「即使是地球上非常不同地區之間的微弱聯繫,也可能是潛在的物理現象造成的。」設置閾值和拋出弱連接將會停止一切。相反,氣候科學家的專長是在不同的數據集或領域中尋找共性的關鍵步驟,以探索它們的健壯性。
Bracco說,隨著全球數以百萬計的數據分布在全球範圍內,目前的模型過於依賴人類的專業知識來理解產出。她和她的同事們想要開發一種更依賴於實際數據而不是研究者的解釋的方法。
這就是為什麼喬治亞理工學院開發了一種新的方法,從比傳統工具更獨立的氣候數據集挖掘數據。該方法將數據集的共性與用戶的專業知識相結合,從而使科學家能夠信任數據,並獲得更可靠、更透明的結果。
該方法是開源的,目前全世界的科學家都可以使用。喬治亞理工學院的研究人員已經在用它來探索海洋表面溫度和雲場數據,這兩個方面深刻地影響著地球的氣候。
「有很多因素——例如雲數據、氣溶膠和風場——相互作用產生氣候並推動氣候變化,」該項目的另一名科學氣候教授Athanasios Nenes說。根據你所關注的模型方面,他們可以有效地再現氣候特徵——或者根本就沒有。有時很難判斷一個模型是否真的比另一個模型好,還是它預測氣候的原因是正確的。
Nenes說,喬治亞理工學院的方法論以一種更健壯的方式看待一切,打破了其他模型評估和分析演算法的典型瓶頸。他說,這種方法可以用於觀察,而科學家不需要了解任何關於計算機代碼和模型的知識。
Nenes說:「這種方法降低了數以百萬計的數據的複雜性,這些數據指向了最基本的要素——有時只有10個區域相互作用。」「我們需要有工具來降低模型輸出的複雜性,以便更好地理解它們,並評估它們是否為正確的原因提供了正確的結果。」
為了開發這種方法,氣候科學家與康斯坦丁·多夫羅利斯和喬治亞理工學院計算學院的其他數據科學家合作。Dovrolis說,將演算法和計算思維應用於影響每個人的主要方式,如全球變暖,是令人興奮的。
「氣候科學是一個流線化的紀律與許多有趣的智力問題,可以受益於計算建模和預測,「Dovrolis說,教授計算機科學學院「跨學科協作正在挑戰開始,每個學科都有自己的語言,首選的方法和研究文化,但他們可以是非常有益的。」


TAG:多面手 |