AI是如何利用大數據解決氣候問題的
撰文/黑爪,專欄作家
九月的第二個周末,有數十萬人在歐洲各地走上街頭遊行,抗議各國政客因在環保方面的不作為而引發的全球性環境危機,為將在舊金山召開的全球氣候行動峰會拉開了序幕。
九月第二個周末橫跨歐洲的示威拉開舊金山全球氣候行動峰會的序幕
為什麼會有這樣規模的抗議,是什麼引發了大多數人如此強烈的危機意識?日前騰訊·大家所刊發的一篇英國學者羅傑·克勞利的文章《感受熱浪》是很好的一個總結。文中關於數據中心的講述,可以從另一個角度來稍作分析。數據中心的能耗和溫控問題非常嚴峻,業界也早有共識。數字技術、科技巨頭是否通過數據綁架了社會,進而威脅到人類文明的根基,不是我這篇文章要討論的目的。數字化生存之前的日子,是否真如俗話說的「good old days」那般美好?每個人有不同的看法,但有一點可以肯定,我們回不去了。那麼立足於現實,氣候問題已經是數據問題!
話題既是從數據中心說起,那就先看看數據中心的近況,以谷歌為例。
上個月,2018年8月,「數據中心知識」網站刊登了一篇文章《谷歌正在切換至自駕馭數據中心管理系統》,報道谷歌數據中心的最新進展,刷新了我們2015年初對谷歌「基於AI的建議引擎」的數據中心溫控系統的認知:它從提出建議,然後人工調節,升級至自動調節。
谷歌芬蘭數據中心的冷卻設備
舉個例,大多數的數據中心操作人員並不認為颱風預警期是進行溫控微調以獲得零星節能效果的好時機,這是很自然的反應,這個時期的優先順序是什麼?自然是加固系統,以求不被颱風搞斷電。
但AI演算法不一樣,它就是被設計來尋找每一個可能省掉每一度電的機會,然而它並不將外界氣候作為參數。在來自美國中西部一個數據中心的最新情況彙編中,AI對系統的調控起初讓管理人員覺得匪夷所思,亂來。但經過仔細考察,AI所進行的每一個細微調控,在當時特定的參數環境下,都令人嘆服。導致嚴重的風暴例如颱風的氣候條件,往往會形成氣壓和溫度的戲劇性變化,這些在複雜的數據中心製冷系統中都是需要對參數進行調節的重要因素,在這種時候軟體可以通過微校準來獲得極細微的收效。然而,這樣的微調是一個持續、實時的過程,人工不可能做到,並且人力的耗費和每一次調節的收效之間的比例也並不高效,與此同時,持續和實時的累積效應卻又是巨大的。令業界驚嘆的40%能耗節省報道,仰仗的正是DeepMind AI團隊所開發的智能溫控系統,它考察包括室外溫度、氣壓、濕球溫度、幹球溫度、露點、數據中心負載、熱空氣出口的伺服器背部氣壓等21個變數,以達到實時優化數據中心PUE(Power Usage Effectiveness,數據中心設備能耗)的目的。
AI與氣候模型
經過這麼一段時期人工智慧知識的普及,我們普通人也大致理解了,所謂「智能」,它是通過一個叫「學習」的過程來得以達成,而「學習」這一打磨人工智慧的智商的過程所用到的材料,正是數據。也就是說,伺服器的每一次運轉,提供給智能體的數據越充分,它變得更高效而聰明的機會就更大。
從這個簡單的例子,我們依稀感到,那些龐大的巨獸般散發著熱量的伺服器廠房,並非導致環境惡化的敵人。時至今日,計算機已經是我們能夠利用的最高效武器,來抵禦環境的惡化。
2016年發生了772起氣候災害,是1980年的三倍;20%的現有物種在面臨滅絕的邊緣,到2100年這個數字可能達到50%。即便全球所有的國家都遵循巴黎氣候協定,到2100年,全球平均溫度將上升3攝氏度。我們顯然不能把地球的未來交給上面通過一個例子得來的「依稀」感覺,我們得認真看一看AI在這件事上究竟能怎麼幫我們。
2018年1月世界經濟論壇發表的有關未來的環境和自然資源報告《整合人工智慧來維護地球》將AI稱為影響環境的遊戲改變者,列舉了與氣候和環境相關的例證,比如,印度的農民在AI的協助下,將豆子的產量提高了30%,AI所做的是,提供播種前準備土地、施肥以及選擇播種日期的信息。而挪威電網則利用AI生成了更靈活的自動配置,集成了更多可再生能源……所以,如今研究氣候,歸根結底已經變成研究大數據。隨著觀測衛星越來越多,研究氣候變暖的科學家們缺乏的不是數據,而是利用這些數據的工具。
他們很顯然轉向AI求助,機器學習的本性與環境科學十分匹配:運行一次高精準率的氣候模型所產生的數據是PB級別的,PB有多大?1PB大約是1000個TB,而英國氣象局所保存的氣象數據大約有45個PB,並且以每天0.085PB的速度在增加,由此產生了一個新的交叉學科,叫「氣象信息學」(climate informatics)。去年《自然》雜誌上一篇文章提到:環境領域至少有三個方面證明得益於這一新學科在AI應用上的發展。首先,利用極端氣候事件數據訓練出來的機器學習演算法,成功識別了熱帶颱風與大氣河流,後者常常為局部地區帶來災難性降水,且很難人工預測。其次,AI還被用於分析政府間氣候變化專門委員會IPCC用來調研氣候變化的幾十個模型之間的優劣,演算法將每一個模型所得出的獨立結果賦予權重後再集成起來,所得到的分析結果遠遠好過單獨的模型。再次,氣象學家越來越多地利用AI來預測風暴持續時間。
然而,令這些專門致力於環境研究的科學家們真正擔心的,不是數據中心的伺服器散發出的熱量,而是AI像個黑盒子,它表現優異,但你不知道它究竟是怎麼學出來的,在我們更了解它之前,我們不敢徹底去信任它。
回到谷歌數據中心,針對類似問題,他們有個護欄機制。有人半開玩笑地說,如果你就告訴機器,去,將PUE優化了,因為PUE是總能耗與IT設備能耗間的一個比率,它很可能就把所有伺服器給你關了。當然,以數據科學安身立命的谷歌工程師,與環境科學家在對AI的信任程度上是截然不同的。谷歌的策略是慢慢來,慢慢訓練,但「我們絕對相信它」。氣象學家不一樣,他們更傾向於利用AI來幫助測試他們所創建的氣候模型,需要一個建模的指路明星,機器學習是最好的工具。
到2100年時,我們需要把牆修到多高才能抵禦海水的入侵?下一個十年的熱浪將會比現在糟糕多少倍?2030年的北極海運路線會是什麼樣?我們依然沒有答案。在人類現有的認知情況下,AI最有可能是出路。連商業企業最怕的綠色和平組織也承認,沒有回頭路。能做的只是加大研究力度,並且在能源使用方面對企業進行跟進監督,鼓勵「乾淨點擊」(clicking clean)的「綠色互聯網」競賽。最後來感受下,大佬企業們誰最綠。
清潔點擊2017年度報告
搜索引擎圈比綠


※婺劇《斷橋》之美,堪比一部司馬遷《刺客列傳》
※花兒到哪裡去了——一曲人生的詠嘆調
TAG:騰訊大家 |