在無數氣候現象中,論公眾知名度和影響力,很少有能出厄爾尼諾/南方濤動(ENSO)之右者。
ENSO 是全球氣候年際變化的最主要信號,影響廣泛、持續時間長,與各種區域性極端氣候事件和生態系統息息相關,幾乎使整個世界的氣候形勢為之變化,也對我國氣候有著巨大的影響。
「聖嬰」厄爾尼諾有多神奇?2015年它給世界上最乾燥的沙漠——智利阿塔卡馬沙漠帶來了一場大雨,各種花朵在這以往死寂的沙漠綻放。
如能提前預測厄爾尼諾/南方濤動,其價值不言而喻。數十年來,專家學者們在預測ENSO 方面付出了巨大努力,但提前一年以上進行預測仍是一個很大的挑戰。
利用卷積神經網絡,了解海洋溫度與未來厄爾尼諾事件的對應關係,將氣候模式與人工智慧方法結合起來,用人工智慧深度學習的方法,利用卷積神經網絡模型,為ENSO 預測領域打開了一扇新的大門。
韓國全南國立大學Yoo-Geun Ham團隊和南京信息工程大學羅京佳教授,利用人工智慧機器深度學習構建了卷積神經網絡模型改進ENSO預測,將預測時效提前到一年半,並達到80%左右的預測準確率。
本期嘉賓:南京信息工程大學氣候與應用前沿研究院院長、國家特聘教授 羅京佳
01
厄爾尼諾預測仍有改進空間
每當ENSO「來襲」,中美洲、非洲南部、太平洋島嶼國家往往就會「陷入」乾旱,引發糧食和健康危機,另一些地區則飽受因過量降雨帶來的洪水威脅,以及隨洪水而來的傳染病困擾。
2019年7月,世界氣象組織專家及太平洋沿岸一些國家的氣象部門觀測到厄爾尼諾現象在太平洋地區生成的初期跡象。
厄爾尼諾現象在印尼引發乾旱。圖為一名村民在印度尼西亞爪哇島中部一條乾涸的河床上行走。
如能實現對ENSO 更長時效的預測,人們就能更早著手準備,進而採取相應對策。但長期以來,人們對ENSO的預測時效很難超出一年。
ENSO 中存在振蕩元素,與緩慢的海洋變化及其與大氣的耦合有關,這表明對ENSO 進行多年預測是有可能性的。
有趣的是,在幾次拉尼娜事件中,赤道太平洋冷海溫異常持續了數年。高頻赤道風的可預測性較差,但赤道風的緩慢變化的成分與海面表層溫度(SST)可以一定程度地預測。
赤道太平洋以外的海表溫度異常也會觸發ENSO事件,其時滯可以超過一年。
這些研究表明,當前的方法可能存在不適用於ENSO預測的地方,ENSO預測仍有改進的空間。
隨著大數據時代的到來,人們通過深度學習發現大型數據集內的線性和非線性等複雜關係,對許多領域產生了巨大影響。研究團隊認為,機器深度學習方法得出的統計預測模型,可能是突破這一瓶頸的有效手段。
02
卷積神經網絡為預測助力
研究團隊選取了名為卷積神經網絡(CNN)的深度學習方法,用於ENSO 預測試驗。
基於卷積神經網絡的鳥類識別
通俗地說,這是一種擅長識別圖像的算法。例如,經過訓練,神經網絡可以通過識別貓共有的特徵(如鬍鬚和四條腿)來識別照片中的貓。它的識別方法和人眼有所不同,具體說來,當我們給計算機一張需要識別的貓的照片,計算機便將這張待識別的圖片劃分成若干小格,與其內部存儲的貓的「標準照」一個局部一個局部地仔細比對,如果二者一致,則判定未知圖案確實是一隻貓。
由於識別基於若干個局部的集合,即便未知圖案可能有一些平移或稍稍變形,計算機依然能辨別出它是一隻貓。而未知圖案的局部和標準圖案的局部逐一比對時的計算過程,便稱為卷積操作。
這種擅長識別圖像的方法,同樣可以用在氣候預測上。
雖然氣象觀測得出的是一組組數字,但根據這些觀測數據,人們能夠繪製海平面溫度和深海溫度的圖片,而海溫的異常變化正是引起厄爾尼諾現象的一個本質成因。研究者希望利用卷積神經網絡,了解海洋溫度與未來厄爾尼諾事件的對應關係。
03
氣候模式結合人工智慧訓練
大量訓練是深度學習的必然要求,卷積神經網絡也需要大量圖像用於訓練,才能提高預測的準確率。儘管氣象數據規模龐大,但卷積神經網絡用在ENSO預測上卻遇到了數據短缺的困難。
全球海洋溫度分布的觀測資料可追溯至1871年。雖然這個時間看上去很早,但具體算下來,到現在也不足150年。如果把每年的相同月份拿出來對比,這意味著每個月的樣本數量都少於150個。對於深度學習的樣本數量而言,這是明顯不足的。
研究者為了解決歷史厄爾尼諾事件數據短缺的問題,將氣候模式與人工智慧方法結合起來。利用CMIP5幾十個全球氣候模式,研究者根據歷史海洋數據生成了一系列模擬數據。因此,科學家們不僅有一組實際歷史觀測數據,還得到了用於訓練的數千個模擬結果。
研究結果顯示,預測時效超過6個月時,新方法對Nino3.4指數的預測能力顯著高於目前國際上最優秀的動力預測系統。在對1984年至2017年的真實數據進行測試時,這一方法能夠提前18個月預測厄爾尼諾事件。
當然,這種預測方法還遠遠沒有達到完美的程度,它對未來1.5年厄爾尼諾事件預測的準確率僅為80%左右。但這仍然比目前最好的數值模型要好,因為後者在1.5年時效上的準確率不到75%。
厄爾尼諾類型在各預測系統中預測準確率比較直方圖
卷積神經網絡還能預測海表溫度異常的不同空間分布,對不同厄爾尼諾類型 (東太平洋型、中太平洋型、混合型) 預測也有較高的準確率,彌補了目前動力預測系統的不足。
與此同時,它充分證明了機器深度學習等方法在地球科學大數據上應用的可行性,為地球科學研究提供了新的思路與方法。