數據文獻:Mazon, J., et al. "Influence of meteorologicalphenomena on worldwide aircraft accidents, 1967–2010." Meteorological Applications 25.2(2018): 236-245.
傳統(現在主要使用)的氣象預測方法為基於流體力學等物理方程的數值預報模型(NWP),使用大氣和海洋的數學模型基於當前天氣狀況預測天氣。基於相同物理原理的數學模型可用於生成短期天氣預報或長期氣候預報。如下圖,數值預報模型將全球或區域經過水平和垂直方向劃分得到三維網格,並利用當前觀測氣象數據作為輸入,利用動力學框架計算得到未來氣象預測結果(由於計算複雜通常使用超級計算機來完成)。一個基本的問題在於支配大氣的偏微分方程的混沌性質,不可能精確地求解這些方程,並且小誤差會隨著時間而增長(大約每五天增加一倍)。即使輸入數據準確且模型無誤,這種混沌性質也會將準確的預測限制在14天左右。圖片來源:https://www.climate.gov/maps-data/primer/climate-models隨著近年來大數據及AI技術的不斷發展,基於數據驅動的AI技術將氣象預測問題看做黑盒進行預測。典型的預測方法有:1.基於時空網絡模型(以ConvLSTM,DeepRNN模型為代表)。2.基於GAN, VAE等生成模型。但這些技術全部都忽略了在氣象中普遍存在的物理過程的影響。
圖片來源:Learning data driven discretizations for partialdifferential equations
另一種思路是使用神經網絡的方式將物理方程約束實現並添加在模型中。上海眼控科技股份有限公司人工智慧研究院在氣象及AI技術方面都有非常深厚的積累,基於以上思路提出了基於物理方程與AI技術相融合的大氣溫度預測模型:PGnet(Physics-Generation Network)。大氣的氣溫變化受很多因素(輻射,空氣運動等)的影響,在物理模型中通常使用對流擴散過程來對大氣的溫度變化進行建模,方程如下所示:航空智慧氣象創新中心所提出的PGnet模型結構圖如下,為了充分利用物理過程和神經網絡的優勢,主要結構分為前部分的物理過程部分和後部分的神經網絡生成部分。其中物理過程部分主要由跳躍連結的CNN結構、移動場進化函數F、和形變網絡WarpNet組成。生成網絡部分由Encoder和Decoder結構的CNN網絡組成。使用輸入圖片(溫度場)首先通過跳躍連結的CNN網絡進行移動場預測,通過移動場進化函數來學習得到移動場時序特徵,最終得到預測移動場。通過形變網絡對輸入數據添加如上所述的對流擴散物理約束,生成網絡部分與物理過程部分形成互補作用,直接從監督學習的數據中挖掘物理方程所遺漏的特徵信息,最終生成未來的預測氣象圖。現有機器學習深度學習具有「 黑匣子 」 的特點,這意味著複雜算法運作的「不可解釋性」,即使他們的設計者也無法解釋人工智慧為什麼會做出具體決定。PGnet模型由於在原始神經網絡中引入物理原理預測方法使得網絡具有了一定的物理可解釋性,例如通過移動場隨時間的變化可以推斷到不同位置的未來溫度場的變化趨勢,並使得預測結果可以被人類更容易直觀的理解。
相比於使用超級計算機進行預測的數值模式需要幾小時的時間來進行預測,使用我們所提出的深度學習+物理過程的PGnet進行預測只需要幾秒內就可以完成。圖片來源:https://www.dreamstime.com/illustration/illustration-slow.html在模型設計與訓練中,航空智慧氣象創新中心研究人員發現,雖然物理與深度學習融合方法已經能夠為我們帶來準確度上較大的提升,但由於多次迭代使用上一個時間步的輸出結果作為下一時間步的輸入導致誤差累積,預測結果會出現由於誤差累計帶來的偏差。針對這一問題,創新中心研究人員創造性的提出使用移動場來形變移動場,從而得到移動場疊加的效果,有效避免了誤差累積的問題,從而再次提升了預測的精準度。我們分別使用MSE、SSIM、PSNR評價指標對自主研發的PGnet模型與傳統的神經網絡模型進行了比較,發現PGnet模型對於大氣溫度的預測能力是最好的。
至今,物理方法與深度學習的融合相關研究仍然處於起步階段,有非常多的可能等待我們去實現。站在氣象與AI交叉學科風暴眼的航空智慧氣象創新中心將不忘初心,在人工智慧氣象領域砥礪前行,為我國智能氣象科技進步貢獻一份力量。航空智慧氣象創新中心是由華東空管局牽頭,與上海交通大學、上海眼控科技股份有限公司共同成立的全球首家將AI技術應用於航空氣象領域的研究機構,旨在通過AI技術深度賦能航空氣象領域,推動行業加速發展。