近日,歐洲中期天氣預報中心(ECMWF,簡稱EC)邀請國際上知名的機器學習研究者,在線上舉辦機器學習應用於天氣預報和氣候研究系列講座,推動員工和學術界在研發中樹立應用機器學習技術的意識。這樣的舉動既是在培育新的交叉學科,又在藉助機器學習等新技術探索預報模式系統的發展方向。
事實上,自今年年初起,EC就開始加快機器學習等人工智慧(AI)技術業務化應用的研發,今年10月還將與歐洲空間局(ESA)共同舉辦「地球系統觀測和預報中的機器學習」學術會議,屆時將對目前地球系統領域中以機器學習為代表的AI技術應用和潛力進行全面研究和評判。雖然與美國氣象學會開展系列AI學術活動35年的歷史相比,EC直到2019年才開展專題AI學術會議,但其藉助機器學習扛起AI大旗升級預報模式的戰略已經顯現。
進入21世紀以來,大量氣象業務、研究和服務的關鍵領域與AI技術建立起聯繫。而機器學習作為AI和網絡化發展態勢中最核心的內容,其廣泛應用已經成為新工業時代的重要標籤。作為將研究與業務緊密結合的機構,EC扛起機器學習在氣象業務革命性改進進程中的大旗,具有重要的啟發意義。
EC是世界上最重要的氣象預報中心之一,其模式產品領先全球。而數值天氣預報模式本身就屬於廣義上的AI技術,因此EC專家在捕捉AI趨勢方面早有準備。儘管如此,EC也是近年來才開始在業務領域中重點關注AI技術,尤其是機器學習技術。藉助一些科學活動,充分挖掘機器學習等技術的潛力在EC達成共識。
2019年11月5日至8日,EC召開第一屆AI主題學術會議。藉助業界對大數據的深刻認識,此次會議梳理了EC數據的大數據理念,以及這些數據構建的AI技術應用業務環境。EC每天都在產生一套描述「孿生」數字地球的數據,這些數據涵蓋過去(監測氣候的再分析和驗證預報的再預報)、現狀(數位化預報)和未來(預報時效直至季節尺度的預報)。
EC的AI和機器學習協調人彼得·杜本於2019年12月10日作了一次主題報告——《機器學習在天氣預報中將走向何處?》,講述了有關機器學習的主要應用案例,並給出了未來十年的技術發展路線圖。在這份提交給EC第95屆委員會的報告裡,杜本描述了質量控制、數據同化誤差訂正、仿真模式分量、量化不確定性和其他數值天氣預報可以受益於機器學習技術的方方面面。
今年1月,EC召開內部學術交流會,進一步梳理了機構內機器學習相關項目進展和協同合作交流機會等。這次內部學術活動表明,EC學者日常用的很多方法都可以看作是機器學習的例子。此外,近年來新方法的衝擊也十分明顯,這些發展趨勢將給天氣預報業務中心帶來革命性改變。這些新方法,比如深度神經網絡的使用,能從數據中學習非常複雜的非線性系統動力學,這無疑是提升預報系統性能的關鍵所在。
EC開展的機器學習相關研究活動貫穿其「觀測—數據同化—數值天氣預報—後處理和發布」整個工作流程。目前,EC有25個項目在利用或將要利用機器學習技術。這些項目涉及整個業務流程的不同節點,包括衛星觀測偏差訂正、數據同化中模式誤差學習、模式組成仿真以提升計算有效性、模式輸出局地降尺度以改進預報、IT設施監測。然而,各種應用項目所處的發展階段差異極大,從剛剛進入研究項目計劃階段(比如再分析產品監測和評估)一直到產品已經業務化(比如全球概率降水預報工具ecPoint和SMOS衛星觀測數據同化土壤溼度反演)。
EC與歐洲氣象衛星開發組織(EUMETSAT)正在聯合開發的「歐洲天氣雲」(EuropeanWeatherCloud)或許將在未來開發機器學習的工具中發揮重要作用。研究者藉助「歐洲天氣雲」能夠方便地獲取來自資料庫的培訓數據,並且還能利用標準的機器學習軟體工具。這些工具一般為雲環境下的定製工具。目前EC還計劃對「歐洲天氣雲」的硬體進行更新,在已有系統中加入足夠的GPU資源,以支持機器學習應用中的培訓。
EC圍繞機器學習開展系列活動雖然才剛剛起步,但很多做法和思路已經露出成功的跡象。面對新科技發展趨勢,EC先是在業務立項上給予傾斜,積累了一定經驗並進行內部研討後,再採取開放的方式藉助「外部大腦」(其他機構的頂級專家)輸入思路和方法。
在現代化加速發展的時代,新技術的思想都有其發生、發展和成熟的一般規律。新技術創新一般會經歷觸發、期望值高峰、破滅之谷、希望之光再現和到達應用高地等階段,歷經2年至10年或更長時間。機器學習等AI技術也是如此,並且都將在氣象及相關地球科學領域佔據自己的位置。EC在很大程度上將預報系統的創新放在機器學習上,是明智之舉還是草率行動目前尚無法判斷,但其中面向新技術未來的做法是引領性的。耐心和積極地等待機器學習技術在氣象預報應用中經過數年時間逐漸發展成熟,是下一步的關鍵所在。