劉湊華 代刊
本期觀點:
作為我國天氣預報研究型業務的一項核心內容,預報檢驗不患「難」而患「雜」,必須克服效率難題才能得到真正開展。
提高效率,第一要義就是「不要重複造輪子」。而面向全行業開源共享的全流程檢驗程序庫或許將成為那個「破壁者」。
說到天氣預報,最先會想到什麼?「早上聽了預報,帶了一天傘卻沒下一滴雨」的調侃?還是 「藍天白雲晴空萬裡突然暴風雨」 的無奈?
其實,認為天氣預報該百分百準確,是對現代科學的「蜜汁自信」。畢竟,由於大氣系統的不確定性,天氣預報不可能百分百準確已是不爭的事實。同時,因為「選擇性記憶」的存在,人腦對「不滿」的記憶也往往更加深刻。
事實上,近年來,我國的天氣預報準確率已經有快速提升,晴雨預報準確率高達90%,颱風路徑預報誤差小於70公裡。無論是普通民眾、專業用戶還是預報員,對預報的感受絕對比十年前準確得多。
其實說到準確率的問題,首先要明確一個關鍵詞——檢驗標準。譬如對「暴雨」的定義,國標規定是24小時降雨量為50毫米至99.9毫米的降雨,而公眾往往認為是「下得猛烈」的急雨,這就造成了理解上的偏差。作為衡量預報是否準確的一把標尺,客觀的檢驗結果,有助於增進我們對天氣預報的理解。隨著中國氣象局研究型業務的推進,滿足各方面需求的「全流程檢驗」應運而生。全流程檢驗的服務對象可以涵蓋從預報員、數值模式研發人員、數值模式後處理訂正算法研發人員,到各級氣象部門或公司內部負責本部門檢驗系統研發的人員。
除了熟知的準確率和TS評分,檢驗到底還能做些什麼呢?目前檢驗工具主要有三類——
用眼睛看。就是把各種預報和實況放在一起顯示,眼睛看的同時,大腦裡進行著可以意會也可以言傳但無法量化的檢驗操作。優點:檢驗全面充分,有物理意義;缺點:所需時間太久,畢竟如果你能持續10年認真地做好這項檢驗工作,基本就能達到首席預報員的水平了。此外,這種方法也沒法定量。
上網站查。氣象部門基本都有自己的檢驗平臺,把各類預報的檢驗結果都算好,在網站上展示。用戶可以很方便地找到檢驗評分的結果。優點在於1分鐘就能查看到定量結果。缺點是只能看現成的檢驗指標,想看點定製化的,就要系統升級後再說了。此外,這些檢驗指標雖然是客觀化的表達,但是物理意義不夠明晰,不能告訴預報員怎麼改進預報。
編程計算。如果你需要一些網站所沒有的定量檢驗信息,那就只能自己編程了。優點是想要啥都能編出來;缺點是檢驗程序可沒想像中那麼好編,沒個百十行代碼,根本做不出一項檢驗。
面向研究型業務,檢驗需要率先滿足定量的、不按固定套路的變化需求。上述三種方式中基本只有第三種可以滿足。
但動輒百行的代碼讓很多人望而卻步,更要命的是稍微切換一下檢驗內容或思路,以前寫的檢驗代碼沒法重複使用,基本又得重寫。
因為編碼的時間成本問題,實際上即使是有很強編程能力的研發人員也通常不會經常變換檢驗方式方法。一段檢驗代碼用到底,檢驗的廣度和深度受到極大限制。可見,問題的焦點就到了如何提高檢驗工作的效率上來了。
提高效率,第一個要點就是「不要重複造輪子」。因此,最好的方法就是資源貢獻。目前,我們正在努力把造好的輪子全都開源共享給所有同行。當然,一個輪子是不夠的,每個人需要用到的輪子是不一樣的,為此我們要提供一套大家都用到的各種輪子的全集。我們的預期是將整個行業所有預報製作流程中用到的檢驗相關的算法和功能集成為一個開源程序庫,即全流程檢驗程序庫(簡稱Meteva)。
Meteva是面向氣象預報產品及中間產品進行全面檢驗評估所需要用到函數和功能的集成。它是國內第一款專門用於氣象預報檢驗的Python程序庫,也是一款開源程序。數值模式和客觀算法、精細化網格預報、各種應用預報產品等所需的檢驗算法,都將併入全流程檢驗。檢驗作為核心模塊,將在整體天氣預報鏈路中發揮重要作用。
目前,該程序提供可供復用的函數超過200個,集成了開展檢驗所需的基礎函數(包括數據的讀寫、插值、累加、平均、選取、分組等)、檢驗算法(包括各類二分類、多分類、連續型變量、概率預報和集合預報的檢驗等)和檢驗圖形產品(包括空間對比圖、時間序列對比圖、誤差序列分析圖、誤差空間分布圖等)。
未來,我們將對Meteva進行持續更新擴展。它會是預報檢驗的「破壁者」嗎?這很令人期待。
(作者分別為國家氣象中心天氣預報技術研發室高級工程師、國家氣象中心天氣預報技術研發室正研級高級工程師 )