你知道為了讓天氣預報準一點,再準一點,氣象工作者有多努力麼?
大部分人肯定不知道,筆者也是剛剛才曉得,有一個形象的比喻——天氣預報是一年三百六十五天不停休的高考,每天每夜氣象工作者都要和「厚厚一摞數據」做鬥爭,可是,天氣預報並不總是百分百準確,換做誰每次都拿到不一樣的考卷,也答不到次次滿分。
天氣預報的古早期,古人看天看地看朝霞,也就有了「青蛙叫,大雨到」、「朝霞不出門,晚霞行千裡」等膾炙人口的諺語,青蛙還成為了世界氣象電視節的吉祥物,以紀念青蛙在天氣預報歷史長河所做出的貢獻,不可否認古人的智慧,但隨著這些諺語逐漸被每晚7點半的天氣預報淡化,恰恰象徵著天氣預報走向科學化。
當天氣預報發展為一門科學,現代人看數看圖看表格,數值預報技術是天氣預報的核心技術,國際上天氣預報技術領先的國家無不以先進的數值預報技術代言,中國正在實施的氣象現代化建設的實施綱要中明確提出,到2020年,建成以水平解析度10km的數值預報業務系統。
「更高更快更強」是天氣預報不懈的追求,更高解析度、更快給出結果、更準確的預測等等考驗著現代大氣科學。「為何不在天氣預報融入人工智慧呢」,我想到。翻閱資料追蹤尋跡,原來人工智慧和天氣預報早在上世紀80年代就有了交集,大大超出我的預想。
天氣預報是一門預測科學,人工智慧的本質也是預測,無巧不成此事。
從經驗預報到數值預報,天氣預報的準確率一直在提升,但卻永遠不可能達到100%。是的,你可以肯定地用這麼決絕的詞語下結論。
據氣象專家介紹,目前的3天預報,在全球範圍可達70%至80%的準確度,如果是一定區域,比如我國華南地區的3天預報,準確度能高於80%。我國天氣預報的準確率在發展中國家排名靠前,已經接近發達國家水平。
如前所述,天氣預報的核心技術就是數值預報技術,如今天氣預報技術已由單一的天氣圖經驗預報轉變為以數值預報產品為基礎、多種觀測資料綜合應用的現代技術。
數值天氣預報是以氣象觀測資料為初值條件,通過巨型計算機進行數值計算,再用流體力學和熱力學的方程組進行求解,進而預測未來一定時段的大氣運動狀態。簡單理解,數值模式是一堆描述大氣運動的方程組,利用計算機計算得到數值結果,氣象工作者再根據得出的數值結果具現大氣變化,推測可能發生的天氣。
數值預報技術讓天氣預報有了更高的準確率,但這種模式本身的特點決定了得不出百分百正確的數值。首先,目前任何一套模型都只能近似地模擬大氣演變,人類尚未破解大氣運動規律的全部秘鑰。
除了大氣自身活動的隨機性難以準確把握以外,還有很多因素隔開了天氣預報的理想與現實,比如複雜地形地貌無端增添了不確定性,橫斷山脈西部受西南季風影響多產生地形雨,年降雨量1600毫米左右,但山脈東側年降雨量卻僅有245毫米,一山橫斷了天氣預報的邊界。
再如氣象工作者經驗知識不一致,同一天的同一地點,不同預報員也可能給出不同的天氣預報結果,在轉折性或複雜天氣形勢出現的時候比較常見。
天氣預報是一系列預測結果的集合,人類預報天氣本質上就是在尋找這一集合的最大公約數。
說罷天氣預報的誤差,再談談方興未艾的人工智慧,人工智慧和天氣預報的境遇何其相似。
人工智慧既然是計算機科學的一個分支,也就跳不出計算機科學的藩籬,拋開繁瑣的技術,人工智慧通過模仿人類,構建智能執行任務的系統或機器,它們可以根據所收集的信息不斷對自身做出迭代式改進,神經網絡、深度學習等等都是為了實現人工智慧的手段。
但是目前的人工智慧在各個環節都可能出現偏差。李飛飛就曾表示,深度學習系統「輸入有偏差,輸出就會有偏差」。儘管人工智慧的算法可能是中立的,但輸入數據和應用本身並不一定,關鍵在建立人工智慧的人和建立人工智慧的動機。
偏差來源之一就是輸入數據的的偏差,訓練集本身選得不好,或者與實際情況誤差較大,直接會影響系統決策時有偏差,並且偏差滾雪球般越滾越大。
再如交互中的偏差,系統接收到錯誤的知識,並且不具備自我糾錯能力,輸入結果南轅北轍。
等等環節不一而同,人工智慧的偏差更多來自於人工的那部分,智能有賴於不斷的訓練,就目前看來,偏差是不可避免的,因此我們目前看到的人工智慧應用,沒有一家敢說出準確率達到100%。
最早於上世紀八、九十年代,人們將人工智慧技術應用於資料同化 、資料解釋 、預報製作、預報質量保證 、資料庫開發 、資源計劃 、決策支持 、混合數據處理以及影響評價等各個領域 。直到20世紀末,,大氣科學的人工智慧應用重點才從專家系統轉向人工神經網絡,有了現代人工智慧的雛形
人工智慧和天氣預報的「風雲際會」
《天氣公報》聽起來有些陌生,其實它就是每晚7點半央視天氣預報播報員口播的依據,1970年,中央氣象臺開始向國務院及有關部委報送《天氣公報》,從2018年開始,幾十年歷史的《天氣公報》已經有了人工智慧的參與。
當然,研究人員還需要結合NLP和GIS空間分析技術,利用大量歷史數據對模型進行訓練,將複雜專業的多維氣象數據轉換為淺顯的自然語言,使其獲得「氣象語言特徵」「地理區劃分析」和圖文的「疊加分析」能力,最後應用「氣象服務信息模板庫」輸出成文。
如果說這只是人工智慧的臺前工作,那麼幕後才是人工智慧的真正舞臺。
天氣預報和人工智慧有著天然耦合的關係。天氣預報需要大量的、多種多樣的資料,人工智慧天生就是處理大數據的工具;現有資料的時空數據密度均不夠,人工智慧技術可以根據不完全不確定信息推斷的能 力;人工智慧可以總結專家知識經驗,提高平均預測水平;人工智慧可以利用統計與數值模式中無法利用的抽象預報知識。
新時代的人工智慧和天氣預報具備更為寬廣的結合空間。1月6日,深圳市氣象局與華為雲於宣布開展深度合作,雙方將攜手打造「氣象+雲+AI+5G」。
具體來看,基於華為雲AI,雙方致力研創更精準的災害性天氣預測模型。通過海量歷史數據學習,推算雲團變化和移動規律,助力於提高深圳市天氣預報的質量,促進災害性天氣預警信息智能發布與傳播的發展。
天氣預報一大難點就在於短時極端天氣的預報,自然災害往往伴隨發生,暴雨、冰雹等天氣條件下,快一秒就多一秒的生命窗口,越過商業與技術本身的局限,天氣預報應用人工智慧也貫徹了華為雲Cloud for Good理念。
在災害性天氣預報AI模型的建立中,華為雲在數據分析和存儲上,能夠發揮至關重要的作用。尤其是在數據分析方面,氣象數據的時空解析度極高,數據量極大,普通伺服器難以承受如此規模的數據處理和模型訓練。
華為雲AI昇騰集群服務可按需提供強大的AI算力,加上華為雲ModelArts一站式AI開發與管理平臺,可加速氣象預測模型開發進程,極大的縮短模型訓練周期,預計一次模型訓練,將由原來的1—2個星期縮短至3天甚至是幾個小時。
從第一張天氣圖出現至今,大氣科學只有「區區」一百多年的歷史,而人工智慧正刷新天氣預報的極限。
雷鋒網(公眾號:雷鋒網)雷鋒網雷鋒網
參考資料:李澤椿,畢寶貴,金榮花,徐枝芳,薛峰.2014.近10年中國現代天氣預報的發展與應用.氣象學報,72(6):1069—1078
國外人工智慧技術在天氣預報中的應用綜述 —— 曾曉梅.中國氣象科學研究院氣象科技信息中心
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。