現代遙感技術自上世紀60年代誕生以來,為地球科學尤其是地球表層科學研究提供了重要的信息來源和不可或缺的科技手段。
未來,遙感結合大數據,如何更好推動地球系統科學發展?傳統地球系統科學又如何更好適應大數據時代?對此,《中國科學報》記者近日專訪了中國科學院空天信息研究院副院長張兵研究員,他從遙感大數據的角度進行了分析並提出了應對之策。
大數據開啟人類認知全新方式
張兵指出,地球系統科學需要全面、宏觀、及時的信息保障。翱翔太空的數百顆遙感衛星就是地球數據採集器,不斷為人類提供著超高維度和超高頻次的地球觀測科學數據。
「數據驅動型的知識發現首先強調的就是海量數據獲取的便捷性。」張兵解釋,當今地球系統科學研究中涉及的大氣、海洋、陸地、生態等要素的大尺度觀測幾乎都離不開遙感技術,多譜段、多尺度、多角度、多時相的遙感數據結合機器學習手段,使得遙感信息提取技術從統計模型、物理模型逐漸進入到數據模型階段,也就是遙感大數據時代。
大數據時代,大量的傳感器遍布世界各地,讓數據採集更加便捷;數據存儲、雲計算、高性能計算技術的突飛猛進,為海量數據的存儲、處理提供了「安身之所」和「用武之地」;智能遙感衛星系統的發展更是將數據獲取和信息提取緊密地融為一體。
「深度學習是機器學習的一種,都屬於人工智慧技術,為這些海量數據的信息提取和分析提供了無以倫比的工具,它含有超多隱層感知器,開啟了人類認知的全新方式。」張兵說。
機器學習自動發現潛在地學規律
機器學習與人工智慧技術的突破,為這些海量數據的信息提取和分析提供了強大工具。
「不是人為設定特徵和模式,而是基於大量的已知數據,通過計算得出之前未知的知識和規律。」張兵說,「深度學習能夠自動地學習特徵,並對特徵逐層抽象提取,這都大大超出人類有限的『總結』、『歸納』出的特徵數量,進而幫助人類發現隱匿著的規律和知識。」
張兵以傳說中的「比薩斜塔鐵球試驗」為例進行了形象地描述,「這是一個通過有意識有計劃的物理實驗發現了不同重量鐵球的自由落體現象,研究者進一步就可以推導出物體運動公式和規律,這是一個經典的實驗歸納的科學發現範式。假如我們有許多遍布全球的數據採集器,記錄下了每一個物體自由落體過程的各種數據,通過機器學習方式同樣能夠直接做出準確的軌跡預測。」
當前,遙感數據也面臨著不同類型和結構的數據整合、海量數據的高效能計算、智能算法的遙感適用性、數據準確性與結果驗證等一系列挑戰。
相對常規圖片數據,遙感圖像數據由於其產生方式、獲取條件和應用等方面特徵具有明顯的獨特性,使得現有基於數碼照片設計的深度學習算法仍舊無法深入挖掘遙感圖像蘊含的相關信息;此外,遙感圖像觀測尺度大、場景複雜,現有網絡模型對遙感圖像的理解和特徵提取還存在明顯不足。
「地球系統科學研究對象極端複雜,這要求遙感大數據應用必須考慮面向對象的遙感知識庫構建和融合遙感特徵的深度學習網絡開發。」張兵說。
打破壁壘 實現數據共享
不過,張兵擔心的最大問題是數據共享,「大數據技術具有巨大的發展潛力,但是,中國在數據共享方面的嚴重滯後很可能嚴重製約我國大數據技術的發展速度。」
張兵表示,我們發射的遙感衛星很多,但使用效率與國外相比存在巨大差距,尤其是面向科學研究的遙感數據共享,包括基於自主數據的國際科技合作,遙感數據的獲取困難重重,數據共享嚴重不足。
在這方面,國外的經驗值得借鑑。他告訴記者,美國法律規定,聯邦政府投資的項目所產生的數據,只要不涉及國家秘密就必須對納稅人公開,這無疑促進了數據發揮更大效能。
目前,中科院已率先採取了行動。2019年以來,中科院先後發布了「地球大數據共享服務平臺」、《中國科學院科學數據管理與開放共享辦法(試行)》,這對於促進大數據驅動下的地球系統科學創新發展具有重大意義。