清華大學地球系統科學系宮鵬教授研究組與國內外多家單位合作以《有限全球樣本穩定地表覆蓋分類:遷移2015年的30米解析度樣本完成2017年的10米解析度全球地表覆蓋製圖》(Stable classification with limited sample: transferring a 30-m resolution sample set collected in 2015 to mapping 10-m resolution global land cover in 2017)為題撰文介紹了世界首幅10米解析度全球地表覆蓋製圖方法與結果。該成果3月8日在線發表於《科學通報》(Science Bulletin)期刊上。
基於10米解析度的Sentinel-2數據的2017年全球地表覆蓋圖(FROM-GLC10)
當前世界發展面臨一系列挑戰,如人口增長、城市化、農業發展以及氣候變化對糧食安全的影響、能源和水資源短缺、資源過度開採、生物多樣性喪失和環境汙染等。為維護人類健康和實現聯合國可持續發展目標,需要及時和高解析度的全球地表覆蓋信息,從而能夠更好地進行環境監測。然而,直到2012年才由清華大學完成並共享了首套30米解析度的全球地表覆蓋圖。
隨著應用需求的提升,當前迫切需要更高空間解析度的全球地表覆蓋產品。而開發這樣的產品,需要依賴大量的人力和很強的計算能力。
宮鵬等基於研究組2011年以來在全球30米地表覆蓋製圖中獲得的經驗和在樣本庫建設方面的積累,結合10米解析度Sentinel-2全球影像的完整存儲和免費獲取,以及Google Earth Engine平臺強大的雲計算能力,開發出了世界首套10米解析度的全球地表覆蓋產品——FROM-GLC10(清華大學的全球首套30米解析度地表覆蓋圖稱為Finer Resolution Observation and Monitoring of Global Land Cover (FROM-GLC))。
減少樣本量和增加錯誤樣本時的穩定性。左圖,當樣本量增加時,精度迅速上升到相對穩定的高度。右圖,隨機錯誤的樣本百分比上升,精度下降。兩種情況都是分別隨機取樣1000次的實驗結果,整體分類精度非常穩定,最大標準差遠小於0.5%。
該產品基於2017年在《科學通報》發表的全球首套多季節樣本庫,涵蓋從2014年和2015年Landsat 8影像、由專家解譯得到的均勻覆蓋全球的多季節樣本。其中,訓練集包含大約340,000個不同大小的樣本(從30m×30m到500m×500m),覆蓋全球約93,000個樣本點位;驗證集包含大約140,000個不同季節的樣本,覆蓋超過38,000個樣本點位。將該樣本庫應用於2017年獲取的Sentinel-2影像,並基於隨機森林分類器得到全球10米地表覆蓋圖。
該研究提出「有限全球樣本穩定地表覆蓋分類」理論,指出了全球訓練樣本遷移到其他年份或不同傳感器獲取的遙感數據對最少樣本數量和誤差限度的要求。為了驗證該理論在全球尺度的正確性,研究組設計了一系列嚴密的隨機試驗,分別測試了分類器對樣本數量的敏感性,以及對因每年地表實際發生的土地覆蓋變化或解譯誤差導致的樣本錯誤的容忍度。結果顯示,在納入實驗的樣本量僅佔整體的40%,或訓練樣本的誤差比例達到20%時,分類精度的損失在1%之內,說明穩定分類仍能得以實現,即「有限全球樣本穩定地表覆蓋分類」的理論是成立的。這一理論保證了對樣本進行遷移的有效性。
該文對2017年10米解析度的FROM-GLC10產品進行了精度檢驗,並將其與2017年30米解析度的FROM-GLC30產品進行了比較。檢驗和比較結果顯示,FROM-GLC10總體精度為72.76%,與FROM-GLC30精度相當,但FROM-GLC10的結果提供了更多的空間細節。
本文的第一作者和通訊作者是宮鵬教授,地學系博士生劉涵、張美男等是論文合作者,中國科學院遙感與數字地球研究所遙感科學國家重點實驗室、清華海峽院人工智慧地球實驗室總工程師王傑,中國科學院遙感與數字地球研究所遙感科學國家重點實驗室副研究員黃華兵,谷歌尼古拉斯·柯林頓是論文共同通訊作者。