大場景高光譜遙感影像非局部可拓展加權稀疏低秩子空間聚類方法研究
Nonlocal Means Regularized Sketched Reweighted Sparse and Low-Rank Subspace Clustering for Large Hyperspectral Images
大場景高光譜遙感影像稀疏聚類方法研究
Sparsity-Based Clustering for Large Hyperspectral Remote Sensing Images
H. Zhai, H. Zhang*, L. Zhang, P. Li (2020). Nonlocal Means Regularized Sketched Reweighted Sparse and Low-Rank Subspace Clustering for Large Hyperspectral Images. IEEE Transactions on Geoscience and Remote Sensing. DOI: 10.1109/TGRS.2020.3023418. (SCI, IF: 5.855, 地大T2, JCR Q1, 中科院大類1區,Top期刊)論文下載連結:
http://ieeexplore-ieee-org-s.webvpn.cug.edu.cn:8118/document/9205649
H. Zhai, H. Zhang*, L. Zhang, P. Li (2020). Sparsity-Based Clustering for Large Hyperspectral Remote Sensing Images. IEEE Transactions on Geoscience and Remote Sensing. DOI:10.1109/TGRS.2020.3032427. (SCI, IF: 5.855, 地大T2, JCR Q1, 中科院大類1區,Top期刊)論文下載連結:http://ieeexplore-ieee-org-s.webvpn.cug.edu.cn:8118/document/9257589
翟晗,博士,中國地質大學(武漢)地理與信息工程學院副教授、碩士生導師。主要從事遙感圖像處理、遙感信息提取與應用等方向的科學研究工作。聯繫方式:zhaihan@cug.edu.cn (H. Zhai)
張洪豔*(通訊作者),博士,武漢大學測繪遙感信息工程國家重點實驗室教授、博士生導師、教育部青年長江。主要從事影像質量改善、高光譜信息處理與農業遙感等方向的科學研究工作。聯繫方式:zhanghongyan@whu.edu.cn (H. Zhang)
張良培,博士,武漢大學測繪遙感信息工程國家重點實驗室教授、博士生導師、教育部長江學者,IEEE Fellow。主要從事測繪、遙感圖像處理、人工智慧、模式識別等方向的科學研究工作。
李平湘,博士,武漢大學測繪遙感信息工程國家重點實驗室教授、博士生導師。主要從事攝影測量與雷達影像處理等方向的科學研究工作。
高光譜遙感能夠捕獲地物納米級的連續光譜曲線,以較高的光譜診斷能力對地物目標進行精細化分類與識別,高光譜數據已成為眾多行業領域的重要數據源。然而,高光譜影像是典型的高維數據,地物信息提取通常需要數目較大的訓練樣本。但在實際遙感應用中,訓練樣本的採集通常需要耗費大量的人力物力,尤其在某些邊遠無人區,勘測人員很難到達,先驗信息根本無法獲取,極大地制約了高光譜遙感的行業應用能力和水平。因此,如何擺脫訓練樣本的限制,實現無先驗信息條件下高光譜遙感地物信息的精細化提取,提升高光譜數據的應用潛力,具有重要的理論意義與應用價值。高光譜聚類是一種常用的非監督信息提取技術,其能夠不依賴於任何訓練樣本,僅通過挖掘數據潛在的本徵結構,實現像素點集的自然劃分。然而,受複雜成像環境的影響,高光譜數據具有十分複雜的內部結構、地物光譜時空多變,使得高光譜聚類成為一項非常具有挑戰性的任務。傳統聚類方法由於未能準確建模高光譜影像的複雜結構和光譜變化,通常難以取得理想的聚類結果。近年來,子空間聚類方法在高光譜遙感領域得到了成功應用,取得了較為顯著的成績。然而,由於大規模圖優化及圖割問題,該類方法通常受到計算複雜度的困擾,時間成本極高,對計算資源的依賴很大,可拓展性十分有限,難以適應實際大場景應用需求。有鑑於此,在子空間聚類模型的基礎上,我們提出了兩種新型大場景高光譜遙感影像聚類方法,分別為非局部可拓展加權稀疏低秩子空間聚類方法(Nonlocal means regularized sketched reweighted sparse and low-rank subspace clustering NL-SSLR)和稀疏聚類方法(Sparsity-based clustering)。首先介紹第一種方法,非局部可拓展加權稀疏低秩子空間聚類(NL-SSLR)。為有效降低子空間聚類模型的計算複雜度,我們引入可拓展子空間聚類模型(Sketched subspace clustering model),利用隨機投影快速構建具有同等刻畫能力的壓縮字典,如圖1所示,用於像素自表達學習,從而高效挖掘高光譜影像數據結構。在此基礎上,構建加權稀疏低秩表達模型,同時挖掘高光譜影像像素點集潛在的局部結構信息和全局結構信息,從而更加準確的學習高光譜像素之間潛在的鄰接關係;另一方面,構建非局部均值正則化約束,探究影像的自相似性,耦合影像非局部空間信息在表達域一體化建模,充分挖掘影像空-譜特徵在表達域的高判別性,同時促進係數矩陣的平滑性,以保障聚類結果的空間一致性。
提出的NL-SSLR算法模型可以構建如下,其工作機制如圖2所示:
其中,Y為高光譜數據二維矩陣,B為構建的壓縮字典,A為係數矩陣,為非局部均值係數矩陣,W為權值矩陣,、和為正則化參數。對於上述優化問題,利用交替方向乘子算法可進行有效求解。
圖2 非局部可拓展加權稀疏低秩子空間聚類方法工作機制
以廣泛使用的AVIRIS傳感器獲取的美國薩利納斯農場數據(Salinas)為例,驗證該算法的有效性。該數據大小為,具有224個光譜波段,3.7m空間解析度,共16種典型地物,其中包含較多的植物亞類,光譜相似度較高,如圖3所示,給聚類分析帶來較大挑戰。
圖 3 Salinas實驗:(a) 假彩色圖像,(b) ground truth, (c) 16類地物平均光譜
我們選取8種典型的聚類方法作為對比算法,其結果如圖4和表1所示。從圖4和表1中可以看出,我們提出的NL-SSLR算法在有效降低子空間聚類模型計算複雜度的同時,進一步提高了模型的聚類性能,在子空間聚類方法因內存原因無法正常工作的情況下,在該場景影像上取得了最優的聚類結果,且相較於其他方法,其聚類精度有大幅提高。
圖 4 Salinas實驗聚類結果:(a) Ground truth, (b) FCM, (c) FCM-S1, (d) SSC (OM means out of memory), (e) L2-SSC (OM means out of memory), (f) Scalable-SC, (g) SGCNR, (h) FSCAG, (i) Sketched-SSC, and (j) NL-SSLR.
接下來,介紹第二種方法,稀疏聚類方法(Sparsity-based clustering)。相比於子空間聚類方法,我們借鑑高光譜分類思想,將大規模像素點集的圖優化問題轉化為逐像素優化求解問題,從而大幅降低了模型的計算複雜度和時間成本。同時,我們沿用子空間思想,將每個目標像素僅由其同子空間中原子進行稀疏重構,以準確建模高光譜數據的內部結構和光譜變化。在稀疏表達的理論框架下,我們提出兩種具體的稀疏聚類模型,分別為稀疏編碼聚類模型(sparse coding-based clustering SCC)和聯合稀疏編碼聚類模型(joint sparse coding-based clustering JSCC)。首先,在沒有任何訓練樣本和先驗知識的條件下,充分挖掘聚類中心的類別指示性,利用k-means對影像進行預聚類,結合 K最近鄰方法,依次選擇離各聚類中心最近的k個像素,構建結構化字典,用於像素稀疏編碼,如圖5所示。其次,藉助結構化字典,構建稀疏編碼模型,求解每個目標像素的稀疏編碼係數,通過挖掘編碼係數潛在的結構模式,根據最小殘差準則,實現像素的類別劃分。最後,考慮到稀疏編碼模型僅利用影像光譜信息,判別能力有限,通過引入超像素鄰域,構建聯合稀疏編碼模型,自適應探究鄰域像素稀疏表達的共性特徵,促進鄰域像素共享相同的稀疏基及係數稀疏模式,同時耦合影像空間信息輔助光譜分析,從而進一步提高聚類精度。
提出的稀疏編碼模型(SCC)和聯合稀疏編碼模型(JSCC)可以構建如下,其工作機制如圖6和圖7中所示:
其中,A為結構化字典,和分別為編碼係數與鄰域編碼稀疏矩陣,和分別為目標像素與超像素鄰域,s為稀疏度。
同樣以美國薩利納斯農場數據Salinas為例,驗證該算法的有效性。選取7種典型的聚類方法作為對比算法,其聚類結果如圖8和表2所示。從圖8和表2中可以看出,提出的兩種稀疏聚類方法在該場景中分別取得了最優及次優的聚類結果,相比於其他聚類方法,聚類精度有明顯提高。此外,可以發現,兩種稀疏聚類方法均較為高效,時間成本較低,具有很強的實用性。
圖 8 Salinas實驗聚類結果:(a) ground truth, (b) FCM, (c) FCM-S1, (d) SSC-S, (e) L2-SSC, (f) LRSC, (g) SGCNR, (h) FSCAG, (i) SCC, and (j) JSCC.
研究表明,我們提出的兩種新型高光譜聚類方法,非局部可拓展加權稀疏低秩子空間聚類方法和稀疏聚類方法,均能夠在有效降低子空間聚類模型計算複雜度、提高模型可拓展性的同時,大幅提高聚類精度。兩種方法各具特點,非局部可拓展加權稀疏低秩子空間聚類方法考慮因素更加全面,通常可以得到更高的聚類精度;稀疏聚類方法具有更小的計算複雜度和更低的時間成本,實用性更強。綜上所述,兩種聚類方法能夠較好地適用於實際大場景應用分析,進一步提升了高光譜遙感的應用潛力,為無先驗信息條件下大場景高光譜影像地物信息精細化提取提供了有力工具。