蓋世汽車訊 在開發自動駕駛汽車的激烈競爭中,雷射雷達已成為最關鍵的硬體組件之一。雷射雷達系統生成精確的點雲數據,作為周圍環境的3D地圖,以提高自動駕駛汽車的感知能力和安全性。然而,對於AI研究人員而言,雷射雷達點雲語義分割仍然是一大挑戰。
(圖片來源:syncedreview.com)
標註3D點雲的缺乏阻礙了語義分割任務中深度神經網絡性能的進一步提高。儘管一些自動駕駛公司發布了一些數據集,但雷射雷達傳感器的配置不同和其他域的差異導致了這一問題:在一個數據集上訓練的深度網絡在其他數據集上表現不佳。據外媒報導,為了彌補雷射雷達傳感器中3D點雲採樣差異造成的域差距,谷歌研究團隊提出了一種新的「補全和標註」域適應方法,即雷射雷達點雲語義分割域適應方法(A Domain Adaptation Approach to Semantic Segmentation of LiDAR Point Clouds)。
研究人員發現了關鍵的一點:雷射雷達樣本具備底層幾何結構,運用利用這些結構的3D模型,域適應可以更為有效。該團隊假設了一個由3D表面組成的物理世界,並將域適應挑戰作為3D表面補全任務。
研究人員表示,「如果我們可以從稀疏的雷射雷達點樣本中恢復完整的3D底層表面,並訓練在補全後的表面上運行的網絡,這樣就可以利用雷射雷達掃描儀的標註數據來處理其他數據。」該團隊設計了一個稀疏體素補全網絡(SVCN)來補全稀疏點雲的3D表面。該網絡結構包括兩個階段:表面補全和語義標註。與語義標註不同,獲取SVCN訓練配對不需要人工標註,因為表面補全可以從自我監督中學習。
該團隊在根據多個雷射雷達數據幀重建的完整表面的監督下,對補全網絡進行訓練。這些雷射雷達幀包含2400個可用於訓練的完整場景點雲,200個可用於測試的點雲。一旦3D表面被恢復,研究人員使用稀疏卷積U-Net來預測完整表面上每個體素的語義標籤。在3D計算機圖形學中,體素是定義3D空間中點的圖形信息單位。
該團隊通過使用不同的自動駕駛數據集進行實驗,評估域適應新方法的有效性。實驗結果顯示,與此前的域適應方法相比,該方法的性能提高了8.2- 36.6%。例如,利用該方法,在Waymo開放數據集上訓練的網絡在nuScenes數據集上執行語義分割任務的平均IoU(Intersection-Over-Union,交並比)) 提高了10.4%,IoU是語義分割中最常用的度量指標之一。
該域自適應方案旨在填補雷射雷達傳感器3D點雲的域差異,其提升語義分割性能的能力對於自動駕駛、語義映射和施工現場監控等應用具有巨大潛力。