【點雲一分鐘】SO-Net:用於點雲分析的自組織網絡

2021-02-14 點雲樂課堂

每天一分鐘,帶你讀遍點雲前沿文章

標題:SO-Net: Self-Organizing Network for Point Cloud Analysis

作者:Jiaxin Li, Ben M. Chen, Gim Hee Lee

來源:CVPR2018

編譯:鄭英林(1)

歡迎個人轉發朋友圈;其他機構或自媒體如需轉載,後臺留言申請授權

Abstract

本文提出SO-Net,一種用於無序點雲深度學習的置換不變網絡結構。 SO-Net通過構建自組織映射(SOM)來模擬點雲的空間分布。基於SOM,SO-Net對單個點和SOM節點進行分層特徵提取,最終用單個特徵向量來表示輸入點雲。網絡的感受野可以通過進行點對節點的KNN(k近鄰搜索)系統地調整。在識別點雲重建,分類,對象部分分割和形狀檢索等任務中,我們提出的網絡表現出的性能與最先進的方法相似或更好。另外,由於所提出的架構的並行性和簡單性,所以訓練速度比現有的點雲識別網絡快得多。我們的代碼可在項目網站上找到https://github.com/lijx10/SO-Net。

Introduction

經過多年的深入研究,卷積神經網絡(ConvNets)現在成為許多最先進的計算機視覺算法的基礎,例如,圖像識別,對象分類和語義分割等。儘管ConvNets在二維圖像方面取得了巨大成功,但在3D數據上使用深度學習仍然是一個具有挑戰性的問題。雖然3D卷積網絡(3D ConvNets)可以應用於光柵化為體素表示的3D數據,但由於大多數3D數據的稀疏性,大多數計算都是冗餘的。此外,不成熟的3D ConvNets的性能很大程度上受到解析度的損失和呈指數級增長的計算成本限制。同時,深度傳感器的加速發展以及自動駕駛汽車等應用的巨大需求使得高效處理3D數據成為當務之急。包括ModelNet [37],ShapeNet [8],2D-3D-S [2]在內的3D數據集的最新可用性增加了3D數據研究的普及。

為了避免簡單體素化的缺點,一種選擇是明確利用體素網格的稀疏性[35,21,11]。雖然稀疏設計允許更高的網格解析度,但其誘導的複雜性和局限性使其難以實現大規模或靈活的深度網絡[30]。另一種選擇是利用可伸縮索引結構,包括kd-tree [4],八叉樹[25]。基於這些結構的深度網絡顯示出令人鼓舞的結果。與基於樹的結構相比,點雲表示在數學上更簡潔和直接,因為每個點僅由3維向量表示。此外,藉助運動結構(SfM)算法,可以使用流行的傳感器(如RGB-D相機,LiDAR或常規相機)輕鬆獲取點雲。儘管點雲被廣泛使用,也能夠輕鬆獲取,但點雲識別任務仍然具有挑戰性。傳統的深度學習方法如ConvNets不適用,因為點雲在空間上是不規則的,並且可以任意排列。由於這些困難,很少有人嘗試將深度學習技術直接應用到點雲,直到最近的PointNet [26]。

儘管作為將深度學習應用於點雲的先驅,PointNet仍無法充分處理局部特徵提取。後來PointNet++[28]被提出來通過構建一個類似金字塔的特徵聚合方案來解決這個問題,但[28]中的點採樣和分組策略並沒有揭示輸入點雲的空間分布。Kd-Net [18]從輸入點雲構建kd樹,然後進行從樹葉到根節點的分層特徵提取。Kd-Net明確地利用點雲的空間分布,但是仍然存在諸如感受野不重疊等限制。

在本文中,我們提出SO-Net來解決現有基於點雲的網絡中的問題。具體而言,建立SOM [19]來模擬輸入點雲的空間分布,這使得在單獨的點和SOM節點上進行分層特徵提取成為可能。最終,輸入點雲可以被壓縮成單個特徵向量。在特徵聚合過程中,通過在SOM上執行點到節點的k-近鄰(KNN)搜索來控制感受野重疊。理論上,SO-Net通過特殊的網絡設計以及我們的置換不變SOM訓練來保證對輸入點的順序保持不變。我們的SO-Net的應用包括基於點雲的分類,自動編碼器重建,零件分割和形狀檢索,如圖1所示。 

本文的主要貢獻如下:

我們設計了置換不變網絡 - 顯式利用點雲空間分布的SO-Net。

通過在SOM上進行點到節點的KNN搜索,可以系統地調整感受野重疊來執行分層特徵提取。

我們提出一種點雲自動編碼器作為預訓練,以改善各種任務中的網絡性能。

與最先進的方法相比,在各種應用中獲得相似或更好的性能,並且訓練速度顯著加快。

論文原文連結:http://openaccess.thecvf.com/content_cvpr_2018/html/Li_SO-Net_Self-Organizing_Network_CVPR_2018_paper.html 


譯文CSDN博客連結:https://blog.csdn.net/elliottzheng/article/details/81111915

相關焦點

  • 【泡泡點雲時空】SO-Net:點雲分析的自組織網絡(CVPR2018-19)
  • Keras實例:PointNet點雲分類
    【導讀】點雲的分類,檢測和分割是計算機視覺中的核心問題。本示例實現了點雲深度學習論文PointNet。
  • 一分鐘詳解點雲配準ICP方法
    點擊上方「3D視覺工坊」,選擇「星標」乾貨第一時間送達連結:https://zhuanlan.zhihu.com/p/107218828本文轉載自知乎,作者已授權,未經許可請勿二次轉載。1.ICP 算法的第一步就是找到 Source 點雲與 Target 點雲中的對應點(corresponding point sets),然後針對對應點,通過最小二乘法構建目標函數,進行迭代優化。
  • 在點雲上進行深度學習:在Google Colab中實現PointNet
    與以像素陣列表示的2D圖像不同,它可以表示為多邊形網格,體積像素網格,點雲等。1.1.點雲點雲是一種廣泛使用的3D數據形式,可以由深度傳感器(例如LIDAR和RGB-D相機)生成。它是3D對象的最簡單表示:僅在3D空間中指向,沒有連通性。點雲也可以包含點的法線。幾乎所有3d掃描設備都會產生點雲。
  • ICCV2019 | 武漢大學提出手姿估計網絡SO-HandNet,效果卓越,已開源
    本文的靈感來自點雲自組織網絡(SO-Net)中的自編碼器,我們所提出的SO-HandNet旨在利用無注釋數據,以半監督的方式獲得精確的三維手部姿態估計。我們利用手的特徵編碼器(HFE)從手的點雲中提取多層次的特徵,然後將特徵融合送入手勢姿態估計器(HPE)中來進行手部姿態回歸。我們設計了一種手動特徵解碼器(HFD)來恢復輸入點雲編碼的特性。
  • 【泡泡點雲時空】PointMixup:點雲數據增強
    Snoek來源:ECCV 2020編譯:張金來審核:Lionheart歡迎個人轉發朋友圈;其他機構或自媒體如需轉載,後臺留言申請授權      本文通過點雲樣本之間的插值介紹了點雲的數據增強。在圖像域中,通過插值進行的數據增強已被證明是一種簡單有效的方法。
  • 如何將雲服務用於網絡間諜活動
    去年值得一提的另一件事是,國家贊助的組織將雲服務武器化的出現。現在,將雲用於網絡釣魚和惡意軟體交付(Ryuk勒索軟體可能是最值得關注的)之類的犯罪目的已經成為一種整合趨勢。但是,最近的一些活動表明,即使在網絡間諜活動中,雲利用也變得越來越普遍,在網絡間諜活動中,合法服務用於在多階段殺傷鏈中傳遞惡意有效負載,從而增加了額外的逃避層。
  • 分享(二)丨LiDAR點雲數據
    圖片來源於網絡雷射雷達技術(「光探測和測距」)在遙感界蓬勃發展,應用已較為廣泛。例如空中雷射掃描(ALS),可用於大規模建築、道路和森林測量;地面雷射掃描(TLS),可用於室內外環境中更詳細但速度較慢的城市測量;移動雷射掃描(MLS)精度比TLS低,但由於傳感器安裝在同一輛車上而具有更高的效率。
  • 【泡泡點雲時空】真實感環境下使用點雲感知的問答
    泡泡點雲時空,帶你精讀點雲領域頂級會議文章標題:Embodied Question Answering in Photorealistic Environments with Point Cloud Perception作者:Erik Wijmans, Samyak Datta, Oleksandr Maksymets, Abhishek Das,
  • 【泡泡點雲時空】PVCNN:用於高效3D深度學習的點-體素卷積神經網絡
    歡迎個人轉發朋友圈;其他機構或自媒體如需轉載,後臺留言申請授權本文提出了Point-Voxel CNN(PVCNN),可進行高效,快速的3D深度學習。先前的工作使用基於體素或基於點的神經網絡模型處理3D數據。但是,這兩種方法在計算上都不夠高效。基於體素的模型的計算成本和內存佔用量隨輸入解析度的增加而呈立方增長,從而使其無法擴展解析度。對於基於點的網絡,最多有80%的時間被浪費在構造內存局部性很差的稀疏數據,而不是實際的特徵提取上。
  • 關於TopoDOT點雲數據處理軟體
    TopoDOT是一套成熟的點雲數據處理及應用系統,全面具備點雲數據的存儲管理、精度檢核、點雲分類、特徵自動提取、智能分析、高效建模
  • Open3D點雲操作
    體素降採樣體素降採樣,是使用規則的(大小一致)立體網格將輸入點雲分割成一個個體素,創建統一降採樣的點雲。它通常用作許多點雲處理任務的預處理步驟。該算法分為兩個步驟:1. 點被存儲到體素中,即將 點雲分塊 存儲。2. 每個被佔用的體素通過平均其內部的所有點來精確地生成一個點,即 逐塊進行降採樣 。
  • 3D場景理解中的點雲深度學習
    9、 frustum point 2d檢測是gt還是檢測結果:gt ,進行了擾動,2個好處:1、簡單  2、可以和 2 d dector 有個分離,可以隨時換2d dector,而不用重新訓練後面的網絡。10、測試注意?測試方向旋轉 然後平均,數據增強,隨機drop 一些點,魯棒性更好。
  • 基於深度學習的三維點雲綜述part2-3D物體檢測與跟蹤
    該文章提出了一個Point-SENet組件去預測一組尺度因子,這組尺度因子可以被進一步用於自適應的提取有用的特徵並且抑制信息較少的特徵。此外,他們還在網絡中使用了PointSIFT組件去獲得點雲的朝向信息,該方法對於點雲的形狀縮放具有很強的魯棒性。
  • UNDET和AUTODESK RECAP點雲轉換效率對比
    我們分別使用 Autodesk ReCap 和 Undet Indexer 測試點雲的轉換效率。
  • 【泡泡點雲時空】OpenGF:包含世界各地公開ALS超大規模地面濾波點雲數據集
    然而,用於地面提取的大規模的場景豐富的公共數據集很少,這在很大程度上限制了有效的基於深度學習的地面過濾方法的發展。為此,我們推出了首個超大型地面濾波數據集OpenGF,該數據集覆蓋了超過47平方公裡的9個不同的典型地形場景,建立在全球4個不同國家的公開ALS點雲之上。OpenGF包含5億多個標記的地面點和非地面點,比事實上的標準ISPRS filtertest數據集標記點數量多數千倍。
  • ​pen3D點雲操作手冊
    本教程演示了對點雲的基本操作。顯示點雲[2]:print("Load a ply point cloud, print it, and render it")pcd = o3d.io.read_point_cloud("../..
  • 【泡泡一分鐘】VoteNet:一個3D深度學習的AR校準方法,用於使用深度數據的機器人
    每天一分鐘,帶你讀遍機器人頂級會議文章標題:A 3D-Deep-Learning-Based Augmented Reality Calibration Method for Robotic Environments Using Depth Sensor Data作者:Linh Kästner, Vlad Catalin Frasineanu, Jens
  • 【泡泡點雲時空】R-MVSNet:高解析度多視圖三維重建網絡
    泡泡點雲時空,帶你精讀點雲領域頂級會議文章標題:R-MVSNet: Recurrent MVSNet for High-resolution Multi-view Stereo Depth Inference作者:Yao Yao, Zixin Luo, Shiwei Li, Tianwei Shen, Tian Fang, Long Quan
  • 稀疏點雲建模
    相對來講,密集點雲和抄數線都比稀疏點雲更好建模一些。