港城大提出任意比例的上採樣方法, 實現自由三維點雲稠密重建

2021-01-08 網易

  

  From: 香港城市大學 編譯: T.R

  近日,來自香港城市大學的研究人員提出了一種基於線性近似的網絡模型MAPU-Net,可以在一次訓練後對輸入的稀疏點雲實現任意「放大比例」的上採樣。

  針對需要上採樣的點雲,模型首先通過獲取現有點在切平面上的領域點,學習局域幾何信息獲取插值權重、生成分布在凸包區域內的鄰域點雲,隨後利用稀疏點雲的法向量通過數據驅動的方式來優化點雲結果,獲取最終上採樣後的點雲。

  這種方式在一次訓練後可以應用於多個尺度的上採樣過程中,並能夠生成較為精細的幾何結構,具有更強的可解釋性和更好的內存效率。

  

  詳情請參見論文:

  https://arxiv.org/pdf/2011.12745.pdf

  3D點雲對於複雜幾何形貌的目標和場景有著非常強大的表達能力,被廣泛應用於機器人操作、無人駕駛、沉浸式感知和文物遺蹟保護等領域。但在現有技術條件下,獲取準確稠密的三維點雲還是一項耗時耗力的工作。這一領域的研究人員一直致力於利用軟體的計算手段來代替硬體,從稀疏的低解析度的點雲中獲取稠密的高解析度的點雲結果。

  3D點雲上採樣問題通常被視為圖像超分辨在三維領域的對應問題,人們從圖像超分辨領域借鑑了很多技術處理這一領域的問題。但由於點雲與生俱來的非規則性和非均勻性,這些基於規則圖像的方法無法發揮出應有的能力。此外,三維點雲代表的是目標或場景表面的幾何形貌信息,而圖像則記錄了目標或場景的反射光強信息,這樣的差異使得圖像領域的超分辨技術無法有效應用於三維點雲的處理上來。

  針對點雲上採樣問題, 目前學術界主要從兩個角度來解決問題,分別是優化方法和基於深度學習的方法 。基於優化的方法通常利用局域特徵來對局部幾何信息進行擬合,在平滑的曲面上可以得到非常好的效果。但這種方法無法保留多尺度的細節,無法有效重建較為細微的形貌信息。 而利用神經網絡的方法從數據中學習出幾何形狀點雲表達會比基於優化的方法表現更好,但現有的深度學習方法對於點雲的幾何特性考慮較少,限制了深度學習對於這一問題的處理能力。

  此外,很多深度學習方法的上採樣率保持固定,這意味著每當需要改變上採樣率的時候就需要重新對網絡進行訓練,消耗大量的調參和訓練時間。所以人們開始研究 只需要訓練一次就能對任意上採樣率進行處理的網絡模型 。

  近日,來自香港城市大學的研究人員提出了一種基於線性近似的網絡模型 MAPU-Net ,可以在一次訓練後對輸入的稀疏點雲實現任意「放大比例」的上採樣。這種方式在一次訓練後可以應用於多個尺度的上採樣過程中,並能夠生成較為精細的幾何結構,具有更強的可解釋性和更好的內存效率。

  
理論分析

  針對輸入的點雲,在用戶給定的上採樣尺度下需要進行稠密的上採樣,並保持重建後的幾何細節。具體來講,針對每個輸入的點,需要通過某種插值的方式有效獲取其R個鄰近的點。

  

  為了從理論上定義這一問題,研究人員首先定義了輸入稀疏點集以及其鄰域內的k個最鄰近點。首先假設輸入點周圍所要重建的目標表面是局部平滑的,這意味著這一部分可以表達為函數形式:

  那麼周圍鄰域點也可以表示為同樣的方程

  如果梯度連續可以將這一局部的曲面表示為高度的隱函數的形式

  利用泰勒展開進行一階近似後高度函數可表示為:

  此時可以將需要生成的上採樣點的坐標表示成輸入鄰域點的仿射組合,

  

  上面的式子就可以改寫為:

  

  此時可以定義:

  

  第一項需要估計切平面,第二項是採樣點的線性組合,所以使用第二項來進行最終點的估計,同時再加入一項誤差項來進行優化。所以最終點的結果可以表達為下面的式子:

  以上的理論分析意味著 三維點雲插值可以被簡化為對於插值權重的估計和對於誤差修正項的優化過程 ,所以本文提出的網絡結構也針對這兩部分展開實現點雲上採樣。

  MAPU-Net

  在理論分析的指導下,研究人員提出了點雲上採樣MAPU-Net模型,可通過輸入點雲自適應地學習插值權重和優化誤差。整套模型的結構框架如下圖所示,其中 主要包含了三個主要部分:局域特徵抽取、插值權重學習以及坐標優化。

  

  在稀疏點輸入的前提下,MAPU-Net首先為每個點學習到了D維的高維特徵,同時包含最鄰近K個點位置信息。最後兩種高維特徵被融合得到插值權重,輸入稀疏點雲得到稠密結果。最後,利用基於法向量引導的誤差估計結果對稠密化的點雲進行優化。在一次訓練後,這種方法可以用於熱議上採樣率的點雲加密任務中去(

  首先,輸入點雲被投影到高維特徵空間中,利用局域特徵抽取獲得有效的特徵表達;隨後,利用三維特徵進行回歸學習獲取插值權重,得到較為粗糙的上採樣點雲結果;最後,利用採樣點稀疏法向量引導的優化方式來獲取最終優化後的點雲。在實際使用時,逐區域地進行處理上採樣處理。

  
在 局域特徵抽取 階段,研究人員採用了動態圖網絡將每個輸入點投影到高維特徵空間進行處理。與先前方法對點表述不同的是,這種基於動態圖網絡的方法基於先前層得到特徵間的距離來定義鄰域,並使用了全連接來聚合多層特徵。通過在特徵空間中對鄰域進行處理,使得最終的編碼同時包含了局域和非局域特徵,以及擾動不變性。

  
在 上採樣 階段,利用多層感知機對學習出的特徵進行處理以得到從輸入點到上採樣點間的插值函數。為了處理任意比例的上採樣任務,研究人員還將得到的R個權重歸一化到Rmax,以便根據不同上採樣比例選取不同的上採樣權重進行處理。最終輸出的權重大小為權重的數量與尺度數量Rmax的乘積。在實際使用過程中,針對上採樣率R,只需從權重矩陣中選出Top-R個權重,生成R倍的點即可。

  
在最後的 法向量引導優化 階段,由於生成的點與潛在的幾何表面還有一定距離的誤差,需要利用法向量引導的方法來優化這一誤差結果。首先利用前一步獲取的點的高維特徵對此處的法向量進行估計,而後利用另一個多層感知機來獲取插值點處的誤差,最終利用獲取到的誤差與法向量進行點乘來得到生成點最終需要獲取的位移結果。

  最終在訓練時引入了Chamfer距離、投影距離和法向量間的誤差來作為最終的損失進行訓練。

  實驗結果

  實驗最終在Sketchfab雕塑數據集,體素化人體數據集8iVFB,以及KITTI點雲數據集上進行,研究人員與xxx等先進的算法在Chamfer距離、Hausdorff距離、點到表面的距離以及J-S散度等指標上進行了比較。

  

  下圖展示了重建後的細節,輸入點雲數量為5000,GT的點雲數量為4萬(最後一列為GT,倒數第二紅色列為本文結果)。

  

  同時還驗證了雷射雷達上的測量結果,上採樣因子分別是4和8:

  

  對真實世界中的人體房屋也進行了重建研究,R分別為4,8,12,16:

  

  下圖還展示了在噪聲輸入的情況下0%,0.5%,1.0%,1.5%(左圖),以及對應4倍上採樣的結果。

  

  如果想要了解更多數學細節和訓練的過程,請參看原論文。

  本周上新!掃碼觀看!

  

  關於我「門」

  

  將門是一家以專注於發掘、加速及投資技術驅動型創業公司的新型創投機構,旗下涵蓋將門創新服務將門技術社群以及將門創投基金

  將門成立於2015年底,創始團隊由微軟創投在中國的創始團隊原班人馬構建而成,曾為微軟優選和深度孵化了126家創新的技術型創業公司。

  如果您是技術領域的初創企業,不僅想獲得投資,還希望獲得一系列持續性、有價值的投後服務,歡迎發送或者推薦項目給我「門」:

  bp@thejiangmen.com

  

  點擊右上角,把文章分享到朋友圈

  

  掃二維碼|關注我們

  讓創新獲得認可!

  微信號:thejiangmen

  點擊「?在看」,讓更多朋友們看到吧~

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺「網易號」用戶上傳並發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關焦點

  • 華中大提出新型採樣與重建算法, 提升稀疏深度稠密補全任務性能
    在本文中研究人員主要從數據和先驗的角度來改進算法,一方面與傳統採樣方法不同, 提出了一種基於泊松disk的採樣方式 ;另一方面與先前使用的規則處理核不同, 利用了圖卷積動態重建的方法 更好地恢復出稠密的深度結果。  實驗表明這種策略可以在更少的測量點情況下獲取更好的重建結果,同時對於室內和室外的場景都具有良好的泛化性。
  • 基於生成對抗網絡的三維點雲自動修復
    本文方法利用獲取的缺失數據和完整模型的樣本的大規模合成數據集, 訓練神經網絡直接從缺失點雲模型預測完整點雲模型, 通過監督學習策略有效解決三維點雲形狀的修復補全問題. 該方法以三維離散點雲數據作為輸入, 採用自編碼器並結合生成對抗網絡框架, 同時利用Wasserstein距離優化使得該網絡訓練穩定且能生成豐富的補全樣例.
  • 上海光機所提出基於結構光投影的快速三維重建方法
    三維掃描儀(3D scanner) 是一種科學儀器,用來探測並分析現實世界中物體的三維形狀。在工業設計、逆向工程、機器人導航、醫療檢查、刑事鑑定、文物保護、電影製片、遊戲創作等眾多領域中都有應用。雙目三維掃描系統中關鍵是如何解決對應問題,即如何確定左右兩幅圖像中的兩個像點是物體表面同一物點所成。
  • 三維變二維,港中文提出用於點雲卷積的局域展平網絡模塊FPConv
    為了克服三維卷積帶來的計算資源消耗和解析度限制,來自香港中文大學深圳分校等機構的研究人員們提出了一種基於局域展平的二維平面卷積方法FPConv,將點雲非線性投影到特殊平面上,而後在利用2D卷積進行有效地特徵抽取。這種方法將點雲轉換到二維平面上的投影過程和插值過程簡化為一個權重矩陣的學習。
  • 多視圖立體視覺: CVPR 2019 與 AAAI 2020 上的ACMH、ACMM及ACMP...
    ,由於數據量大、弱紋理、遮擋、反射等問題,如何高效準確地實現多視圖立體視覺仍然是一個具有挑戰性的問題。它的目的是從多個已知相機姿態的圖像中建立密集的對應關係,從而產生稠密的三維點雲重建結果。在過去的幾年裡,人們在提高稠密三維重建的質量上付出了很大的努力,一些算法如PMVS、GIPUMA以及COLMAP等取得了令人印象深刻的效果。 然而,在三維重建任務中,由於數據量大、弱紋理、遮擋、反射等問題,如何高效準確地實現多視圖立體視覺仍然是一個具有挑戰性的問題。
  • 三維感知與三維數據分析最新進展 - 3D傳感&人工智慧前沿科技論壇
    劉燁斌副教授團隊在此基礎上進行了改進,他們用單深度相機實現實時動態融合重建,不使用模版,可以支持和物體交互,可以任意視點重建。他和其他研究人員合作採集了一個包含視頻、雷射雷達點雲、駕駛員行為的駕駛數據集 DBNet,對應的論文《LiDAR-Video Driving Dataset: Learning Driving Policies Effectively》也被 CVPR 2018 收錄。在這個數據集上訓練端到端自動駕駛系統,就是把三維點雲(或者二維錄像)作為輸入,通過模型預測人類駕駛員會有怎樣的駕駛行為。
  • CVPR 2019 | PointConv:在點雲上高效實現卷積操作
    3D 點雲是一種不規則且無序的數據類型,傳統的卷積神經網絡難以處理點雲數據。來自俄勒岡州立大學機器人技術與智能系統(CoRIS)研究所的研究者提出了 PointConv,可以高效的對非均勻採樣的 3D 點雲數據進行卷積操作,該方法在多個數據集上實現了優秀的性能。
  • 利用飛行時間相機對玉米植物進行三維重建
    本研究提出了一種用於玉米作物行三維(3-D)重建的方法,該方法使用高解析度3-D圖像,通過最先進的軟體將其映射到彩色圖像中。其中點雲註冊方法是基於迭代最近點(ICP)算法演變而來。首先使用隨機樣本一致性(RANSAC)算法對入射點雲進行濾波,通過減少土壤點數直到達到一個閾值。
  • 賈佳亞等提出Fast Point R-CNN,利用點雲快速高效檢測3D目標
    選自arXiv作者:Yilun Chen、Shu Liu、Xiaoyong Shen、Jiaya Jia機器之心編譯參與:韓放、一鳴本文提出了一個統一、高效且有效的,基於點雲的三維目標檢測框架。其兩階段方法採用體素表示和原始點雲數據並充分利用了它們的優勢。
  • 無人機影像匹配點雲技術在道路測設中的研究與應用
    在高速公路、鐵路等線路工程測量中必須進行橫斷面測量,由於大型線路工程路基寬、設計精度要求高、縱橫斷面密度大,特別是在丘陵或山區地表高差變化大、行走不便的地方,使用傳統方法測量採集點位密度有限,橫斷面工作效率較低,一旦改線還需要重新進場測量,設計周期長,不能適應當前社會高速發展的節奏。
  • 多任務實現SOTA,UBC、谷歌等提出3D點雲的無監督膠囊網絡
    機器之心報導作者:杜偉、小舟這是一種為 3D 點雲提出的無監督膠囊架構,並且在 3D 點雲重構、配準和無監督分類方面優於 SOTA 方法。理解對象是計算機視覺的核心問題之一。傳統方法而言,理解對象任務可以依賴於大型帶注釋的數據集,而無監督方法已經消除了對標籤的需求。
  • 多任務實現SOTA,UBC谷歌等提出3D點雲的無監督膠囊網絡
    這是一種為 3D 點雲提出的無監督膠囊架構,並且在 3D 點雲重構、配準和無監督分類方面優於 SOTA 方法。理解對象是計算機視覺的核心問題之一。傳統方法而言,理解對象任務可以依賴於大型帶注釋的數據集,而無監督方法已經消除了對標籤的需求。
  • 老子云3D科普大講堂:地圖為什麼要三維的?
    3D地圖是以三維電子地圖資料庫為基礎,按照一定比例對現實世界或其中一部分的一個或多個方面的三維、抽象的描述。作為市場上首屈一指的3D模型輕量化服務提供商,老子云能為基於傾斜攝影數據的大場景模型提供極簡操作。
  • 三維雷射掃描測量技術探究及應用
    它們各自的產品在測距精度、測距範圍、數據採樣率、最小點間距、模型化點定位精度、雷射點大小、掃描視場、雷射等級、雷射波長等指標會有所不同,可根據不同的情況如成本、模型的精度要求等因素進行綜合考慮之後,選用不同的三維雷射掃描儀產品。  利用三維雷射掃描儀獲取的點雲數據構建實體三維幾何模型時,不同的應用對象、不同點雲數據的特性,三維雷射掃描數據處理的過程和方法也不盡相同。
  • 給城市高精度三維拍照,這個團隊震驚了世界
    「圖形+視覺」耦合感知一體化算法框架,推出泊松場導向、未知場景探測、細粒度重建、注意力驅動、面向物體識別、全局時變張量場、物體感知引導、在線建模、相機連續運動控制、大場景一鏡到底、航拍路徑生成優化、主動式和侵入式三維掃描等「智能感知和數據獲取」的新方法。
  • CVPR2017精彩論文解讀:直接處理三維點雲的深度學習模型
    隨著雷射雷達,RGBD相機等3D傳感器在機器人,無人駕駛領域的廣泛應用。針對三維點雲數據的研究也逐漸從低層次幾何特徵提取( PFH, FPFH,VFH等)向高層次語義理解過渡(點雲識別,語義分割)。與圖像感知領域深度學習幾乎一統天下不同,針對無序點雲數據的深度學習方法研究則進展緩慢。
  • 華人博士生提出大場景三維點雲語義分割新框架
    高效處理百萬量級的點組成的大場景3D點雲,比基於圖的方法SPG快近200倍Introduction實現高效、準確的大場景三維點雲語義分割是當前三維場景理解、環境智能感知的關鍵問題之一。儘管這些方法在三維目標識別和語義分割等任務上都取得了很好的效果,但大多數方法依然還局限於在非常小(small-scale)的點雲上(e.g., PointNet, PointNet++, Pointconv等一系列方法在處理S3DIS數據集時都需要先將點雲切成一個個1m×1m的小點雲塊, 然後在每個點雲塊中採樣得到4096個點輸入網絡)。
  • 奧比中光線上workshop:3D視覺賦能動態三維重建技術革新升級
    來源標題:奧比中光線上workshop:3D視覺賦能動態三維重建技術革新升級 9月22日,由奧比中光主辦,Open CV中國、CSDN開發者平臺支持發起的Workshop系列之動態三維重建專場線上沙龍在奧比中光B站官方平臺舉行
  • 在醫學圖像分析中使用ICP算法進行點雲配準
    1.摘要在本文中,我們結合了ICP算法(一種基於3D尺度不變特徵變換的方法),對3D自由形式閉合的曲面(人類頭骨的3D模型)進行配準。不同於點和表面的配準,我們提出的基於ICP算法的方法可以更好地捕獲數據的整體性質,例如骨骼厚度。
  • 科學家提出一種改進的前視聲納水下目標三維可視化方
    點擊上方「溪流之海洋人生」即可訂閱哦 隨著對水下場景探索的不斷研究,三維成像聲納能得到比二維直觀的目標圖像。聲納設備發射聲波,並根據回波信號進行定位和成像。但是每幀巨大的數據量和環境幹擾給目標識別和可視化帶來極大的困難。