計算專題丨[轉] 移動端高質量在線三維掃描儀Mobile3DScanner (IEEE TVCG)

2021-12-29 IntelligentOptics

在移動平臺上基於RGBD相機實現實時高質量的物體三維掃描重建是增強現實應用中的關鍵技術之一。現有的重建方法一方面受限於移動平臺上的算力以及內存資源,難以對大型物體進行高質量的掃描重建,另一方面,目前消費級的深度傳感器所獲取到的深度信息存在不同程度的缺失、錯誤以及過於平滑的問題,導致最終生成的模型幾何精度不高。為了解決這些問題,商湯研究院和浙江大學 CAD&CG 國家重點實驗室合作提出了一套針對移動平臺的高質量物體三維掃描重建方案,主要包括:將IMU與ICP以及視覺信息相結合,實現相機6自由度位姿的準確估計、一種自適應調節體素的TSDF方法以解決移動端掃描大物體時的內存不足問題、一種結合深度先驗的多視圖立體匹配方法以及一種高效的Shape-from-Shading方法來提升重建模型的幾何精度與細節。我們在iPad Pro 2020上實現了整套重建方案,對比結果表明我們的方法能在移動平臺上實現實時的三維物體掃描重建,重建模型的完整度以及精度均優於現有的模型重建方法。

1)   提出了一種將ICP與IMU鬆耦合的方法,實現相機6自由度位姿的準確估計;

2)   提出了一種體素自適應調節的TSDF方法以解決移動端掃描大物體時所面臨的內存不足問題;

3)   提出了一種結合深度先驗的多視圖立體匹配方法以提升深度圖的精度與完整度;

4)   提出了一種高效的Shape-from-Shading方法,提升重建模型的幾何精度與細節。

目前主要的靜態物體重建方法可以分為兩類:基於RGBD相機的三維掃描重建與基於圖像的多視圖重建。

1.基於RGBD相機的三維掃描重建

此類方法以KinectFusion為代表,對輸入的深度圖利用ICP求解相機位姿,並將深度圖融合成一個全局的TSDF模型,類似的工作還有InfiniTAM以及BundleFusion,但由於計算複雜度以及內存佔用的原因,它們只能在PC端運行。此外,還有結合用戶手操作的交互式掃描重建方法以及基於非剛性註冊的物體掃描重建,這類方法大多適用於小物體重建。

2.基於圖像的多視圖重建

此類方法致力於在行動裝置上實現基於單目RGB視頻的物體掃描重建,他們利用多視圖立體匹配的方法恢復出單幀的深度並將深度融合成TSDF模型或者Surfel模型。總體而言,這類方法重建出的模型在模型精度以及完整度上與基於RGBD相機的重建方法相比還有一定差距。

如圖1所示,我們的重建系統要求用戶配備一個帶有RGBD攝像頭的移動計算設備,並將待掃描的物體放置在一個水平面上。用戶開始掃描後,系統將自動分割出物體區域並實時求解相機位姿,深度傳感器獲取到的深度數據將被融合成TSDF模型並渲染供用戶作實時預覽。掃描結束後,系統將對所有的關鍵幀進行全局BA並結合多視圖立體匹配方法來優化關鍵幀的深度,最終融合出的TSDF模型經由泊松重建、Shape-from-Shading以及紋理貼圖後,得到最終帶紋理的重建模型。

移動平臺算力有限,我們提出將ICP與IMU進行鬆耦合來提升相機位姿求解的魯棒性與精度。我們首先利用初始兩幀的ICP結果對IMU模塊進行初始化,IMU初始化完成後即可依據輸入的IMU數據為當前幀提供位姿預測,我們再將IMU的預測值加入ICP能量項來求解當前幀的相機位姿ξ,當前幀位姿求解完成後,其結果將作為約束來進一步優化IMU的狀態量。原本的ICP能量項考慮了兩幀之間的顏色差:

圖2.(a)Open3D ICP. (b)引入IMU. (c)(d)加入LBA以及Loop Closure.

移動平臺上內存有限,必須約束TSDF模型的大小,我們提出一種自適應調節體素的TSDF方法,當其內存佔用量達到閾值時,系統將自動創建一個新的TSDF,其體素大小為舊體素的1.5倍,新體素的符號距離以及權重無需重新計算,可通過舊體素三線性插值高效獲取。這個策略可保證TSDF模型的內存佔用不會超過用戶設定的閾值,從而在行動裝置上能支持大物體的掃描重建。

圖3.(a)關鍵幀. (b)dToF單幀深度以及融合後的模型. (c)SGM單幀深度. (d)結合深度先驗的SGM及其模型.

消費級的深度傳感器例如dToF,其獲取的深度存在不同程度的錯誤以及過平滑問題,我們提出一種結合深度先驗的SGM方法,利用視覺信息來提升深度圖的精度,其效果如圖3所示。

Shape-from-Shading可以提升重建模型的幾何細節,但目前已有的實現方案無論是計算複雜度還是內存佔用都遠無法在移動平臺上實施。不同於現有方案,我們直接在重建好的模型上優化三角面片的法向量,再結合方法更新模型頂點。以圖4中的「David」為例,我們的方法在iPad Pro2020 CPU上耗時3.24秒,優化後模型精度RMSE/MAE為3.12mm/2.473mm。而Intrinsic3D在PC端Intel Core i7 7700K CPU上耗時81分鐘得到略優的結果,RMSE/MAE為2.89mm與2.16mm。

我們用iPad Pro2020錄製了四組測試數據來對比我們的方案與現有的方案在模型精度上的差異,ground truth由商業掃描儀獲取。表格1以及圖5顯示我們的方法在模型精度以及完整度上都取得了最優結果。

圖5.與現有SOTA方法的模型對比.

(b)Open3D.(c)KinectFusion.(d)InfiniTAM.(e)BundleFusion.(f)3D Scanner App.(g)我們的方法.(h)GT.

表格2統計了算法各個步驟在iPad Pro2020上的耗時,我們的方法在大物體「worker」上也達到了實時。

論文信息——

Mobile3DScanner: An Online 3D   Scanner for High-quality Object Reconstruction with a Mobile Device

作者:項驍駿,姜翰青,章國鋒,餘亦豪,李辰宸,楊幸彬,陳丹鵬,鮑虎軍

收錄於Special issue of TVCG for ISMAR 2021 Journal

論文連結:

http://www.cad.zju.edu.cn/home/gfzhang/papers/mobile3dscanner/mobile3dscanner_ismar2021.pdf

論文主頁: 

https://zju3dv.github.io/mobile3dscanner.github.io/

* 本文轉自ZJAI-AR分會成果分享。因篇幅排版需要,該轉載對所轉載的網絡公開素材進行了適當刪減及修改。

INTELLIGENTOPTICSSHARING (I.O.S.) 運營以該領域的研究學者為主,非盈利非廣告,希望能夠結交共同興趣方向的讀者們,建立光學和計算機交叉學科領域內一個資訊分享交流的平臺。我們將不定期推薦學術領域具有代表性的計算顯示和計算成像研究工作,同時穿插一些新型光學設計和VR/AR光機實現科普等的資訊分享。還望大家多多支持,歡迎來稿,歡迎拍磚。intelligent.optics.sharing@gmail.com

相關焦點

  • ISMAR 2021|商湯和浙江大學聯合提出移動端高質量在線三維掃描儀Mobile3DScanner
    論文作者:項驍駿(商湯科技),姜翰青(商湯科技),章國鋒(浙江大學),餘亦豪(商湯科技),李辰宸(商湯科技),楊幸彬(商湯科技),陳丹鵬(商湯科技),鮑虎軍(浙江大學)論文地址:https://ieeexplore.ieee.org/document/9523840
  • 三維雷射掃描儀
    它突破了傳統的單點測量方法,具有高效率、高精度的獨特優勢,可以快速、大量的採集空間點位信息,為快速建立物體的三維影像模型提供了一種全新的技術手段。三維雷射掃描儀具有快速性、不接觸性、實時、動態、主動性、高密度、高精度,數位化、自動化等特性。三維雷射掃描系統主要有三維雷射掃描儀、計算機、電源供電系統、支架及配套軟體構成。
  • 三維雷射掃描儀在地質礦山上應用
    由於三維雷射掃描測量系統具有快速性、實時性、高密度、高精度等特點。使用它對地形地質進行掃描,可以很快的獲得整個區域空間的位置及三維模型,從而可以監測地表沉降、邊坡監控、繪製地形圖、測高程、填挖方計算等。
  • ManageBac移動端App全新上線 ManageBac on Mobile
    ManageBac新版iOS App全新上線,此次移動端在主控頁面與日曆更新的基礎上對全部課程項目與所有用戶(學生、家長、教師與管理員)的界面設計做了全新改版,旨在提升ManageBac移動端的用戶體驗。
  • 新品發布|臻3D FREESTYLE 2 – 可攜式移動三維掃描儀
    Freestyle 2 是一款高質量的可攜式三維掃描儀,專為快速捕獲逼真的三維現實捕獲而設計。
  • ISMAR 2020 Best Paper | 商湯提出手機端實時單目三維重建系統
    商湯研究院和浙江大學 CAD&CG 國家重點實驗室合作研發了一個手機端實時單目三維重建系統 Mobile3DRecon。與現有的基於 RGBD 的在線三維重建或離線生成表面網格的系統不同,該系統結合前端位姿跟蹤結果,允許用戶使用單目攝像頭在線重建場景表面網格。在深度估計方面,提出結合多視圖半全局匹配算法和深度神經網絡優化後處理過程魯棒地估計場景深度。
  • 商湯提出手機端實時單目三維重建系統,實現逼真AR效果和交互
    商湯研究院和浙江大學 CAD&CG 國家重點實驗室合作研發了一個手機端實時單目三維重建系統 Mobile3DRecon。與現有的基於 RGBD 的在線三維重建或離線生成表面網格的系統不同,該系統結合前端位姿跟蹤結果,允許用戶使用單目攝像頭在線重建場景表面網格。在深度估計方面,提出結合多視圖半全局匹配算法和深度神經網絡優化後處理過程魯棒地估計場景深度。
  • 嵌入式AI簡報2021-01-05: 驍龍480/微信AI超分/256KB內存檢測/移動端單目Mobile3DRecon
    ,商湯手機端實時單目三維重建系統Mobile3DRecon,基於Hessian矩陣的全自動混合精度量化方法HAWQv2;【開源】OneFlow發布0.3.2性能更優體驗率先支持CUDA11.1,Paddle飛槳發布2.0RC加入高層API且動靜統一,細數DeepMind Jax生態工具,清華Jittor發布1.2.2
  • 疫情當前,閉關科研 | IEEE在線技術課程免費開放啦!
    本次限免活動,IEEE共開放60多個在線學習課程,這些精挑細選的課程涵蓋了人工智慧、自動駕駛、區塊鏈、物聯網、邊緣計算、網絡安全等等一系列目前科技領域比較前沿的技術點。IEEE希望此次在線課程的限免活動能幫助廣大科研工作者及在校師生,獲得更多的科研信息,提高科研效率。
  • 地面三維雷射掃描儀產品簡述
    上圖為iPhone 6概念機的一項功能,通過三維投影等相關技術實現畫面的實時三維顯示和互動操作。隨著這方面技術的不斷成熟,應用的逐步廣泛,人們應用的電子產品會越來越小,功能越來越豐富,這也自然會促進三維數據信息的應用。
  • 基於移動三維雷射掃描的盾構隧道斷面提取與應用
    傳統站式三維雷射掃描儀雖然也能獲取大量隧道結構點雲數據,但站式掃描儀存在需要搬站,後期處理需要拼接,高比例重疊產生大量冗餘數據的不足不能更好地適應地鐵隧道的測量需求。  近年,移動三維掃描技術的測量速度和測量精度都有了大幅的提高,該技術恰巧能解決目前隧道斷面監測中碰到的測量天窗時間短及測量範圍不足的問題。
  • 基於增強現實的三維建築物模型移動可視化系統
    為獲得清晰的場景融合效果,本文從三維建築物的網格模型中抽取非共面相鄰面片的交界邊線得到其外輪廓線進行渲染。具體過程是,先計算相鄰面片的法線,再根據這兩個法線的夾角是否為0判斷是否共面。為避免三維模型數據噪聲和計算精度的影響,採用法線夾角是否小於0.01這一很小的閾值來代替是否為0的判斷。建築物外輪廓線的提取渲染實現了在儘可能地保留建築物外觀特徵下減少網格線條的數量,效果如圖2d所示。
  • 三維雷射掃描儀在建築物立面測量中的整個技術流程
    與傳統方法相比,它既可以節省外業工作時間,縮短工期,又可以將建築、管道等信息全部記錄下來,方便後期二維出圖與三維建模,從而更好的對工廠設施進行管理。三維雷射掃描儀主要是一部快速準確的雷射測距儀加上一組可導引雷射以等速度掃描的反光稜鏡,加高清晰攝像機組成。
  • 使用 Python 創建自己的文檔掃描儀
    我們中的許多人轉向了在線工作。隨著在線工作量的增加,人們通常不得不通過電子郵件或其他方式呈現文檔的數位化版本。換句話說,將任何文檔轉換為掃描文檔。本文,將介紹如何使用 Python 從頭開始創建文檔掃描儀。準確地說,是用於圖像/視頻處理的 OpenCV 庫。文件掃描儀讓我們先從簡單的功能開始,並根據需要增加其他功能。
  • Facebook將照片3D化技術商用,強大的算法+海量的數據+移動端優化是工程亮點
    2D圖像轉成3D圖像,這項服務支持iPhone 7以上蘋果手機和大多數中高端安卓手機。其中使用了面向行動裝置優化的FBNet模塊,該模塊基本構成是點卷積層,可選的上採樣層,K x K深度卷積層和附加的點卷積層。
  • Artec Leo 新一代智能3D掃描儀
    工業設計和製造/醫療VR /電子商務/科學和教育取證/藝術和設計一個完全移動的瀏覽體驗
  • 【南極熊評測】易尚鷹眼S1桌面彩色3D掃描儀評測
    3、自動轉臺一個4、標定板一個5、航空鋁合金標定板支架一個6、USB3.01、打開軟體,選擇「標定」2、將標定板放入標定板支架上,放置於轉臺最外圍一圈刻度上,使有點的面朝向設備;3、調整掃描儀主機角度,使投影光線底邊對準轉臺最外一圈刻度,同時畫面內顯示出標定板左右兩邊箭頭
  • 富士通圖像掃描儀全球累計出貨量突破一千萬臺!
    此後,PFU不斷精益求精,不久之後又馬上推出了搭載ADF(注3)裝置的「fi 系列(注4)」高速圖像掃描儀,fi系列掃描儀隨機附帶的一系列軟體,以簡單易用的操作界面,簡化了掃描前後的操作流程,在自動優化圖像質量的同時,大幅提高了客戶的工作效率
  • 移動GIS跨平臺開發,MapGIS Mobile for React Native助你進階
    ,提升全空間三維能力,擁抱地理大數據與 AR 等技術,全面支持離線和在線模式的移動 GIS 應用。在線數據支持:MapGIS IGServer服務的矢量、瓦片服務、三維場景服務;WMS、WMTS、WFS等OGC服務;第三方地圖服務,如天地圖、谷歌地圖、百度地圖、OSM、Bing地圖等。全空間表達與分析能力持續增強,提升三維場景可視化功能,增加場景覆蓋物的地形貼合功能,提高場景操作流暢度與場景模擬逼真度,提升移動三維的性能。提供各類粒子特效、路徑漫遊、爆炸分析等全空間可視化與分析功能。
  • 計算專題 | 用於VRAR頭顯的動態多頻率視角圖像著色渲染 (IEEE TVCG)
    基於屏幕塊的渲染框架已經成功地在很多移動GPU上實現了應用。這一框架的關鍵設計理念在於按照屏幕塊局部化三角形的光柵化和著色計算,從而提升計算以及內存讀取的一致性。該研究工作新提出的框架則將其在雙目繪製情況下擴充為基於屏幕塊對(Tile Pair)的渲染。在如圖1所示,在新提出的繪製流水線中,雙目屏幕空間被分為等大小的塊。