CVPR 2020最佳學生論文分享回顧:通過二叉空間分割(BSP)生成緊湊3D...

2021-01-10 澎湃新聞

機器之心發布

機器之心編輯部

在近日舉行的 CVPR 2020 大會上,最佳論文、最佳學生論文等獎項悉數公布。加拿大西蒙弗雷澤大學陳之欽(Zhiqin Chen )等人的「BSP-Net」相關研究獲得了最佳學生論文獎,他們的論文題目是《BSP-Net: Generating Compact Meshes via Binary Space Partitioning》。在最新一期的機器之心 CVPR 2020 線上論文分享中,西蒙弗雷澤大學 (SFU) 博士一年級學生陳之欽以第一作者的身份向我們分享了這篇最佳學生論文。

在這項研究中,西蒙弗雷澤大學和谷歌研究院的三位研究者提出了一種無監督方法,能夠通過 convex decomposition 生成緊湊的結構化多邊形網格。

論文地址:https://arxiv.org/pdf/1911.06971.pdf

項目地址:https://github.com/czq142857/BSP-NET-original

多邊形網格在數字 3D 領域無處不在,但它們在深度學習革命中僅扮演了配角。在學習形狀生成模型這一方向上,領先方法要依賴於隱函數,並且只有經過昂貴的 iso-surfacing 處理過程才能生成網格。為了克服這些困難,該研究在 Binary Space Partitioning(BSP,計算機圖形學中的經典空間數據結構)的啟發下探討了促進 3D 學習的方法。

BSP 的核心是對空間進行遞歸細分以獲得 convex set。利用這一屬性,研究者設計了 BSP-Net,一個通過 convex decomposition 來學習 3D 形狀表徵的網絡。重要的是,BSPNet 是無監督的,因為訓練過程中不需要 convex shape decomposition。

該網絡經過訓練,利用一組 convex 來重建一個形狀,這些 convex 來自構建在一組平面上的 BSPtree。由 BSPNet 推斷出的 convex 可被輕鬆提取以形成多邊形網格,而無需進行 iso-surfacing 處理。生成的網格是緊湊的(即 low-poly),非常適合表示尖銳的幾何形狀。此外,它們一定是水密的網格,並且可以輕鬆地被參數化。該研究還表明,BSP-Net 的重構質量可以媲美 SOTA 方法,且它使用的 primitive 要少得多。

方法詳解

該研究試圖找到一種既能訓練又可解釋的幾何圖形深度表徵。研究者們通過設計一種能提供可微分 BSP-tree 表徵的網絡架構來完成這個任務。由於這種表徵通過隱函數編碼幾何圖形,所以它們很容易訓練。此外,由於這些表徵的輸出是 convex polytope 的集合,所以它們是可解釋的。

研究者提出了 BSP-Net。該網絡學習一個隱式場:給定 n 個點的坐標和一個形狀特徵向量作為輸入,網絡輸出一些能夠指示這些點是在形狀內部還是外部的值。這個隱函數的構造如圖 2 所示,由三個步驟組成:1)平面方程的集合意味著空間的 p 個二叉分割的集合,參見圖 2(上);2)一個算子 T_{p×c}將這些分割結果分組,以創建一個包含 c 個 convex shape primitive/part 的集合;3)最後,合併這些 part 集合以生成輸出形狀的隱式場。

下圖 3 顯示了與以上三個步驟對應的網絡架構:

1)超平面提取。給定一個特徵向量 f,應用一個多層感知機

獲取平面參數 P_{px4},其中 p 是平面的數量,即

對於任意點

,乘積

是該點到每個平面的符號距離的向量。如果點 X 在內部,則第 i 個距離為負值,反之為正值。

2)超平面分組。為了將超平面分為若干組幾何 primitive,研究者利用了二進位矩陣 T_{p×c}。通過一個最大池化操作,他們聚合了輸入平面,以形成一組 c 個 convex primitive 組成的集合。

注意,在訓練期間,梯度只能通過一個最大(max)的平面。因此,為了簡化訓練,研究者利用了一個用求和代替 max 的版本。

3)形狀組裝。該層通過最小池化對 convex 進行分組,以創建一個可能非凸的輸出形狀:

注意,此處用 C^+ 是有目的的。之所以避免使用 C^*,是因為在 TensorFlow 1 中的算子實現內存不夠高效。

為了促進學習,研究者通過使用(加權)求和來將梯度分配給所有的 convex:

實驗結果與評估

在一個 2D 形狀合成數據集上,研究者分析了 BSP-Net 的行為。此外,他們還將 BSP-Net 與其他 SOTA 方法進行了比較,以評估該研究中的自編碼器以及單視圖重建效果。

2D 形狀自編碼

為了說明 BSP-Net 效果如何,研究者構建了一個 2D 合成數據集。他們在幾個 64 × 64 的圖像上分別放置了一個菱形、一個十字以及一個空心菱形,如圖 4(a)所示。這三種形狀是有順序的,菱形總是在左邊,空心菱形總是在右邊,這是為了模仿 ShapeNet 等形狀數據集的結構。

在第一階段的訓練之後,該研究的網絡已經實現了良好的近似 S^+ 重建,但是,通過查看 S^∗,研究者發現他們推斷的輸出還存在一些缺點。在第二階段進行了調整之後,該研究的網絡實現了近乎完美的重構。最後,使用 overlap 損失顯著提高了表示的緊湊性,減少了每部分的 convex 數量,如圖 4(d)所示。

圖 4:在 2D 合成數據集上的評估——自編碼器是在合成的 2D 數據集上訓練的。研究者展示了自編碼結果,並用紅色圈出了第一階段中存在的錯誤,這些錯誤在第二階段已改正。此外,研究者還展示了使用 overlap 損失的效果。注意,在可視化時,使用了不同的顏色來表示不同的 convex。

3D 形狀自編碼

對於 3D 形狀的自編碼,研究者將 BSP-Net 與其他一些 shape decomposition 網絡進行了比較,包括 Volumetric Primitives(VP)、Super Quadrics(SQ)以及 Branched Auto Encoders(BAE)。

表 2 給出了每種類別的分割結果。

BSP-Net 在保證高分割準確度的同時,也能顯著提高重構質量,如表 1 和圖 7 所示。

表 1:各個模型的表面重構質量和 3D 形狀自編碼結果對比。

圖 7:分割和重建 / 定性研究。

單視圖重建(SVR)

在單視圖重建任務上,研究者將 BSP-Net 與 AtlasNet、IMNET 和 OccNet 做了比較,表 3 和表 4 中給出了定量分析結果,在圖 8 中給出了定性結果。

表 3:單視圖重建,與 SOTA 方法的比較。

表 4:low-poly 分析——單視圖重建中的數據集平均指標。

圖 8:單視圖 3D 重建,該模型與 AtlasNet [16]、IM-NET [5]及 OccNet [28]的比較結果。

WAIC 2020 黑客馬拉松由世界人工智慧大會組委會主辦,張江集團、優必選科技、軟銀集團旗下軟銀機器人、Watson Build 創新中心、機器之心聯合承辦,受到新冠疫情的影響,比賽將於 7 月 8 日 - 11 日期間以遠程和小規模線下結合的方式舉辦,招募全球頂級開發者同臺競技。

原標題:《CVPR 2020最佳學生論文分享回顧:通過二叉空間分割(BSP)生成緊湊3D網格》

閱讀原文

相關焦點

  • CVPR2020最佳學生論文分享回顧:通過二叉空間分割生成緊湊3D網格
    機器之心發布機器之心編輯部在近日舉行的 CVPR 2020 大會上,最佳論文、最佳學生論文等獎項悉數公布。加拿大西蒙弗雷澤大學陳之欽(Zhiqin Chen )等人的「BSP-Net」相關研究獲得了最佳學生論文獎,他們的論文題目是《BSP-Net: Generating Compact Meshes via Binary Space Partitioning》。
  • 華人問鼎CVPR!最佳論文最佳學生論文一作均為華人,清華最高產機構
    大數據文摘出品史上最難的的CVPR2020終於來了!由於疫情影響,今年原定於6.14開始的線下討論會改成位於西雅圖的線上會議。在剛剛結束的CVPR 2020 開幕式上,悉數公布了本屆CVPR最佳論文、最佳學生論文等獎項。值得一提的是,兩個獎項的論文一作均為華人。
  • CVPR,華人包攬!斬獲全部獎項,近四成中國作者,清華最多
    最佳論文、最佳學生論文,每年兩個最受矚目獎項論文一作都是華人,吳尚哲和Zhiqin Chen。經典論文獎,同樣被華人一作的論文拿下。最佳論文獎最佳論文(Best Paper Award),毋庸置疑,是每屆大會接收所有論文中的「最頂級者」。
  • 年度最精彩研究,CVPR 2017六篇最佳論文介紹(附打包下載)| CVPR...
    雷鋒網(公眾號:雷鋒網) AI 科技評論對6篇獲獎論文做了簡要介紹如下。CVPR最佳論文本屆CVPR共有兩篇最佳論文,其中就有一篇來自蘋果。這套系統的思路是,不再像以往一樣把圖像中的物體分割作為一種像素標註問題,把它看作一個多邊形位置預測問題,從而模仿目前已有的標註數據集的方式生成檢測標註框。具體來講,論文中的方法在輸入圖像後可以依次生成多邊形的邊把圖像中的物體圍起來。這個過程中,人類標註員可以隨時參與並糾正錯誤的頂點,從而得到人類標註員眼中儘可能準確的分割。
  • 歷年 CVPR 最佳論文盤點(2000 年——2018 年)
    (接收論文列表:http://cvpr2019.thecvf.com/files/cvpr_2019_final_accept_list.txt)正當學界紛紛議論各單位獲接收論文多寡的當兒,雷鋒網 AI 科技評論為大家精心整理了一份從 2000 年——2018 年的 CVPR 最佳論文清單,藉此對這批計算機領域的重要論文進行複習。
  • 谷歌在CVPR2020分享最新AR/VR研究成果
    來源:映維網 作者 廣州客2020年計算機視覺和模式識別大會(Conference on Computer Vision and Pattern Recognition;CVPR)正在如火如荼地進行中,來自世界各地的計算機視覺研究者和工程師都在這裡分享最新的進展。
  • ICCV 2017獎項公布:最大贏家何愷明獲最佳論文,參與最佳學生論文
    今日,大會公布了本屆 ICCV 的獲獎論文,Facebook AI 研究員何愷明獲得最佳論文獎,同時是最佳學生論文的作者之一。算上此前在 CVPR 2009、CVPR 2016 上的兩篇「最佳論文」,何愷明現在已獲得了四個最佳論文稱號。
  • CVPR 2018 中國論文分享會之「分割與檢測」
    其中物體理解方面的工作在去年 COCO 物體分割和物體識別中分別獲得第一名和第二名的成績。來自微軟亞洲研究院的廖菁研究員在第三個報告中介紹了微軟亞洲研究院在神經風格變換方面的相關工作,包括理論和應用兩方面。在理論方面,他們通過分析先前的風格轉換不同類型的優缺點,設計出了一種綜合兩類模型優點,同時摒棄其缺點的模型。
  • ACCV 2020最佳論文等三項大獎出爐!華為諾亞獲最佳學生論文獎
    ACCV 2020 共錄用論文 255 篇,官方提供所有論文開放下載。官網連結:http://accv2020.kyoto/截止目前,大會已經公布了最佳論文獎、最佳學生論文獎、最佳應用論文獎等三項大獎,其中帝國理工和華為諾亞方舟合作獲得了最佳學生論文獎。以下AI科技評論就帶大家讓我們一起來看看這三項大獎吧 !
  • CVPR 2019 Oral 論文解讀 | 無監督域適應語義分割
    A 類學術會議 CVPR2019 收錄為 Oral 論文 。該論文提出了一種從「虛擬域」泛化到「現實域」的無監督語義分割算法,旨在利用易獲取的虛擬場景標註數據來完成對標註成本高昂的現實場景數據的語義分割,大大減少了人工標註成本。 本文是論文作者之一羅亞威為雷鋒網 AI 科技評論提供的論文解讀。
  • 【ICCV2017視覺盛宴概況】何愷明博士包攬最佳論文和最佳學生論文獎!Facebook成大贏家!
    大會公布了各獎項包括最佳論文獎(Marr Prize)、最佳學生論文獎、Honorable mentions、Azriel Rosenfeld lifetime achievement award、Distinguished researcher award 、Everingham prize 、Helmholtz prize.
  • CVPR2020即將舉行 優必選科技12篇入選論文搶先看
    6月14-19 日,大家期待已久的國際計算機視覺與模式識別頂級會議 CVPR 2020 將舉行。  本屆CVPR共收到6656篇投稿,有1470篇論文被接收,錄用率約22%,創下十年以來的最低記錄。
  • CVPR2020 人體相關文章 - 2
    Body RelatedCVPR 2020 PapersCVPR 2020 人體相關的文章第二彈,第一彈見這裡,主要包含人體重建,2D/3D姿態估計,還有幾篇其他方面的人體文章,最後還包含幾篇人手重建相關的文章。  每一篇都超越了 state-of-the-art,每一篇都有可能是現在的 state-of-the-art!
  • CVPR 2017國內外亮點論文匯集:史上最盛大會議,華人佔據半壁江山
    此外,微軟全球執行副總裁沈向洋將在大會上發表主旨演講在 6 月 16 日北京中關村微軟大廈舉辦的「微軟亞洲研究院創研論壇――CVPR 2017 論文分享會」上,微軟亞研的研究員已經分享了數篇被 CVPR 2017 接收的論文:論文:StyleBank: An Explicit Representation for Neural Image Style Transfer
  • 22篇入選CVPR 2020,百度 15 篇精選論文詳解
    該方法的預測結果能夠通過表情操控生成精細的面部模型序列,所生成的模型在新表情下仍然包含逼真的細節三維結構。據悉,FaceScape資料庫和代碼將於近期免費發布,供非商業用途的學術研究使用。針對此難題,本文提出了一個全新的數據合成(增強)方法,即通過對齊的部件級三維模型對二維圖像中的車輛進行編輯,自動生成大量「特殊」狀態(例如:開啟的車門、後備箱、引擎蓋,閃爍的前照燈、尾燈)的車輛圖像與語義標註結果。針對生成的訓練數據,本文設計了一個雙路骨幹網絡使得模型可以泛化到真實的測試數據,與傳統的模型渲染方法相比,本方法平衡了域差異的問題並且更加輕量便捷。
  • ACM MM 2020大獎項出爐!南開獲最佳論文獎,西安交大獲最佳學生論文獎
    第28屆ACM國際多媒體會議(ACM MM)最佳論文獎、最佳學生論文獎、最佳demo獎、 最佳開源軟體獎在內的所有多媒體領域大獎都已出爐。其中最佳論文的一作是來自南開大學Hongru Liang,最佳學生論文的一作是來自西安交大的Wenbo Zheng。
  • CVPR 2019錄取結果公布,7篇新鮮好文推薦
    對一個指標來說,最佳目標是指標本身。在軸對齊的2D邊界框的情況下,可以證明IoU可以直接作為回歸損失使用。然而,IoU具有平臺,使得在不重疊邊界框的情況下進行優化是不可行的。 在這篇論文中,作者通過引入一個generalized version同時作為新損失和新指標來解決IoU的缺陷。
  • 【CVPR2018最佳論文重磅出爐】斯坦福伯克利折桂,何愷明獲TPAMI年輕研究員獎
    最佳論文最佳論文題目:Taskonomy: Disentangling Task Transfer Learning論文地址:https://arxiv.org/pdf/1804.08328.pdf作者來自史丹福大學和加州大學伯克利分校,包括計算機視覺領域的著名教授Jitendra
  • CVPR 2020 目標檢測論文精選
    字幕組雙語原文:CVPR 2020 目標檢測論文精選英語原文:CVPR 2020: The Top Object Detection Papers翻譯:雷鋒字幕組(李珺毅、沫年惜雪)一、基於在點雲上的3D目標檢測的分層圖形網絡原文標題:A Hierarchical Graph Network for 3D Object
  • CVPR 2020論文收錄揭曉:百度22篇論文入選 涵蓋全視覺領域
    近日,計算機視覺領域「奧斯卡」CVPR 2020官方公布論文收錄結果,伴隨投稿數量激增,接收率開始經歷了一個持續下降的過程。今年,在6656篇有效投稿中,共有1470篇論文被接收,接收率為22%左右,相較去年25%的入選率,同比下降3%。在論文接收率下降的同時,中國科技企業被錄取論文數量卻不降反增,百度作為AI代表企業今年中選22篇,比去年的17篇增加了5篇。