在今年的計算機視覺頂級學術會議 CVPR 上,華人再次成為最大贏家。
包括經典論文、最佳論文、最佳學生論文和年輕學者獎等幾大獎項,全部由華人包攬,並且論文類獎項還都是華人第一作者!
不僅如此,根據主席團的介紹,來自中國的作者在本次 CVPR 投稿論文中佔了足足四成,並且投稿最多的前五家機構當中,就有四家國內頂尖大學!
CVPR 一直是華人研究員施展拳腳的舞臺,不過這次已經不能用收穫頗豐來形容了——他們和各自的作品,在本次 CVPR 2020 上大放異彩,堪比夜空中最亮的星。
最佳論文獎
CVPR 每年都會頒發多個獎項,其中最佳論文獎 (Best Paper Award) 是壓軸獎項,頒發給評委會認為今年所有接收論文當中質量最高的王者級論文。
今年 CVPR 2020 的最佳論文獎,頒發給了 Unsupervised Learning of Probably Symmetric Deformable 3D Objects from Images in the Wild.
第一作者為牛津大學視覺幾何組博士生吳尚哲,本科畢業於香港科技大學,曾在商湯、騰訊優圖、Google AI 實習。
簡單來說,這篇論文提出了一種新的方法 Photo-Geometric Autoencoding: 只用一張人臉圖像,可靠地「還原」(實際上是生成)高質量的三維人臉模型。
稍微具體來說,這種方法在無監督的前提下,對一張照片採用多個 encoder-decoder 網絡進行拆解,生成深度圖、光照圖、視角等多個維度的圖片,組合渲染,重構出三維人臉模型。
除了真人頭像之外,寫實繪畫,甚至抽象作品裡的人臉也可以重建,看起來有點驚悚,不過對於這個模型來說還是足以證明其實力的:
也可以對視頻進行實時重建:
當然,摻點貓進來才會火:
作者也提供了一個 demo 的在線網站,你可以自己上傳一張照片試試效果。不過不知道是不是這個模型對亞洲臉型的識別能力差點意思,把我的人臉重建的不是很像……
最佳學生論文獎
最佳學生論文獎頒發給那些第一作者是學生身份的優秀論文。
CVPR 2020 的最佳學生論文獎,頒發給了加拿大 Simon Fraser University 團隊的 BSP-Net: Generating Compact Meshes via Binary Space Partitioning一文。
第一作者該校圖形和視覺實驗室的博士生 Zhiqin Chen,本科畢業於上海交通大學計算機系。
作者 Chen 同學的 Twitter 簡介自己是一名重度遊戲上癮者。他的這篇論文 BSP-Net 正是如此,利用了遊戲開發中經常用到的一個3D計算機圖形概念,叫做二叉空間分割 (Binary Space Partitioning, BSP)。
簡單來說,BSP 就是把一個複雜形狀(二維或三維)的物體,在形狀和對應的數據上分割細化成樹狀結構。這樣,遊戲能夠快速生成和渲染由大量多邊形組合成的物體和場景——這項技術最早被《雷神之錘》、《德軍總部3D》和《毀滅戰士》都採用過,在碰撞偵測、光線追蹤等眾多遊戲技術當中有著大量運用。
作者基於 BSP 開發的這個神經網絡 BSP-Net,主要功能和設計方向是自動生成最少的多邊形,合成外形儘量完美、真實的三維物體。
對同一個二維或者三維圖形物體進行重建,和此領域其它神經網絡模型相比,BSP-Net 所用的多邊形數量顯著更少,鑲嵌效果更好。
而這在某些專門的應用領域或許能派上大用場,比如遊戲——可以減少佔用計算資源耗用,還能渲染更多的物體。這並不是說 BSP-Net 的重建效果是最完美的,正如前面提到,它的主要方向是降低多邊形數量,同時達到預期的效果。
你可以到項目網頁上查看關於這篇論文的概括介紹、口述演講和更多細節。
經典論文獎
這個獎項全名 PAMI Longuet-Higgins Prize,旨在獎勵那些發布時間已經超過十年,但對後世研究者的工作仍然具有突出的指導和啟發意義的經典論文。
這一獎項(兩個名額的其中之一)同樣被華人第一作者的論文拿下:來自當時在布朗大學讀 PhD,後來輾轉哈佛大學、英偉達,現在在谷歌工作的高級研究員 Deqing Sun. 論文:Secrets of Optical Flow Estimation and Their Principles.
Deqing Sun這篇論文在 CVPR 2010 上首次發布,當時只是一篇 poster 論文。它講的是光流法測算,也就是和觀察者的運動所造成的觀測目標、表面或邊緣運動有關的一個概念。比如某人觀測到某物體向右上方移動,如何判定這種相對位移是觀測對象還是觀測者在動,便是光流法測算需要解決的問題。
這個概念在模式識別、計算機視覺和其它圖像處理領域都非常重要,是視頻壓縮、物體識別和追蹤、機器人導航等領域的關鍵底層技術。
而這篇十年前的論文,通過大量建模、測試等工作,解答了許多光流法測算相關的問題,從數學/機器學習的角度分析了當代光流法測算能夠取得準確結果的理由,哪些技巧好用,哪些沒用,並且延展到如何利用這些新增的知識繼續改進測算技巧,開發出新的模型。
CVPR 2020 評審團認為,回顧十年前來看,這篇論文對後世研究的積極影響最為重大,所以頒發了經典論文獎給它。
同時,Deqing Sun 也和 Google Research 的 Jon Barron(Pixel 手機的背景虛化、HDR+、人像模式以及 Google Glass 重要開發者)共同榮獲本屆 CVPR 的年輕學者獎 (PAMI Young Researcher Award)
中國研究員繼續大放異彩
照例,主席團成員在這次線上大會開場階段介紹了本屆 CVPR 的投稿論文作者和機構情況。
由於新冠疫情影響,CVPR 2020 從原本的線下會議,一度想要變成線上線下混合,最後失敗,只能完全轉為線上,註冊參會者只有7,000人左右,比去年有所降低。
不過在論文投稿方面,大會還是繼承了越辦越好的傳統,投稿論文數量增加了29%,作者數量增加了20%。最終接收論文也有1,467篇,較去年有所提升,佔總投稿數量的四分之一;Oral 論文比例5.7%。
來自中國作者和/或中國機構的論文佔了最大的比例。大會數據統計,來自中國的作者佔到了四成,遠超美國22.7%。
更重要的是,中國作者/機構的論文不僅數量多,質量也很高,不僅如前面提到的,斬獲最佳論文、最佳學生論文和經典論文三大獎,在各獎項提名名單裡也佔了絕大多數。
按照歸屬機構統計作者發現,中國大學在前十當中佔了七名,前五當中佔了四名!
它們分別是:清華大學(第一,340人)、上海交大(第三,287人)、北大(第四,232人)、浙大(第五,216人)、中科大(第七、180人)、北航和西電(並列九、十名、各138人)。
去年 CVPR 的大獎同樣屬於華人團隊。
CVPR 2019 最佳論文得主 CMU 辛書冕和團隊通過提取優先、零碎和非直接的光學信息,能夠隔著障礙物還原出另外一邊非視距內物體的樣貌。大會評價稱:「該論文在非視距重建(也即看到拐角背後)上作出了傑出的貢獻。這是一篇理論優美且具有啟發價值的論文,擴展了計算機視覺可能性的邊界。」
最佳學生論文獎頒發給了 UCSB 王鑫和團隊,他們開發的自我監督學習模型可以讓機器人遵守自然語言指令序列進行視覺導航,對應論文在去年所有投稿文章中得分排名第一。
經典論文獎則毫無懸念地頒給了斯坦福鄧嘉和李飛飛團隊的 ImageNet 論文。ImageNet 作為一個大規模的標註圖像資料庫,為後世研究者提供了極大的便利,促進了計算機視覺技術的進步。