Facebook分享:如何利用AI技術將2D圖片轉換成3D圖片

2020-12-13 砍柴網

來源:映維網 作者 吳羽樺

Facebook於2018年推出了3D Photos功能,並將其作為一種與朋友和家人分享圖片的全新沉浸式格式。但這項功能依賴於高端智慧型手機的雙頭攝像頭「人像模式」。所以,只有一個後置攝像頭的典型行動裝置無法予以使用。為了將這種視覺格式帶給更多用戶,Facebook採用了最先進的機器學習技術,允許幾乎任何的標準2D圖片生成3D圖片。

團隊指出,無論是使用標準單攝像頭的Android或iOS設備所拍攝的照片,還是上傳到智慧型手機或筆記本電腦的數十年前的老照片,這一系統可以推斷任何圖片的3D結構。

利用這項先進的技術,數百萬搭載單攝像頭的智慧型手機或平板電腦將能夠首次輕鬆地利用3D照片技術。轉換為3D同時可以令你以全新的方式體驗數十年前的家庭照片和其他珍貴圖像。擁有先進雙攝像頭設備的用戶同樣可以從中受益,因為你現在可以利用單個前置攝像頭進行3D自拍。現在,所有iPhone 7或更高版本,或最新的中高端Android設備用戶都可以在Facebook應用程式中進行嘗試。

這個動畫說明了系統是如何為創建3D圖像而估算2D圖片不同區域的深度。

構建這種增強的3D照片技術需要克服各種技術挑戰,如訓練可正確推斷出多個主體的3D位置的模型,以及優化系統,令其能夠支持常規的移動處理器快速完成處理。為了克服相關挑戰,Facebook AI團隊通過數百萬對公共3D圖像及其隨附的深度圖來訓練卷積神經網絡,並利用FBNet和ChamNet等先前開發的各種移動優化技術。

現在這項功能已經向所有Facebook用戶開放,而團隊日前通過博文介紹了相關的開發細節。

原圖是用單透鏡相機拍攝,不包含任何深度圖數據。Facebook的系統將其轉換下圖所示的3D圖像。

1. 為行動裝置帶來高效的性能

給定標準RGB圖像,3D Photos CNN可以為每個像素估計距攝像頭的距離。團隊通過以下四種方式來實現所述目標:

使用一組可參數化,針對行動裝置優化的神經構建模塊所構建的網絡架構。自動化架構搜索,為其尋找有效配置,從而令系統能夠支持任何設備在少於一秒內執行任務。量化感知訓練,從而在行動裝置利用高性能的INT8量化,同時最大程度地減少量化過程中潛在的質量下降。來自公共3D照片的大量訓練數據。

2. 神經構建模塊

團隊開發的架構使用了受FBNet啟發的構建模塊。FBNet是用於為行動裝置和其他資源受限設備優化ConvNet架構的框架。構造模塊由點式卷積,可選的上採樣,K x K深度式卷積,以及附加的點式卷積組成。研究人員實現了一個U-net樣式的架構,並修改為沿著skip connection放置FBNet構建模塊。U-net編碼器和解碼器包含五個階段,每個階段對應於不同的空間解析度。

網絡架構概述:所述的網絡架構是一個U-net,並且包含沿skip connection放置的額外宏級別構建模塊。

3. 自動化架構搜索

為了找到有效的架構配置,團隊使用了由Facebook AI開發的算法ChamNet來自動化搜索過程。ChamNet算法迭代地從搜索空間中採樣點並用以訓練精度預測器。所述精度預測器用於加速genetic search,從而定位一個在滿足指定資源限制的同時最大化預測準確性的模型。在這種設置下,研究成員使用了一個會改變通道擴展因子和每個模塊輸出通道數的搜索空間,從而產生3.4×1022的可能架構。然後,他們使用800個Tesla V100 GPU在大約三天內完成搜索,設置及調整模型架構的FLOP約束以實現不同的運算點。

4. 量化感知訓練

默認情況下,模型使用單精度浮點權重和激活進行訓練,但團隊發現了將權重和激活量化為8位的顯著優勢。特別地,int8權重僅需要float32權重所需存儲量的四分之一,從而減少了首次使用時必須傳輸到設備的字節數。

圖像一開始都是常規2D圖像,並通過Facebook AI的深度估計神經網絡轉換為3D。

與基於float32的運算符相比,基於Int8的運算符同時具有更高的吞吐量,這要歸功於QNNPACK等經過精細調整的庫(已集成到PyTorch中)。團隊使用量化意識訓練(Quantization-aware training;QAT)來避免由於量化而導致的質量下降。QAT(現已作為PyTorch的一部分)在訓練過程中模擬量化並支持反向傳播,從而消除了訓練和實際性能之間的差距。

這個神經網絡可處理多種內容,包括複雜場景的繪畫和圖像。

5. 尋找創建3D體驗的新方法

除了完善和改進深度估算算法外,團隊同時致力於為行動裝置拍攝的視頻提供高質量的深度估算。視頻帶來了一個值得關注的挑戰,因為每個幀的深度必須與下一幀的深度一致。但這同時是提高性能的機會,因為對同一對象的多次觀察可為高精度的深度估計提供額外的信號。視頻長度深度估計將為用戶帶來各種創新的內容創建工具。隨著團隊繼續改善神經網絡的性能,他們將探索在諸如增強現實之類的實時應用中利用深度估計,表面法線估計和空間推理。

Facebook指出:「除了這些潛在的新體驗之外,這項研究還將幫助我們更全面地理解2D圖像的內容。更好地理解3D場景同時可以幫助機器人導航並與現實世界交互。我們希望通過共享有關3D Photos系統的詳細信息,我們可以幫助AI社區在這些領域取得進展,並創造利用先進3D理解的新體驗。」

原文連結:https://yivian.com/news/72515.html

相關焦點

  • 英偉達最新AI研究:可將2D圖片轉換成3D模型
    芯科技消息(文/Allis),根據《The Next Web》報導,英偉達最近開發了一款新的AI系統,可以利用任何2D圖像創造出完整的3D模型模擬圖。這項AI系統名為可微分內插運算法成像器(differentiable interpolation-based renderer,DIB-R),可以通過推論的方式將看到的2D圖像轉換為3D的形象,且這個模擬圖與人類在看到2D圖片時,想像出的3D圖像有驚人的相似度。
  • Facebook 又出黑科技,手機照片一鍵切成 3D 大片
    這是一種全新的沉浸式格式,你可以用它與朋友、家人分享照片。但是,這項功能依賴於高端智慧型手機才具備的雙鏡頭「肖像模式」功能,無法在尋常的行動裝置上使用。為了讓更多人體驗到這種新的視覺格式,Facebook 利用機器學習開發了一個系統。這個系統可以推斷出任何圖像的 3D 結構,任何設備、任何時間拍攝的圖像都可以被轉換成 3D 形式。這就可以讓人們輕鬆使用 3D 照片技術。
  • 如何把圖片轉換成pdf?圖片轉換成pdf的軟體叫什麼?
    如何把圖片轉換成pdf?在給客戶看產品圖小樣的時候,設計師們總是需要發送很多的圖片給他們。直接將一文件夾的圖片發送出去,一張一張地打開看真的很麻煩,而且客戶使用自己電腦中的看圖設備打開也可能會造成圖片變形,無法展現真實的圖片效果。
  • 怎麼把圖片轉換成PDF格式?最方便的PDF轉換工具分享
    怎麼把圖片轉換成PDF格式?如果我們想要將紙質版的文檔保存為電子檔,可以將其掃描為電子圖片。不過在圖片數量很多時,查閱起來也比較麻煩,這時我們可以選擇將圖片再轉換為PDF文件?那麼圖片該如何轉換為PDF格式呢?下面就給大家介紹幾個圖片轉PDF的方法。
  • 這個神器可以將2D圖片3D化
    最近看到一篇新聞,講的是 facebook 如何將2D 圖片3D化。深入搜索後發現之前就有人實現這個效果。今天就給大家介紹這個神器 --tikuwa。效果還是可以的,但是軟體不是全自動的,需要手工把物件遠近關係用顏色深淺大致畫一遍在圖片上,然後軟體就會自動合成為3D圖片了。最後還能選晃動方式以及圖片大小。沒有畫完的還能以bmp形式保存下來。方便下次讀取繼續畫。以下面這個圖片為例。
  • PDF文檔轉換成圖片
    為了防止這一點,我們可以將PDF再轉換成JPG圖片,這樣就更加保護PDF文件中的信息了。之前我們了解了pymupdf庫可以提取PDF中的文本信息,今天我們繼續用它把PDF轉換成圖片文件。一、簡介使用的庫仍然是pymupdf。
  • 圖片如何轉換成PDF?圖片轉PDF軟體怎麼使用?
    圖片如何轉換成PDF?不管是工作中還是日常生活中,我們總是有很多的圖片需要保存。將這些圖片零散保存,比較容易丟失且查找起來也很困難。有一個好辦法可以解決這個問題,那就是將圖片轉換成PDF文件,可是我們該怎麼將圖片轉換為PDF格式的文件呢?
  • 如何將圖片文字轉換成Word文字?一分鐘提取上千張圖片文字
    在工作中我們難免會遇到這樣的一個問題,就是我們需要將圖片中的文字給提取出來。但是吧,一個個字來敲,那效率很低不說自己還覺得麻煩。那今天小編就來跟大家介紹幾個好用的方法,快速提取出圖片上的文字吧。一、手機操作 若大家是想要在手機上將圖片上的文字給提取出來的話,那簡單,可以直接藉助微信上的一個好用功能,即——迅捷文字識別小程序。在進入小程序以後,我們就可以點擊【照片/拍照】,然後在選擇任意一種方式進行圖片文字提取的操作。
  • Facebook的AI識菜譜,把皮卡丘認成了煎蛋……|技術前沿洞察
    近日,韓媒稱韓國SK 電信公司已經與兩家歐洲電信設備製造商達成協議,將聯手提升商用5G 網絡性能,並開發6G 相關技術。SK 公司在本月12 日和13 日分別與芬蘭諾基亞公司和瑞典愛立信公司籤署了諒解備忘錄。根據協議,雙方將共同開發6G核心技術,以便在下一代移動通信技術領域搶佔先機並探索新的商業模式。
  • 圖片轉換成文字軟體下載_圖片轉換成文字軟體最新
    圖片轉換成文字軟體下載_圖片轉換成文字軟體最新微信如何圖片轉換成文字軟體下載_圖片轉換成文字軟體最新
  • jpg怎麼轉換成pdf? 快速將多張圖片轉換成PDF!
    而常見的圖片格式有JPEG,PNG,BMP等。出於各種原因,經常需要將PDF文件轉成圖片格式後使用Photoshop(簡稱:PS)進行美化處理。接著,一鍵批量將多張JPG圖片轉換成PDF文件。1.PDF文件頁面數多? 2.PDF轉成圖片的命名沒有規則?3.PS圖片如何命名文件?
  • Loom.ai利用人物靜態圖片打造逼真的3D虛擬頭像 保證像到連親媽都...
    近日,一家加州初創公司推出了一款智能 3D 模型軟體 Loom.ai ,利用機器學習和計算機視覺技術,根據用戶 2D 平面照片,生成 3D頭像。  最終他們才有了將照片掃描技術和A.I技術合二為一的想法,研究之初他們給這一研究項目起了一個代號——Loom.ai。  功能  據該團隊介紹,Loom.ai的核心技術是A.I.算法。通過提前錄入的人體面部肌肉技術數據,Loom.ai可以找到2D圖片中人物面部對應的肌肉組的位置。然後通過深度計算將原本看不到的部分還原出來。
  • 如何將手機裡的Word文檔轉換成圖片?
    在如今的移動辦公時代,我們經常使用手機處理一些日常工作問題,比如有時接收的Word文檔需要轉成圖片後再發送應該如何處理呢?一、轉成每頁對應一張圖片;1、首頁手機下載和安裝軟體會相對麻煩些,所以一般更習慣使用一些免費的在線轉換工具。
  • 如何將圖片裡的文字轉換成word
    手機的功能越來越多,很多原始的記錄方法都被取代,比如拍照,開會等記錄,我們會使用音頻視屏,圖片等方式記錄,但是整理成文本格式的時候,顯然直接使用圖片不夠正式的,由於拍攝場景的限制,分比率,導致不夠美觀,人工整理的話,耗時,又耗費人力,有沒有工具可以將圖片文字轉換成word的呢?
  • Google的DeepMind開發AI 可將2D圖片渲染成3D
    給定一個場景的一些圖片——比如一個貼滿壁紙的房間,地板上有一個彩色的球體——這個算法可以渲染相對的、看不見的物體側面,並從多個有利位置生成3D視圖,甚至可以考慮到陰影中的照明。它的目的是複製人類大腦了解周圍環境和物體之間的物理交互的方式,並消除人工智慧研究人員在數據集中標註圖像的需要。
  • png圖片怎樣轉換成jpg格式?利用什麼工具能實現
    圖片格式有很多種,據小編知道的就有jpg, png, gif, jpeg, bmp, webp, pcx, tiff, tga, exif, svg, psd......那麼多。那麼在這麼多的格式中,你一定遇到過需要將格式轉成其他格式的情況吧!
  • 如何將PDF轉成圖片?良心推薦這個PDF轉圖片軟體!
    如何將PDF轉成圖片?很多設計師喜歡將自己的設計稿件在發送給客戶之前轉換成圖片格式,這樣操作一方面是為了更好的打開文件進行閱覽並提高文件的閱讀性,另一方面也可以保證自己的設計不被修改盜用。那麼什麼方法可以幫助我們將PDF格式設計文件轉換成圖片文件呢?
  • Facebook挑戰賽:利用AI檢測惡意圖文,還有很長的路要走
    作者發表博文《Hateful Memes Challenge and Data Set》(https://ai.facebook.com/hatefulmemes)概述了這項研究。另外幾個Facebook研究人員發表的另一篇博文《AI advances to better detect hate speech》(https://ai.facebook.com/blog/ai-advances-to-better-detect-hate-speech)廣泛地探討了AI檢測仇恨言論的話題。
  • word轉存技巧:如何將每頁文檔轉換為圖片保存?
    編按:日常辦公過程中,將Word文檔轉為圖片的情況雖然不常見,但若遇到了總是會難倒一大批人。因為Word沒有為用戶提供直接將文檔存儲為圖片格式的功能,因此,這就需要我們曲線救國,借用其他工具來實現目的。今天小編將為大家分享2個常用方法,供大家參考。學習更多技巧,請收藏關注部落窩教育word圖文教程。
  • 3d人臉識別和2d區別
    打開APP 3d人臉識別和2d區別 陳翠 發表於 2019-03-06 15:17:37   3d人臉識別和2d區別   三維人臉識別可以應對各種光線幹擾,甚至在夜晚能見度較差的環境下也可以識別人臉信息。