Facebook分享:如何利用AI技術將2D圖片轉換成3D圖片

2020-12-21 科技快報網

(映維網 2020年03月05日)Facebook於2018年推出了3D Photos功能,並將其作為一種與朋友和家人分享圖片的全新沉浸式格式。但這項功能依賴於高端智慧型手機的雙頭攝像頭「人像模式」。所以,只有一個後置攝像頭的典型行動裝置無法予以使用。為了將這種視覺格式帶給更多用戶,Facebook採用了最先進的機器學習技術,允許幾乎任何的標準2D圖片生成3D圖片。

團隊指出,無論是使用標準單攝像頭的Android或iOS設備所拍攝的照片,還是上傳到智慧型手機或筆記本電腦的數十年前的老照片,這一系統可以推斷任何圖片的3D結構。

利用這項先進的技術,數百萬搭載單攝像頭的智慧型手機或平板電腦將能夠首次輕鬆地利用3D照片技術。轉換為3D同時可以令你以全新的方式體驗數十年前的家庭照片和其他珍貴圖像。擁有先進雙攝像頭設備的用戶同樣可以從中受益,因為你現在可以利用單個前置攝像頭進行3D自拍。現在,所有iPhone 7或更高版本,或最新的中高端Android設備用戶都可以在Facebook應用程式中進行嘗試。

這個動畫說明了系統是如何為創建3D圖像而估算2D圖片不同區域的深度。

構建這種增強的3D照片技術需要克服各種技術挑戰,如訓練可正確推斷出多個主體的3D位置的模型,以及優化系統,令其能夠支持常規的移動處理器快速完成處理。為了克服相關挑戰,Facebook AI團隊通過數百萬對公共3D圖像及其隨附的深度圖來訓練卷積神經網絡,並利用FBNet和ChamNet等先前開發的各種移動優化技術。

現在這項功能已經向所有Facebook用戶開放,而團隊日前通過博文介紹了相關的開發細節。

原圖是用單透鏡相機拍攝,不包含任何深度圖數據。Facebook的系統將其轉換下圖所示的3D圖像。

1. 為行動裝置帶來高效的性能

給定標準RGB圖像,3D Photos CNN可以為每個像素估計距攝像頭的距離。團隊通過以下四種方式來實現所述目標:

使用一組可參數化,針對行動裝置優化的神經構建模塊所構建的網絡架構。

自動化架構搜索,為其尋找有效配置,從而令系統能夠支持任何設備在少於一秒內執行任務。

量化感知訓練,從而在行動裝置利用高性能的INT8量化,同時最大程度地減少量化過程中潛在的質量下降。

來自公共3D照片的大量訓練數據。

2. 神經構建模塊

團隊開發的架構使用了受FBNet啟發的構建模塊。FBNet是用於為行動裝置和其他資源受限設備優化ConvNet架構的框架。構造模塊由點式卷積,可選的上採樣,K x K深度式卷積,以及附加的點式卷積組成。研究人員實現了一個U-net樣式的架構,並修改為沿著skip connection放置FBNet構建模塊。U-net編碼器和解碼器包含五個階段,每個階段對應於不同的空間解析度。

網絡架構概述:所述的網絡架構是一個U-net,並且包含沿skip connection放置的額外宏級別構建模塊。

3. 自動化架構搜索

為了找到有效的架構配置,團隊使用了由Facebook AI開發的算法ChamNet來自動化搜索過程。ChamNet算法迭代地從搜索空間中採樣點並用以訓練精度預測器。所述精度預測器用於加速genetic search,從而定位一個在滿足指定資源限制的同時最大化預測準確性的模型。在這種設置下,研究成員使用了一個會改變通道擴展因子和每個模塊輸出通道數的搜索空間,從而產生3.4×1022的可能架構。然後,他們使用800個Tesla V100 GPU在大約三天內完成搜索,設置及調整模型架構的FLOP約束以實現不同的運算點。

4. 量化感知訓練

默認情況下,模型使用單精度浮點權重和激活進行訓練,但團隊發現了將權重和激活量化為8位的顯著優勢。特別地,int8權重僅需要float32權重所需存儲量的四分之一,從而減少了首次使用時必須傳輸到設備的字節數。

圖像一開始都是常規2D圖像,並通過Facebook AI的深度估計神經網絡轉換為3D。

與基於float32的運算符相比,基於Int8的運算符同時具有更高的吞吐量,這要歸功於QNNPACK等經過精細調整的庫(已集成到PyTorch中)。團隊使用量化意識訓練(Quantization-aware training;QAT)來避免由於量化而導致的質量下降。QAT(現已作為PyTorch的一部分)在訓練過程中模擬量化並支持反向傳播,從而消除了訓練和實際性能之間的差距。

這個神經網絡可處理多種內容,包括複雜場景的繪畫和圖像。

5. 尋找創建3D體驗的新方法

除了完善和改進深度估算算法外,團隊同時致力於為行動裝置拍攝的視頻提供高質量的深度估算。視頻帶來了一個值得關注的挑戰,因為每個幀的深度必須與下一幀的深度一致。但這同時是提高性能的機會,因為對同一對象的多次觀察可為高精度的深度估計提供額外的信號。視頻長度深度估計將為用戶帶來各種創新的內容創建工具。隨著團隊繼續改善神經網絡的性能,他們將探索在諸如增強現實之類的實時應用中利用深度估計,表面法線估計和空間推理。

Facebook指出:「除了這些潛在的新體驗之外,這項研究還將幫助我們更全面地理解2D圖像的內容。更好地理解3D場景同時可以幫助機器人導航並與現實世界交互。我們希望通過共享有關3D Photos系統的詳細信息,我們可以幫助AI社區在這些領域取得進展,並創造利用先進3D理解的新體驗。」

相關焦點

  • Facebook 又出黑科技,手機照片一鍵切成 3D 大片
    這是一種全新的沉浸式格式,你可以用它與朋友、家人分享照片。但是,這項功能依賴於高端智慧型手機才具備的雙鏡頭「肖像模式」功能,無法在尋常的行動裝置上使用。為了讓更多人體驗到這種新的視覺格式,Facebook 利用機器學習開發了一個系統。這個系統可以推斷出任何圖像的 3D 結構,任何設備、任何時間拍攝的圖像都可以被轉換成 3D 形式。這就可以讓人們輕鬆使用 3D 照片技術。
  • 如何把圖片轉換成pdf?圖片轉換成pdf的軟體叫什麼?
    如何把圖片轉換成pdf?在給客戶看產品圖小樣的時候,設計師們總是需要發送很多的圖片給他們。直接將一文件夾的圖片發送出去,一張一張地打開看真的很麻煩,而且客戶使用自己電腦中的看圖設備打開也可能會造成圖片變形,無法展現真實的圖片效果。想要解決這些問題,我們可以將圖片轉換成PDF格式的文件。
  • PDF怎麼轉換成圖片?簡單的PDF轉換方法分享給你
    PDF怎麼轉換成圖片?PDF文件閱讀性比較好,不過不如圖片文件更加便捷。所有有很多小夥伴在收到PDF文件之後,還會選擇將PDF文件轉換成圖片。平時大家在遇到文件格式轉換之類的問題,都是怎麼解決的呢?今天小編就以PDF轉圖片為例,給大家分享幾個簡單的PDF轉換方法。
  • 怎麼把圖片轉換成PDF格式?最方便的PDF轉換工具分享
    怎麼把圖片轉換成PDF格式?如果我們想要將紙質版的文檔保存為電子檔,可以將其掃描為電子圖片。不過在圖片數量很多時,查閱起來也比較麻煩,這時我們可以選擇將圖片再轉換為PDF文件?那麼圖片該如何轉換為PDF格式呢?下面就給大家介紹幾個圖片轉PDF的方法。
  • 如何將jpg在線轉換成pdf?jpg圖片可以轉換成pdf嗎?
    可不要以為jpg就一定只是一張簡單的圖片,一張圖片中可以包含的信息是很多的,除了有景象之外,也可能會有文字,有表格。當然,我們今天要討論的,並不是一張jpg的圖片中可能會存在哪些信息,而是要如何將jpg在線轉換成pdf?jpg圖片可以轉換成pdf嗎?看完下面的介紹,你就明白了!
  • 圖片轉換成pdf格式怎麼操作?什麼軟體可以將圖片轉換成pdf?
    夥伴們好,你們知道如何把圖片轉為pdf格式嗎?前一陣子我參加了一個家居行業大會,在會議上拍攝了不少會議照片,包括主持人講話、嘉賓出席、觀眾提問、產品推廣等環節都拍攝了不同的角度。拍攝好後,需要傳送給寫文章的同事,當我在微信上一張張照片發送給她的時候,她說先把圖片轉為pdf格式,再壓縮打包一次性發給她....導入會議照片到電腦pc軟體那如何把圖片轉為pdf格式呢?
  • 2d和3d有什麼區別 2d和3d的區別
    2d和3d代表著兩個不同的維度,那麼用這些維度表達出來的電視劇、電影、遊戲等帶給人怎麼樣的感受呢?2d和3d又有什麼區別?二維是平面技術的一種,例如普通的平面動漫,稱之為二維動漫、簡稱二維。  3D即三維,三維是指在平面二維繫中又加入了一個方向向量構成的空間系。所謂三維,按大眾理論來講,只是人為規定的互相交錯(垂直是一個很有特性的理解)的三個方向,用這個三維坐標,看起來可以把整個世界任意一點的位置確定下來。原來,三維是為了確定位置。
  • 如何將圖片文字轉換成Word文字?一分鐘提取上千張圖片文字
    在工作中我們難免會遇到這樣的一個問題,就是我們需要將圖片中的文字給提取出來。但是吧,一個個字來敲,那效率很低不說自己還覺得麻煩。那今天小編就來跟大家介紹幾個好用的方法,快速提取出圖片上的文字吧。一、手機操作 若大家是想要在手機上將圖片上的文字給提取出來的話,那簡單,可以直接藉助微信上的一個好用功能,即——迅捷文字識別小程序。在進入小程序以後,我們就可以點擊【照片/拍照】,然後在選擇任意一種方式進行圖片文字提取的操作。當我們點擊【照片】以後,我們就可以在手機的相冊中找到需要提取文字的圖片並將其上傳到小程序中。
  • jpg怎麼轉換成pdf? 快速將多張圖片轉換成PDF!
    而常見的圖片格式有JPEG,PNG,BMP等。出於各種原因,經常需要將PDF文件轉成圖片格式後使用Photoshop(簡稱:PS)進行美化處理。接著,一鍵批量將多張JPG圖片轉換成PDF文件。1.PDF文件頁面數多? 2.PDF轉成圖片的命名沒有規則?3.PS圖片如何命名文件?
  • Loom.ai利用人物靜態圖片打造逼真的3D虛擬頭像 保證像到連親媽都...
    近日,一家加州初創公司推出了一款智能 3D 模型軟體 Loom.ai ,利用機器學習和計算機視覺技術,根據用戶 2D 平面照片,生成 3D頭像。  最終他們才有了將照片掃描技術和A.I技術合二為一的想法,研究之初他們給這一研究項目起了一個代號——Loom.ai。  功能  據該團隊介紹,Loom.ai的核心技術是A.I.算法。通過提前錄入的人體面部肌肉技術數據,Loom.ai可以找到2D圖片中人物面部對應的肌肉組的位置。然後通過深度計算將原本看不到的部分還原出來。
  • 如何將手機裡的Word文檔轉換成圖片?
    在如今的移動辦公時代,我們經常使用手機處理一些日常工作問題,比如有時接收的Word文檔需要轉成圖片後再發送應該如何處理呢?一、轉成每頁對應一張圖片;1、首頁手機下載和安裝軟體會相對麻煩些,所以一般更習慣使用一些免費的在線轉換工具。
  • png圖片怎樣轉換成jpg格式?利用什麼工具能實現
    圖片格式有很多種,據小編知道的就有jpg, png, gif, jpeg, bmp, webp, pcx, tiff, tga, exif, svg, psd......那麼多。那麼在這麼多的格式中,你一定遇到過需要將格式轉成其他格式的情況吧!
  • 怎麼將圖片轉換成PDF?這些PDF轉換方法很簡單
    怎麼將圖片轉換成PDF?這些PDF轉換方法很簡單 2020年12月10日 09:30作者:黃頁編輯:黃頁 怎麼將圖片轉換成
  • 圖片格式轉換電腦png怎麼轉換成jpg
    大家接觸最多的圖片格式都有啥?JPEG,JPG,BMP,GIF,PSD,PNG......等等這些都是我們工作中有時會用到的圖片格式,那麼在使用的時候總會遇到需要轉換格式的時候。比如說在網站上上傳圖片時,顯示格式不支持,就很迫切的需要調整圖片格式了。
  • 如何將JPG圖片轉換為BMP圖片?實用方法交給你!
    在我們日常娛樂和日常工作中,如果遇見需要將JPG圖片轉換為BMP圖片的情況要怎麼辦?因為BMP圖片的質量會比JPG圖片的質量要好很多,作為自己保存的圖片,當然是越高清越好,像小編就有時候會想將自己的JPG圖片轉換為BMP圖片。
  • 2D手遊美術實現方案分析
    2)只是對圖片進行變換顯示,cpu佔用低。缺點:1)會使用大量圖片資源,磁碟佔用和內存佔用都會很高。2)因為圖片是靜態,換裝和特效掛接會成為難點。建議配合技術:1)配合染色換色方案可以對序列幀做出非常多的變體.減弱換裝問題。
  • 純圖片的PDF怎麼轉換成文字?教你簡單快速搞定PDF轉換
    純圖片格式的PDF文件怎麼轉換成文字?在使用PDF文件時,如果需要將PDF文件轉換成Word文字,我們總是會想到將PDF文件的內容複製粘貼到Word中。但是這個方法轉換文件的效率和質量都比較低,尤其是遇到純圖片格式的PDF文件時,這個方法根本是不適用的。
  • 這種AI技術將低像素圖片變成了「照片」
    Face Depixelizer是一款由人工智慧驅動的令人驚嘆的新應用程式,它可以將一張超低解析度的面部像素化圖片轉換成逼真的人像照片
  • 如何把pdf圖片轉成jpg?轉換圖片格式的方法在此
    如何把pdf圖片轉成jpg?上個月我遇到了一個小難題:不知道用什麼工具把批量的pdf圖片轉為jpg格式。因為本人的工作是網際網路公司的編輯,每天要大量撰寫文章,寫文章時會配圖,但個人從網上找來的很多精美圖片都是保存在pdf文檔中,不方便插入到word文檔中。
  • 華為手機如何掃描文件?輕鬆將手機圖片內容轉換成文字
    華為手機如何掃描文件?輕鬆將手機圖片內容轉換成文字 2019年03月20日 16:20作者:黃頁編輯:黃頁 現在使用華為手機的用戶應該很多吧?