Facebook 又出黑科技,手機照片一鍵切成 3D 大片

2020-11-25 雷鋒網

隨著科技的發展,現在人們可以隨時隨地用手機等設備拍照記錄自己喜歡的瞬間。可能不少人都想過,假如出現一種黑科技,讓我們拍攝的平面 2D 照片變成立體的 3D 照片......

Facebook 也早就想到了這個問題。為改善用戶體驗,2018 年,Facebook 就推出了 3D 照片功能。這是一種全新的沉浸式格式,你可以用它與朋友、家人分享照片。但是,這項功能依賴於高端智慧型手機才具備的雙鏡頭「肖像模式」功能,無法在尋常的行動裝置上使用。

為了讓更多人體驗到這種新的視覺格式,Facebook 利用機器學習開發了一個系統。這個系統可以推斷出任何圖像的 3D 結構,任何設備、任何時間拍攝的圖像都可以被轉換成 3D 形式。這就可以讓人們輕鬆使用 3D 照片技術。

不僅如此,它還可以處理幾十年前的家庭照片和其它珍貴圖像。任何擁有 iPhone7 及以上版本,或中端以上 Android 設備的人,現在都可以在 Facebook 應用程式中嘗試這個功能。

估計 2D 圖像不同區域的深度,以創建 3D 圖像

構建這種增強的 3D 圖片需要克服不少技術挑戰,例如,要訓練一個能夠正確推斷各種主題 3D 位置的模型,並優化系統,使其能夠在 1 秒鐘內運行在典型的移動處理器設備上。為了克服這些挑戰,Facebook 在數百萬公共 3D 圖像及其附帶的深度圖上訓練了卷積神經網絡(CNN),並利用 Facebook AI 之前開發的各種移動優化技術,如 FBNet 和 ChamNet。團隊最近也討論了 3D 理解的相關研究。

現在,所有使用 Facebook 的人都可以使用這個功能,那麼,它究竟是如何構建的?我們可以一起來看看其中的技術細節。

小狗的原始照片是用單鏡頭相機拍攝的,沒有任何深度圖數據,系統將其轉換成了上圖顯示的 3D 圖像

在行動裝置上提供高效性能

給定一個標準的 RGB 圖像,3D Photos CNN(3D 照片卷積神經網絡)可以估計每個像素與攝像機的距離。研究人員通過四種方式實現了這一目標:

  • 使用一組可參數化、可移動優化的神經構建塊構建網絡架構;

  • 自動化架構搜索,以找到這些塊的有效配置,使系統能夠在不到 1 秒鐘的時間內在各種設備上執行任務;

  • 量化感知訓練,在行動裝置上利用高性能 INT8 量化,同時使量化過程中的性能下降最小化;

  • 從公開的 3D 照片獲取大量的訓練數據。

神經構建塊

Facebook 的架構使用受 FBNet 的構建塊啟發。FBNet 是一個為行動裝置等資源受限的設備優化 ConvNet 架構的框架。一個構建塊由逐點卷積(pointwise convolution)、可選的上採樣、kxk 深度卷積和附加的點逐點卷積組成。Facebook 實現了一個 U-net 風格的架構,該架構已被修改為沿著跳過連接放置 FBNet 構建塊。U-net 編碼器和解碼器各包含 5 個階段,每個階段對應不同的空間解析度。

網絡架構概述:一個 U-net 沿著跳過的連接放置額外的宏級構建塊

自動化架構搜索

為了找到一個有效的架構配置,Facebook AI 開發的 ChamNet 算法自動完成搜索過程。ChamNet 算法不斷從搜索空間中抽取點來訓練精度預測器。該精度預測器用於加速遺傳搜索,以找到在滿足特定資源約束的情況下,使預測精度最大化的模型。

這個設置中使用了一個搜索空間,它可以改變通道擴展因子和每個塊的輸出通道數,從而產生 3.4x1022 種可能的體系結構。然後,Facebook 使用 800 Tesla V100 GPU 在大約三天內完成搜索,設置並調整模型架構上的 FLOP 約束,以實現不同的操作點。

量化感知訓練

默認情況下,其模型使用單精度浮點權值和激活進行訓練,但研究人員發現,將權值和激活量化為 8 位具有顯著的優勢。尤其是,int8 權重只需要 float32 權重所需存儲量的四分之一,從而減少首次使用時必須傳輸到設備的字節數。

每幅圖像都是從一個規則的 2D 圖像開始,然後用深度估計神經網絡轉換成 3D 圖像

與基於 float32 的運算符相比,基於 Int8 的運算符的吞吐量也要高得多,這要歸功於 Facebook AI 的 QNNPACK 等經過優化的庫,後者已經集成到 PyTorch 中。我們使用量化感知訓練(QAT)來避免量化導致的質量下降。QAT 現在是 PyTorch 的一部分,它在訓練期間模擬量化並支持反向傳播,從而消除了訓練和生產性能之間的差距。

神經網絡處理各種內容,包括繪畫和複雜場景的圖像

尋找創造 3D 體驗的新方法

除了改進深度估計算法之外,研究人員還致力於為行動裝置拍攝的視頻提供高質量的深度估計。

由於每個幀的深度必須與下一幀一致,視頻處理技術具有一定挑戰性,但它也是一個提高性能的機會。對同一物體進行多次觀測,可以為高精度的深度估計提供額外的信號。隨著 Facebook 神經網絡性能的不斷提高,團隊還將探索在實時應用(如增強現實)中利用深度估計、曲面法向估計和空間推理等技術。

除了這些潛在的新經驗,這項工作將幫助研究人員更好地理解 2D 圖像的內容。更好地理解 3D 場景還可以幫助機器人導航以及與物理世界互動。Facebook 希望通過分享 3D 圖片系統的細節,幫助人工智慧社區在這些領域取得進展,並創造利用先進的 3D 新體驗。

via:https://ai.facebook.com/blog/-powered-by-ai-turning-any-2d-photo-into-3d-using-convolutional-neural-nets/

雷鋒網(公眾號:雷鋒網)雷鋒網雷鋒網

雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 智雲Smooth 4加入希區柯克式變焦,手機也能出大片
    很多人會認為,無論大片或短片,都需要不少的投資才能完成,其中器材部分就要花費不少成本,但陳可辛這部短片則僅用了iPhone X來拍攝,的確讓人感到驚訝,隨著手機行業的不斷發展,手機也能拍出不一樣的大片。那麼問題就來了,我沒iPhoneX也能拍出一部作品嗎?我可以告訴你,其實手機並不是關鍵,關鍵點在於擁有一個穩定承載這臺手機的工具,這個才是關鍵所在。
  • 谷歌地圖神器又出黑科技,一鍵提取3D模型,還能導入Lumion?
    點擊文末「在看」「贊」,我們將第一時間出現在你面前每天8:15,設計氣象臺準時為你帶來最新黑科技乾貨知識你有沒有發現,同一個方案,為什麼那些頂級設計公司出的圖又酷又寫實,而我們自己卻建模建好幾天,效果還沒別人好?
  • 手機一鍵去除照片裡多餘的人很簡單!30秒就能搞定,日常用得上
    手機一鍵去除照片裡多餘的人很簡單!30秒就能搞定,日常用得上春暖花開的季節,我們外出踏青,難免會用手機記錄下這一美好時刻,但是風景處處好,就是人潮擁擠,想要拍一張全身照,周圍全是人。今天就來教大家一招,手機怎樣去除照片裡面多餘的人。方法很簡單,不妨來學習一下!首先我們可以藉助手機裡面的一些免費工具例如:美圖秀秀、snapseed等工具。
  • 太空拍出「3d大片」的高分七號 首批衛星影像圖
    太空拍出「3d大片」的高分七號 首批衛星影像圖時間:2019-12-12 09:28   來源:中國小康網   責任編輯:凌君 川北在線核心提示:原標題:太空拍出3d大片的高分七號 首批衛星影像圖 12月10日 我國首顆 民用亞米級高解析度光學立體測繪衛星 高分七號 拍攝的 首批衛星影像圖 正式亮相!
  • 多種「玻璃水霧、大雨傾盆」特效|手機一鍵製作
    持續高溫兩周,預報終於要下大雨,坐等風來雨下,順便聊聊手機拍雨那點事兒。喜歡手機攝影的夥伴會發現,用手機拍攝雨天場景時,除非特別大的雨,否則很難拍出雨滴成線的感覺。偶爾拍到雨天「水霧玻璃窗」時,往往雨痕效果不明顯,或者背景不夠美。
  • 花粉幾乎都知道的五個黑科技,你可能都沒聽過,華為手機卻自帶
    隨著華為手機在國內的市場上越做越強大,所佔的市場份額也越來越多,華為的手機用戶也急劇增加,那麼使用華為手機的用戶,對於華為手機自帶的一些黑科技是否都了解呢?有些花粉告訴小編,華為手機自帶的以下五個黑科技,不僅實用而且功能強大!
  • 拍照時閉眼了怎麼辦,不用怕,這個黑科技能幫到你
    關於照片,現在已經有了很多的科技可以用來美化一張照片,比如說消除一些瑕疵啊,調整一下畫面精度等等,甚至幾年前的一些照相館裡、就有了修復照片的業務,可以說想拍出一張好看的照片並不是一件難事。但是,拍照按下快門的一瞬間,就算是姿勢擺好了,都很滿意,但是眨眼了,那該怎麼辦?
  • 十一如何給另一半拍出好看的照片?(拯救男人篇)
    假期出行,拍照可以說是一個強剛需,如何給同行人拍出好看的照片,或者如何讓朋友給自己拍出好看的照片,是大家都很關心的問題。對於男士來說,給女生拍照時謹記「顯高、顯瘦、表情要美」,女生表情沒管理好的時候,就不要按下快門了,也不要低頭隨手一拍,拍出一米二既視感,不然妹子只會分分鐘想把你拉黑。
  • 阿里巴巴達摩院黑科技再次亮相雲棲大會--【足幫幫】3D腳型掃描儀
    其設備自動生成腳型3d模型,支持3d列印與鞋墊定製,以3d腳模型為核心,整合3d鞋楦列印技術,支持大規模數據採集以及客戶腳型資料庫建立。  測量設備端3秒完成三維模型重建,7秒輸出35項測量和足部健康評估腳型報告,精準測量行業領先,多端信息聯動,品牌專屬視覺風格流程簡單,學習成本低,沉浸式用戶體驗用戶手機端掃碼獲取專業腳型報告,健康足部評估與運動建議,串聯智能選款,腳型專屬推薦,線上款式個性定製,一鍵下單試穿,
  • 吃雞黑科技,絕地槍神K1助你一鍵之力
    HandJoy最新推出的黑科技吃雞神器——絕地槍神K1,作為HandJoy第三代手遊鍵盤,絕地槍神K1不僅可以充當機械鍵盤,更是手遊中的鍵鼠轉換器。在聽說有這麼一款吃雞黑科技產品後,小編立馬打開淘寶在HandJoy官方店購買了一臺試試看遊戲體驗感怎麼樣,在收到絕地槍神K1後,最直觀的感受是這款手遊機械鍵鼠轉換器相比去年HandJoy推出的另一款吃雞神器Kmax槍神王座來說,絕地槍神K1更加方便攜帶。從外觀來看,絕地槍神K1採用了時下流行的懸浮式裸軸設計,鍵面正面設計有共計28個按鍵,採用鍵線分離的設計。
  • 小米9最新MIUI測試版中增加黑科技「3D空中手勢」功能
    近日,有位小米內部人員在小米MIUI測試版論壇裡曝光了一個關於小米9的「黑科技」功能,據說這項功能的名字叫「3D Air Gestures」,這個功能可以讓你通過在空中揮動手機來畫出M、W、C或Z來啟動應用程式。
  • 使用iPhone手機拍照,打開這3個功能,隨手一拍都是大片
    本文轉載自【微信公眾號:手機電腦雙黑客,ID:heikestudio】,經微信公眾號授權轉載,如需轉載與原文作者聯繫說到手機拍照,iPhone手機還是當之無愧的好看,雖然近年來華為手機拍照慢慢超過了iPhone手機。
  • 不再是iphone專屬功能,Facebook 3D照片開始支持多種品牌手機
    2月29日消息 ,據外媒報導,Facebook正開放3D照片的使用範圍,不再局限於支持雙攝像頭的 iPhone 機型和針對人像模式下拍攝的照片。據悉,3D照片是Facebook在2018年 5 月舉行 F8 開發者大會上宣布此項目的。
  • 蘋果facebook登錄不了怎麼回事 手機facebook無法登陸解決方法?
    > 手機facebook無法登陸打開解決方法。剛剛申請了手機facebook帳號後,不知道怎麼了,居然無法登陸上去,密碼跟帳號都是沒有問題的。就是打不開,登陸不上去啊。下面就跟大家介紹一下手機facebook無法登陸打開解決方法。
  • 三星手機屏幕黑科技曝光:炫酷 3D 全息顯示
    IT之家訊 三星對於智慧型手機屏幕變革的探索似乎從未停止腳步,就當我們還在感嘆現如今三星S6 Edge雙側弧面屏的視覺衝擊,以及它極其出色的色準時,三星手機屏幕的最新一項黑科技又被曝光了。
  • 酷狗音樂APP全新改版,黑科技賦能音樂
    科技的發展,賦予音樂新的可能性。最近,億級音樂平臺酷狗音樂就藉助黑科技的力量對酷狗音樂APP進行全面改版,最新升級的三大功能迎合年輕用戶的視聽習慣和音樂審美,在新生代市場起音樂社交新潮流。一方面,用戶可以開啟"倍速"欣賞豎屏MV,定義自己的播放速度,製作專屬"鬼畜大片"。另一方面,酷狗音樂還滿足Z世代用戶超強的社交表達訴求,通過埋梗等方式吸引年輕用戶發送彈幕參與音樂和劇情的討論,營造趣味性酷狗音樂社區。聽書劇場視聽合一在追求感官刺激多元豐富的今天,傳統的電臺僅有聲音,稍顯單調。
  • 栩栩如生的黑科技 解析3D全息投影技術
    在欣賞好萊塢大片時我們經常能看到這樣的場景:主角揮一下手,眼前就會出現一塊立體的虛擬屏,然後能對這塊屏幕進行任意操作大家把這項技術稱之為「全息投影」,關於這個黑科技你了解多少?栩栩如生的黑科技 解析3D全息投影技術      全息投影技術是一種記錄被攝物體反射(或透射)光波中全部信息(振幅
  • 科技飛速發展的當前,手機黑科技層出不窮,電池容量為何停滯不前
    時間過得非常快,現在的手機技術和幾年前相比已經進步十分明顯,在當時根本不敢想科技會進步的如此之快,像什麼高刷,手機也能拍出大片兒的感覺,感覺像垮了一個時代一樣!但是儘管手機黑科技創新不斷,但是唯一沒有創新,卻一直停滯不前的卻是手機電池!
  • 外勤365黑科技第四彈:虛假照片自動識別功能
    外勤365黑科技第四彈:虛假照片自動識別功能 作者:網絡
  • 華中科技大學研發黑科技,手機裝上它,可放大1000倍
    大家好,今天給大家帶來的是:華中科技大學再現黑科技,1000倍手機顯微鏡你知道嗎?隨著科技的不斷進步,顯微鏡的作用也不僅限於科學和醫療方面,而是隨著手機的普及和更新,讓蒙學兒童和科學愛好者們都可以用過簡單的設備來觀察世間萬物放大百倍甚至千倍的世界。今天我要給大家介紹的就是一款就是由華科的八位博士自主研發的並且獲得十三項專利的可攜式手機顯微鏡相機,他們取名為TipScope CAM。為什麼稱TipScope CAM為相機呢?