2D轉3D,在《流浪地球》中感受太空漂浮,愛奇藝推出「會動的海報」

2020-12-12 機器之心Pro

機器之心報導

參與:蛋醬

在深度學習技術的加持下,每一張平面圖像都能轉換為效果驚豔的3D圖像?我突然有一個大膽的想法……

相比於 2D 內容,能產生身臨其境感的 3D 內容仿佛總是會更吸引人。

自從 3D 電影誕生以來,人們從未停止過立體影像的追求。隨著近年來 5G 技術的落地,VR 行業也將迎來新的突破,眾多遊戲玩家和電影觀賞者也會因此獲得更加新奇的視覺體驗。但 VR 場景裡 3D 內容的缺乏一直是行業內的一個痛點。

以 3D 電影製作為例,在現階段,每一部 3D 電影的後期製作都需要投入巨大的資金和人力成本,這些現實條件嚴重阻礙了 3D 內容的豐富發展。

最近,來自愛奇藝的團隊介紹了一種 3D 內容轉換的 AI 模型,可通過深度學習技術將 2D 內容快速、批量、全自動地轉製成 3D 內容。在減少 3D 內容製作成本的同時,為用戶提供更多高質量的立體化影像

對於任何電影畫面來說,都能夠轉化為 3D 場景:

也可以用來製作立體動態貓片:

這樣的效果是如何實現的呢?

模型框架解析

想要把 2D 內容轉換為「真假難辨」的 3D 內容,前提是要了解真實人眼的 3D 感知:「為什麼在人眼中,世界是立體的?」

對於 3D 介質來說,越是符合真實世界中人眼的 3D 感知,就會越受到用戶的喜愛。因此在模型構建上必須符合真實世界的 3D 觀感——雙目視覺。

圖 1:雙目相機成像與視差原理。

如圖 1 左所示,兩個相機拍攝同一場景生成的圖像會存在差異,這種差異叫「視差」。視差不能通過平移消除,一個物體離相機越近,視差偏移就越大,反之則越小。

人的左右眼就如同圖中的左右相機。在雙眼分別獲取對應圖像後,通過大腦合成處理這種差異,從而獲取真實世界的 3D 感知,視差與相機焦距和軸間距間的關係如通過圖 1 右所示:

以上為公式(1),其中 z 為物體距離相機的深度,x 為三維映射到二維的圖像平面,f 為相機焦距,b 為兩個相機間的距離軸間距,x_l 和 x_r 分別為物體在左右不同相機中成像的坐標,因此可知左右圖對應像素 x_l 和 x_r 的視差。

同時,考慮到轉制的對象為 2D 介質,因此,通過單目深度估計合成新視點的算法原型誕生:通過公式 (1) 可知,假設有一個函數

那麼就有:

公式(2)。

通過公式(2)可知,只需要將 圖 1 左 作為訓練輸入,圖 1 右 作為參考,即可建立深度學習模型,通過大量雙目圖片對訓練估計出函數。這樣就可在已知相機參數 (,) 的前提下獲取對應的深度值,完成單目深度估計的任務。

通過公式(1)與公式(2)可以發現,深度與視差成反比,因此深度估計和視差估計的方法可以互用。

在項目實踐過程中,團隊嘗試了非常多的關於新視角生成的方案,包括經典的 Deep3D、基於生成網絡、基於中間視差圖等視角生成方案等等,最終確定了更便於引入 3D 電影數據的 Monodetph 無監督訓練作為我們的 baseline 方案

在項目實踐過程中,團隊對比考慮了以下幾種 3D 視覺生成方案,但每一種方法都會存在自身的缺陷:

Junyuan Xie 等人提出的 Deep3D 雖然通過視差概率估計實現 2D 到 3D 介質的轉換,但固定視差的設定,難以適應不同解析度 2D 介質輸入;Ravi Garg 等人 2016 年提出的方法沒有充分利用雙目信息作指導,景深不夠細;Clement Godard 等人提出的 monodepth 在 Ravi Garg 等人的方法基礎上,充分利用了雙目信息進行對抗指導,學習到更多深度細節;Tinghui Zhou 等人提出的 SfmLearner 方法引入幀間時序信息,結構較複雜,運行速度慢。基於實現及適用性考慮,研究者最終確定了更便於引入 3D 電影數據的 Monodepth 為 Baseline,其框架結構如圖 2 所示:

圖 2:monodepth 框架圖。

通過 圖 2 框架可以看出,該框架在訓練過程充分利用雙目的有效信息作指導,同時測試過程也只需要單目圖片進行輸入,所以非常適合用於 2D 轉 3D 技術的框架。

各種問題的解決

但在研發過程中,仍然存在一系列非常影響最終效果的問題,比如不同相機參數的模型預測、幀間抖動、物體邊緣,以及背景存在模糊流動區域、物體空洞等,都是非常大的技術難題。

愛奇藝團隊也分享了他們在技術落地應用過程中,工程難題的解決方案:

解決相機問題

在 Baseline 模型的基礎上,如果直接使用混合的 3D 電影數據集進行訓練,模型將無法收斂或預測不穩定,一個最主要的問題是不同電影使用不同相機參數的攝像機進行拍攝,即使兩個非常相似的電影場景,在不同的兩部電影中也會有不同的景深分布,表現在模型訓練中即為不同的視差值。

與此同時,不同電影的後處理方式,以及會聚相機的引入,會進一步增加建模的難度。在分析相似案例的處理方法中,研究者發現可以通過引入條件變分自編碼器(CVAE),在訓練過程中把每一組訓練集(左右視圖)通過網絡提取其相機參數等信息,並作為後驗信息通過 AdaIN 的形式引入到單目(左視圖)視差圖預測中,同時參考《Toward Multimodal Image-to-Image Translation》中的「雙輪訓練」,保證了測試時隨機採樣相機參數分布的正確性。

解決抖動問題

在解決數據集問題後,進行連續幀預測時,研究者發現存在預測不穩定及抖動的問題。

目前,在解決視頻生成過程(尤其是連續幀深度圖預測)抖動問題的方案中,最為常見的方案包含基於幀間 ConvLSTM 的 [7] 和 [8] 和基於光流的 [9] 和 [10]。

其中,[8] 在不同尺度的編碼和解碼的過程中均加入 ConvLSTM,隱式的利用時間域上特徵的相關性來穩定的預測深度圖,而 [7] 則僅在網絡輸出的最後一層引入 ConvLSTM。

引入 ConvLSTM 的方法雖然思路簡單,但在 2D 轉 3D 模型中卻不適用,[8] 使用了較多的 ConvLSTM,使得訓練較為複雜,不易收斂,[7] 由於電影分鏡鏡頭種類多變,單一 ConvLSTM 預測時易累計誤差,使得預測變差。

圖 3:vid2vid 結構圖。

研究者提出的 2D 轉 3D 模型採用了類似於 [10] 的模型結構,如圖 3 所示,將左側上支路改為輸入三幀左視圖(t,t-1,t-2),左側下支路改為輸入前兩幀預測視差圖(t-1,t-2),右上支路為輸出當前幀所預測的視差圖,右下支路改為輸出前一幀預測視差圖到當前幀預測視差圖的光流圖(t-1→t)及其 valid mask 圖,最終結合右側上下兩支路結果合成當前幀視差圖。

其中,在中間高維特徵合併處引入上文提及的 CVAE 模塊,用以引入後驗相機參數信息。最終,在解決相機參數導致數據集問題的同時,模型能夠得到穩定且連續的視差圖輸出。

解決「空洞」填補問題

新視角的生成會使部分原本被遮擋的區域在新視角中顯露出來,這些信息僅從左視圖中是無法獲取的,即使通過前後幀的光流信息也很難還原,因此會形成一些空洞。

圖源:CVPR 2020 論文《3D Photography using Context-aware Layered Depth Inpainting》,地址:https://arxiv.org/pdf/2004.04727.pdf。

在生成新視角的後處理過程中,研究人員參考了 ICCV 2019 的一篇圖像修復論文中提到的模型框架設計,通過視差圖來指導獲取產生的「空洞」區域,通過圖像修補技術解決新視角的「空洞」問題。

3D 效果測評由於拍攝條件不同會導致 3D 效果不同,所以在 2D 轉 3D 效果測評中,研究者用大量人力對預測的視差圖和成片在 VR 中的 3D 效果進行綜合性的評測。視差圖估計如圖 4:

圖 4:各種場景下的單目視差估計。

上文所展示的 3D 海報就是這一技術的直接應用場景,比如下圖這一張就是在 2D 海報的基礎上加上其深度關係圖,通過一系列的新視點渲染,即可得到一組動態的、人能感知的立體影像。

《復仇者聯盟 4》3D 海報。

此外,模型效果的評測也是難點之一。評價 3D 效果的呈現好與壞,很多時候是一個主觀問題。在模型多次迭代的過程中,模型轉制後影片收到效果評價並不統一,所以很難去衡量模型迭代該朝著哪個方向走。最終,經過長時間的探索以及與其他部門的磨合,團隊從零搭建了一套詳細且較為科學的 3D 影片效果評價體系,從更統計、科學的角度來評價模型效果,這在後期模型優化的過程起到了非常重要的指導作用。

2D 轉 3D 的未來想像

目前,利用該技術轉制的 3D 海報內容已經在部分用戶的愛奇藝 APP 端進行灰度測試,隨後將在各終端的 APP 中呈現。

3D 海報 Demo:《流浪地球》。

除了 3D 海報的展示形式之外,愛奇藝 VR 頻道也已經上線了《四海鯨騎》、《靈域》、《萬古仙穹》等多部轉制 3D 劇集。未來該模型也會應用在更多的內容上,讓用戶獲得更好的觀影體驗。

參考文獻:

[1]Xie J, Girshick R, Farhadi A. Deep3d: Fully automatic 2d-to-3d video conversionwith deep convolutional neural networks[C]//European Conference on ComputerVision. Springer, Cham, 2016: 842-857.

[2]Garg R, BG V K, Carneiro G, et al. Unsupervised cnn for single view depthestimation: Geometry to the rescue[C]//European Conference on Computer Vision.Springer, Cham, 2016: 740-756.

[3] Godard C, Mac Aodha O, Brostow G J. Unsupervisedmonocular depth estimation with left-right consistency[C]//Proceedings of theIEEE Conference on Computer Vision and Pattern Recognition. 2017: 270-279.

[4] Zhou T, Brown M, Snavely N, et al. Unsupervised learningof depth and ego-motion from video[C]//Proceedings of the IEEE Conference onComputer Vision and Pattern Recognition. 2017: 1851-1858.

[5] Huang X, Belongie S. Arbitrary style transfer inreal-time with adaptive instance normalization[C]//Proceedings of the IEEEInternational Conference on Computer Vision. 2017: 1501-1510.

[6] Zhu J Y, Zhang R, Pathak D, et al. Toward multimodal image-to-imagetranslation[C]//Advances in neural information processing systems. 2017:465-476.

[7] Zhang H, Shen C, Li Y, et al. Exploitingtemporal consistency for real-time video depth estimation[C]//Proceedings ofthe IEEE International Conference on Computer Vision. 2019: 1725-1734.

[8] Tananaev D, Zhou H, Ummenhofer B, et al. TemporallyConsistent Depth Estimation in Videos with RecurrentArchitectures[C]//Proceedings of the European Conference on Computer Vision(ECCV). 2018: 0-0.

[9] Lin J, Gan C, Han S. Tsm: Temporal shift module forefficient video understanding[C]//Proceedings of the IEEE InternationalConference on Computer Vision. 2019: 7083-7093.

[10] Wang T C, Liu M Y, Zhu J Y, et al. Video-to-videosynthesis[J]. arXiv preprint arXiv:1808.06601, 2018.

[11]Yu J, Lin Z, Yang J, et al. Free-form imageinpainting with gated convolution[C]//Proceedings of the IEEE InternationalConference on Computer Vision. 2019: 4471-4480.

參考連結:https://mp.weixin.qq.com/s/CpK0b5buUvG_HqF3mGzUyg

相關焦點

  • 想要看看「流浪地球」的目的地?試試 NASA 出品的太空旅行工具
    劉慈欣小說中的三體世界便是基於半人馬座 α 設想而來的。事實上,半人馬座 α 可能是在科幻作品中登場最多的系外星球:阿西莫夫在上世紀創作的小說《Homo Sol》以及《基地》系列中均提及遷徙到半人馬座 α 的人類文明;《阿凡達》故事的發生地潘多拉星則是半人馬座 α 星 A 恆星系裡的一顆衛星;而最近大熱的《流浪地球》設定中,地球流浪的目的地正是半人馬座 α 三合星之一的比鄰星。
  • 地球重60萬億億噸,為何不向下墜落,還能漂浮在太空中?
    為什麼在太空中是懸浮的狀態,沒有往下墜呢?前面也說了,引力是物體「下墜」的唯一條件,不只是地球,宇宙中的所有星球,包括很多壁地球大得多的星球也是漂浮在空中的,因為所有星球的下端都沒有引力中心,人類到了太空中也能漂浮。什麼是引力中心呢?
  • 到太空度假?全球六大超夢幻「太空主題」旅館
    不妨參考英國每日郵報整理的全球六間以「太空」為主題的套房,挑選幾家以太空風格包裝的飯店入住體驗吧!住在有如太空景觀的客房感覺超神秘研究太空的科學家常說人類很快就可以進行太空旅行,但到底何時才能踏上太空之旅呢?也許在地球尋找另類的太空主題可能還更快一些。
  • 銀河系中,「流浪地球」比銀河系的恆星還要多?
    《流浪地球》中,為了避免被變成紅巨星的太陽的吞噬,地球不得已踏上流浪之旅,成為銀河系中一個漂泊的行星。但是,發表在《天文雜誌》一項新研究認為,僅在銀河系中,流浪行星(沒有恆星的行星)比銀河系中的恆星還多。
  • 網友版流浪地球!遊戲影視中的太空船3D模型大比拼
    【網友版流浪地球!遊戲影視中的太空船3D模型大比拼】人類對宇宙飛行的想像力極限在哪裡?從《皮克敏》《黑衣人》中30釐米高的超迷你飛行器;到《復仇者聯盟》中5千米長的滅霸堡壘;《流浪地球》中直徑13000千米高的地球本身;即使《星際迷航》中,直徑2億千米,遠超太陽150倍的「戴森球」,都還不是最大飛船......
  • 帶地球去流浪,帶科幻回故鄉
    流浪與回鄉:虛構2000 年,《流浪地球》發表於《科幻世界》第七期。寫作之初,劉慈欣剛剛開始在雜誌上發表作品,他想要描繪的是一個有著文學美感的科幻故事,「科學推動世界在宇宙中流浪」,表達一種「遊蕩在外」的文學意象。最初的版本只有現在一半的篇幅,應編輯要求,劉慈欣才在修改時將內容增加到了兩萬字。
  • 太空中漂浮的屍體會腐爛,還是永恆?
    人類踏上星辰大海至今,事故大多數都是發生在回家或還沒出門的路上,尚未發生遺體孤獨漂浮在太空中的情況。未來如果有「太空葬禮」記得給夠錢,否則會變成「火葬」。太空科幻片中,太空人失事脫離飛船的橋段常有,綠幕特技與特效下的太空「演員」常把屍體演得「生龍活虎」,更有宇航頭盔破裂,直接「爆漿」的,這些都是煞費苦心、腦洞大開的電影人為了打造螢屏效果。接下來把這些統統忘掉,我們來聊聊「太空屍體」的正確打開方式與歸宿。在太空中漂浮的屍體會腐爛嗎?
  • 《流浪地球2》定檔2023年大年初一!概念海報百種語言訴「再見太陽...
    就在剛剛結束的第33屆中國電影金雞獎上,電影《流浪地球:飛躍2020特別版》做了官方特別展映,活動現場,中國電影集團公司副董事長,中國電影股份有限公司副董事長、總經理傅若清,電影《流浪地球》導演郭帆共同宣布,電影《流浪地球2》定檔2023年大年初一,並曝光首張概念海報,這預示著,中國科幻冒險電影再度起航,電影《流浪地球》將繼續燃亮太空!
  • 背後是國產3D動畫和2D動畫的戰爭
    日本2d動畫各類型都非常非常的成熟,有代表作,經典甚至是神作。中國2d動畫從業人員廣受影響,前去做又會做出類似的風格。甚至連美學系統,那種大眼睛尖臉的人物畫風。這些都是日本動畫所發明。但美國連載動畫除了一部《愛,死亡和機器人》。並沒有什麼歐美長篇連載動畫在國內非常火爆。這都已經不是歐美3d動畫還是歐美2d動畫的問題,歐美長篇連載動畫在中國市場,它一直就不行。
  • 如果地球生物的屍體在太空漂浮,最終的歸宿是怎樣的?
    在這種情況下,如果太空飛行器所處的位置是向陽面,溫度會高達100℃,在這種高溫下,地球上的動物能夠存活的時間極短,隨著生命的終結,高溫、有氧的環境下,狗的屍體就會腐爛。如果是在背陽面,那麼太空中的溫度會在零下100攝氏度以上,此時狗會被凍死,而且是被直接凍僵。這就像珠峰上的「綠靴子」一樣,不會腐爛。第二種情況,溫度調節系統沒有問題,但是氧氣供給消失。
  • 為什麼地球能在空曠的太空中「漂浮」著呢?到底是什麼在支撐它?
    為什麼地球能在空曠的太空中「漂浮」著呢?到底是什麼在支撐它?很多人都認為宇宙的組成與地球上的組成是類似的,地球有地底下,那麼宇宙應該也有地底下,很多時候,在地球上,當一種東西掉落的時候,都是直接落在地上的,也就是說地球上有一定的空間足夠讓那件東西存在,那麼宇宙之中是不是也有讓地球墜落存在的地方呢,答案是沒有的,因為宇宙中的結構都是有一定規律的,不能夠輕易打破,而氣球也有它一定的位置空間,地球的個體比較大,也沒有什麼多餘的空間讓它佔有。
  • 有沒有發現國漫3d多2d少?一個更好恰飯,另一個容易餓死!
    有關國漫3d和2d的爭論,已經持續十年有多,從當初《超獸武裝》和《虹貓藍兔七俠傳》誰更能代表國漫,到現在3d和2d誰才是國漫未來,相關的粉絲一直吵個不停。然而必須承認的事實是國漫裡3d的數量遠比2d要多。為什麼國漫裡3d的佔比會如此可怕,每年達到百分七十以上呢?
  • VR全景之流浪地球
    這是流浪地球中的經典語錄,但也是道出了行駛安全的本質,所以這個兩句話成為各大城市的駕駛安全標語,所有的人都深深記住了流浪地球是中國科幻電影裡程碑式的一部電影,從大年初一到今天,票房達到了37個億,這是中國電影界的業績的驕傲,證明了中國電影邁向科幻片的新開啟。不光點爆了中國市場,在國外也是掀起了一波高潮。國外觀影者也是對本片好評如潮。
  • 399開走流浪地球「大G」
    再比如國產科幻巨作,《流浪地球》中的特種兵車。看似灰頭土臉,一點都不華麗,裡頭卻是脫胎於現實真槍實彈的「真傢伙」,整體上下透露著一股蘇聯時期的重工業魅力。如果不只是看看,還能擁有,親手撫摸每一個細節,那真是......難以形容。
  • 《流浪地球》:重識普世主義
    明明只有「愛球主義」先糾個偏,反感《流浪地球》的人有很多種,有人就是不喜歡科幻類型電影,有原著黨覺得太不忠實原著,有人觀影前期待過高導致心理落差,這些都無可厚非。但有一類人例外,有必要認真理論一下,就是說「太空版《戰狼2》」,看見渲染「愛國主義」「民族主義」就噁心的噴子們。
  • 《流浪地球》好看?這15部科幻電影更不能錯過!
    《流浪地球》根據劉慈欣同名小說改編,講述了在未來太陽系已不宜人類生存,面對絕境,人類開啟了「流浪地球」計劃,試圖帶地球一起逃離太陽系,尋找新家園的故事。但實際上,這段故事僅僅源自劉慈欣兩萬字原著中的兩個自然段。所以,對於《流浪地球》的世界觀和未來的百年編年史,都是重新建構的。對於該片的劇情,我們在此不做探討;但毋庸置疑的是,《流浪地球》的美術足以讓觀眾信服這是一部可圈可點的佳作。
  • 在太空中漂浮的屍體會腐爛嗎?會有怎樣的歸宿?
    如果太空中有漂浮屍體,那也一定是太空人,因為普通人也上不去,再說了太空人到太空,在太空艙內是非常安全的,只有走出太空艙,進行太空行走和執行維護任務時,才有可能發生意外,如果真的發生太空人脫離了太空艙,屍體在太空中漂浮,會有怎樣的歸宿?
  • 愛在冬日不流浪,來浦東嘉裡城與TA迎接溫暖「聖誕」
    來@浦東嘉裡城「TA愛你領養集市」邂逅你最溫暖的夥伴給TA一個家聖誕,是家人、愛人和親友團聚的日子希望我們能在歡度節日的同時也>不要遺忘那些仍在冷風中渴求一絲溫暖的流浪動物們2020年12月12日-12月13日它基金xTA上海 攜手浦東嘉裡城與你一起見證「愛在 嘉裡 新生」#愛TA· 亮燈儀式
  • 「靜與動―香港國際海報三年展2020」作品徵集
    「香港國際海報三年展」自2001年舉辦至今,是香港文化博物館策劃的大型活動之一,透過定期舉辦展覽及活動展示優秀的設計作品,並介紹世界各地的海報設計發展。第七屆主題為「靜與動」。縱然科技不斷前進,訊息宣傳的方法漸漸流行從紙媒移至電子屏幕,海報製作亦從人手設計和印刷工序,演變至透過電腦程式設計並「一鍵」完成發布,賦予平面海報動態元素,躍動在宣傳屏幕上。
  • 《流浪地球》x肯德基推出硬核午餐海報 電影票房逼近44億元
    肯德基的硬核午餐聯動了超熱電影——同樣非常硬核的《流浪地球》。  今日,肯德基曬出了幾張《流浪地球》xKFC的海報,硬核午餐x硬核科幻電影,別有風味,參與活動還有機會獲得籤名海報。