2D照片秒變3D,Adobe新方法讓你只用一張圖像輕鬆做特效

2021-01-09 手機鳳凰網

選自arXiv

作者:SIMON NIKLAUS等

機器之心編譯

參與:魔王

Ken Burns 特效是通過平移和縮放使靜止圖片動態化的一種特效,之前的方法需要多張輸入圖像,而且考驗用戶的圖像處理技術。現在不用了,來自美國波特蘭州立大學和 Adobe 的研究人員提出了一種新框架,它能基於單張圖像合成 3D Ken Burns 特效,並支持全自動模式和用戶控制攝像機的交互模式。

Ken Burns 特效,是一種通過虛擬攝像機掃描和縮放使靜止圖片動態化的特效。添加視差是創建 3D Ken Burns 的重要因素,帶來了很多不可思議的畫面。手動創建此類特效很費時間,並且需要足夠的圖片編輯技巧。

但是,現有的自動方法需要多張不同視角的輸入圖像。最近,來自美國波特蘭州立大學和 Adobe 的研究人員提出了一種新框架,它能基於單張圖像合成 3D Ken Burns 特效,並支持全自動模式和用戶控制攝像機的交互模式。

圖 1:單張圖像生成的 3D Ken Burns 特效。基於單張輸入圖像和用戶自選標註(以裁剪窗口形式),該框架使靜止輸入圖像動態化,並通過添加視差來合成 3D Ken Burns 特效。

示例如下:

該框架首先利用景深預測流程,估計適合視圖合成任務的景深。為了解決現有景深估計方法的局限性,如幾何失真、語義失真和不準確的景深邊界,研究者開發了一種語義感知神經網絡用於景深預測,輔以基於分割的景深調整流程,並使用精煉神經網絡提升目標邊界的景深預測準確率。

該框架根據景深估計,將輸入圖像映射至點雲,並從對應的攝像機位置渲染點雲,從而合成最終的視頻幀。為了解決空洞問題(disocclusion)同時保證合成結果具備時間和幾何連貫性,研究者利用上下文感知的顏色修復和景深修復技術,填充攝像機路徑極端視圖中的丟失信息,從而擴展點雲的場景幾何(scene geometry)。研究者對大量圖像內容進行實驗後發現,該方法可以實現逼真的合成結果。該研究表明,相比已有的 3D Ken Burns 特效生成方法,這一系統不費吹灰之力即可實現更好的合成結果,。

研究貢獻

這篇論文主要介紹如何基於單張圖像,自動合成 3D Ken Burns 特效。研究者納入了簡單的用戶指定攝像機路徑(可選),以期望開始視圖和結束視圖進行參數化,保證用戶對合成特效的控制。

基於單張圖像合成逼真的移動鏡頭效果是一個非常難的問題,它需要解決兩個基礎難題:1)要想基於新攝像機位置合成新視圖,就需要準確復原原始視圖的場景幾何;2)從預測場景幾何中合成具備時間連貫性的新視圖序列需要處理空洞難題。該研究解決了這兩大難題,並提供了一個基於單張圖像合成 3D Ken Burns 特效的完整系統。

首先,該系統基於輸入圖像估計景深圖。近年來現有的景深預測方法迅速發展,但單目景深估計仍然是難解問題。研究者觀察到,已有的景深預測方法並不是特別適合視圖合成任務。具體而言,研究者發現要想使用這些方法進行 3D Ken Burns 特效合成需要解決三個關鍵問題:幾何失真、語義失真和不準確的景深邊界。

基於此,研究者設計了一個景深估計流程以及專門解決這些問題的訓練框架。他們開發了語義感知景深估計神經網絡,並在其最新創建的大規模合成數據集上進行模型訓練,該數據集包含不同照片級真實感場景的真值景深。

這樣,景深預測流程和新型視圖合成方法結合起來形成一個完成的系統,可實現基於單張圖像的 3D Ken Burns 特效生成。該系統提供全自動的解決方案,自動確定虛擬攝像機的開始視圖和結束視圖,從而最小化遮蔽物的數量。

3D Ken Burns 特效合成

該框架包含兩個主要組件:景深估計流程(見圖 3)和新型視圖合成流程(見圖 7)。

語義感知景深估計

圖 3:該研究提出的景深估計流程圖示。給出一張高解析度圖像,研究者首先基於低解析度輸入圖像估計粗糙景深。

要想合成 3D Ken Burns 特效,該方法首先需要估計輸入圖像的景深。研究者將景深估計分為 3 個步驟:

利用低解析度圖像估計粗糙景深,同時依靠 VGG-19 提取的語義信息提升泛化性。 根據 Mask R-CNN 的實例級分割結果調整景深圖,確保顯著目標內的景深值連貫。 精煉輸入圖像指引的景深邊界,同時對低解析度景深估計進行上採樣。

圖 4:景深估計中間結果。該示例展示了景深估計流程中每一步的貢獻。

最初估計的景深遭受語義失真(紅色汽車)和不準確的精神邊界(如塔輪廓上的凸起)。景深調整可解決紅色汽車的語義失真問題,景深精煉可解決目標邊界的細微細節問題。

上下文感知的視圖合成修復技術

為基於景深估計合成 3D Ken Burns 特效,該研究提出的方法首先將輸入圖像映射至點雲中的點。然後沿著預先確定的攝像機路徑從對應攝像機位置開始渲染點雲,從而合成所得視頻中的每一幀。但是,點雲只是從輸入圖像看到的世界幾何部分視圖,因此得到的新視圖渲染結果並不完整,存在遮蔽物引起的空洞。

圖 7:新型視圖合成方法圖示。基於輸入圖像點雲和景深圖,從新的攝像機位置渲染後續新視圖。

該研究設計了一個專門的視圖合成流程來解決圖 7 中的要求。給出輸入圖像的點雲及其景深估計,研究者利用顏色修復和景深修復技術填充不完整新視圖渲染結果的丟失區域。

圖 5:點雲渲染圖示。用初始景深估計的點雲展現深度精煉的重要性,因為目標可能會在目標邊界處被分割開。

涉及景深的圖像修復技術可實現幾何連貫的圖像修復。然後使用修復景深將修復顏色映射至現有點雲中的新點,從而解決遮蔽物的問題。

要想按預先確定的攝像機路徑合成 3D Ken Burns 特效,僅在起始和結尾等極端視圖中執行顏色和景深修復即可。渲染擴展後的點雲可保持時間連貫性,而且能夠實時完成。

圖 6:視頻合成結果示例,對比了兩種流行的即拿即用圖像修複方法和該研究提出的方法。由於待修復區域本質上並非矩形,因此 DeepFill 無法修復出合理的結果。EdgeConnect 的修復結果更加合理,但不具備時間連貫性且無法保持目標邊界。而該研究提出的修複方法既具備時間連貫性,又能保持清晰的目標邊界。

實驗

研究者對比了現有解決方案和新框架在合成 3D Ken Burns 特效方面的效果。他們考慮了兩種商業系統:第一種是 Photo Motion 軟體包,是 Adobe After Effects 的模板;第二種是移動 app Viewmee,它可使非專業用戶輕鬆創建 3D Ken Burns 特效。

圖 10:易用性研究結果。新系統可使用戶不費吹灰之力得到優秀結果。

圖 11 展示了兩個示例,對比了新方法生成的 3D Ken Burns 特效和使用同樣開始視圖、結束視圖裁剪窗口得到的 2D 版本。2D 版本具備典型的縮放特效,但沒有視差。而新方法包含逼真的移動視差和強大的景深預測,因此特效結果更好。

圖 11:2D Ken Burns 和 3D Ken Burns 特效對比圖。注意移動視差方面的差異。

表 1(上)根據每個基準定義的不同量化指標對比不同方法的景深預測質量。該研究提出的方法在所有景深質量指標上均可媲美當前最優的景深預測方法。

表 1(下)列舉了新方法的兩種變體,方便更好地分析景深估計網絡和訓練數據集的效果。具體而言,研究者使用 DIW 數據集的所有可用訓練數據訓練網絡架構,與基於研究者創建的數據集訓練的網絡進行對比。

表 1:景深預測質量。新方法在所有景深質量指標上均可媲美當前最優的深度預測方法。

相關焦點

  • 美圖秀秀上線「魔法照片」功能:靜態圖片秒變動態大片!
    一鍵生成大片,教你製作化靜為動的「魔法照片」「魔法照片」的靈感來源於哈利波特的魔法世界,在神奇的魔法加持下,一張靜態報紙中的人物竟然動了起來,現在這種神奇的效果使用美圖秀秀也能實現。從效果圖上可以看到,除了能夠一鍵生成又仙又美的魔法人像大片,「魔法照片」功能還可以用於風景、物品、合照、全身人像等。不過這種局部動態效果不是適用於所有圖片,像雲彩、水流、頭髮、旗幟、旋梯等製作出來的效果會更加理想。智能模式:海量模板加持,快速生成哈利波特式神仙魔法照片「魔法照片」智能模式製作方法很簡單。
  • Cocos 2d-x遊戲《Monster Strike》終結《智龍迷城》霸榜神話
    取而代之成為TOP 1的,是一款Cocos 2d-x遊戲——Mixi開發的《Monster Strike》。這是Cocos 2d-x遊戲繼中國、韓國、臺灣之後,再次在一個移動遊戲重要區域拿下總榜第一。曾經有人認為,Cocos 2d-x在中國區的成功是出於本土與先發優勢。的確,在網際網路領域,先發優勢非常重要。而在日本,Cocos 2d-x則是一個後入者。
  • 一張自拍生成3D人臉,如何做到的呢?
    講真,你得試試這個,很好玩。 來自諾丁漢大學和金斯頓大學的一隊AI專家,最近發了一個新的研究成果:使用機器學習算法,只需要一張人臉照片,就能生成3D人臉。 整個過程非常簡單,上傳照片(自拍),然後稍等片刻~ 先看看效果。這位知名外國網友:
  • 一張照片變身6種「手繪」特效|手機一鍵生成
    我們先來看一張「荷花圖」變化的6種手繪效果。小月嘗試了很多方法,最終發現一款手機APP可以實現以上幾種手繪後期,分享給夥伴們,給自己的照片美美的「變個身」吧!● 用什麼軟體?picsArt——創意特效軟體,經常關注小月「手機後期教程」的夥伴應該很熟悉,分享過很多製作的方法(為避免「軟體太多,挑花眼」,小月會儘量在常用軟體中開發新功能)。● 如何製作?
  • 何方「神仙太太」讓你秒變二次元人物?百度AI拍了拍你
    更多信息可訪問,在此之前,百度AI二次元特效技術也已經與B612咔嘰、全民小視頻等產品合作,創造眾多「爆款」,並於近期上線於北美市場Toonout APP,讓更多應用輕鬆Get二次元特效。三次元變二次元 AI技術如何實時打破次元壁想要在特效中實現漫畫中亮閃閃的大眼睛、小巧的鼻子和多變的發色並非易事,背後的技術原理並非像看上去一樣簡單,漫畫特效不僅要做到準確定位人像,更重要的是生成與本人形象一致、且畫質清晰的圖像,這就需要圖像理解、生成等多種技術共同配合完成,也對圖像的識別檢測等精準程度等提出了較高要求。
  • 圖片秒變高清:一招教會你如何讓圖片秒變清晰
    圖片秒變高清:一招教會你不用下載app如何讓圖片秒變清晰生活中的困惑:不知道你有沒有發現,微信傳圖片,即使是傳原圖,本來是一張挺清楚的到了我們手機上就變得不清晰了?微信傳圖是有損傳圖,所以會出現這樣的情況。
  • 一款能玩出3D眩暈的2D橫版過關遊戲《三位一體4》
    但今天的這款遊戲則是來自芬蘭的一家獨立遊戲工作室Frozenbyte的作品,《三位一體4:夢魘王子》發售於2019的10月8日,該系列累計收入了過億美元,對於筆者來說,時至今日這依然是體驗最優秀的2d橫板過關遊戲。
  • 【每日一轉】OM3D軟體:如何用單張圖片快速生成3D模型
    這個軟體的聰明之處在於它能夠將二維圖像與三維設計相結合,從而使用三維模型來暗示圖像的「新」視圖。當然,這些不是真實的視圖,更像是對新視圖的最佳猜測。秘訣在於能夠將三維模型提供的細節與目標圖像在二維視圖中的可變屬性相結合。當然,三維物體擁有三維形狀的所有精確細節,但圖像具有所有的照明、陰影、顏色和細微差別。
  • 2分鐘給自己照一張3D照片 可製作人偶
    使用這種機器,只要2分鐘左右就可以輕鬆拍攝人物的3D信息,再等一周就能做出一個和自己一模一樣的人偶。  Labonetwork認為,人們在結婚典禮或者入學儀式等紀念意義的日子,除了拍照留念之外,應該也會有想要製作立體人偶的想法。因此開發了這項服務。預計到2017年,將從日本各地獲得300件以上的租借合同。  這項服務名稱為「迷你我(mini-me)」。
  • 實景照片秒變新海誠風格漫畫:清華大學提出CartoonGAN
    最近,基於機器學習的風格遷移方法,因為其可以通過示例圖片對圖像進行風格化,已經引起了很多人的關注。特別是生成對抗網絡(GAN),其引入了循環方式訓練進一步探索並提高了風格遷移的質量,GAN 的獨特之處在於可以使用不成對照片和風格化圖像進行訓練。儘管基於學習的風格遷移已經獲得了很大成功,但最先進的方法仍無法生產具有可接受質量的漫畫風格圖像。
  • 10張可能讓你懷疑自己智商的照片,盯著看5秒,你會有新發現!
    10張讓你懷疑自己智商的照片,盯著看5秒,你會有新發現同一張圖片,仔細觀察得出的結果可能與第一眼看到的景象產生很大的差別,而且很多時候還會因為不同的人有不同的發現,不禁的懷疑自己的智商。筆者盤點了10張可能讓你懷疑自己智商的照片,盯著看5秒,你會有新發現!1.以為是會動的GIF,但其實是靜止的很多人第一眼看到上面這張圖片,都覺得中間小方塊組成的菱形圖案在不停地動,但是這張看起來會移動的GIF圖,其實是一張靜止的照片。受眼睛焦距的影響和心理作用的幹擾,我們看到了一張會動的GIF圖。
  • 美圖秀秀:讓照片快速變逼真手繪肖像畫
    但在數碼時代的今天,我們用美圖秀秀的特效疊加,可以將照片輕鬆轉畫作,讓你用「拍」就能得到逼真的手繪肖像畫,對於不會畫畫的親們是不是一份小驚喜?快來看看下面彩色鉛筆畫的轉換教程吧,讓你的靚照更與眾不同哦!
  • 玩家製作版本3D地下城和勇士,看了跪下的那一刻
    《地下城與勇士》作為騰訊代理的老遊戲,每年都給人一種倒閉的感覺,但每年,地下城和勇士2d橫版遊戲,剛開始都被角色華麗技能吸引,層次豐富,現在在地牢裡,他是不可能,沒有錢也不會變得更強。你有沒有想過把地牢變成一個3d的遊戲?在b站有一個大佬,將地牢變成一個3d遊戲。
  • ...Go 相同的神經算法,Prisma 能把你的照片秒變「名畫」丨App+1
    2015 年,德國蒂賓根大學的幾位綜合神經科學家提出了一種新方法1,可以將任意圖片變成和名畫的風格。一年之後,俄羅斯的一位 iOS 開發者利用這個算法開發了一款圖像應用,一夜之間爆紅網絡,這款 App 就是的 Prisma。
  • 新的快速圖像轉手繪方法,人類水準、戶外場景
    從照片生成簡筆畫或者素描樣式的手繪圖像是許多普通人都感興趣的計算機視覺任務。但是這項任務並沒有那麼容易做好。近期的一篇新論文《Photo-Sketching: Inferring Contour Drawings from Images》(照片速寫:從圖像生成輪廓繪畫,arxiv.org/abs/1901.00542)就在這個問題上邁出了自己的一步。
  • 老人腫瘤大如氣球 醫生3D建模拆除「炸彈」
    字號變大| 字號變小 c3fa8751c51a4284aa9c2d6df3f3de12
  • 使用這些技巧,最大程度獲得清晰圖像
    對於立志做全天候攝影師的攝影愛好者來說,夜間攝影是一項非常有趣的活動。但是隨身攜帶三腳架會很麻煩,尤其是在漆黑的夜晚拍攝時。我們在沒有三腳架的情況下,可以通過保持相機穩定並調整相機上的參數,只用相機、手和眼睛進行夜間攝影,並儘可能獲得最大清晰度。
  • 床單血漬難清洗,只用撒一把「它」,新老血漬輕鬆洗掉,不留痕跡
    今天圈生活就給大家分享兩個靠譜又實用的清潔床單血漬的好方法,無論新舊血漬都可以一起清潔的非常乾淨,一起來跟我了解一下吧。首先教大家輕度的血漬該怎麼清洗,將需要清潔的血漬處用清水打溼,打溼完以後在上面塗抹一些肥皂,再撒上一勺食鹽和一勺澱粉。所有清潔材料將血漬覆蓋好以後,再次用清水將其打溼,然後靜置五分鐘。
  • 用手機也能編輯出好看的照片,Snapseed使用教程
    Snapseed是智慧型手機上最好的照片編輯應用之一,谷歌於2012年收購了開發這款應用的公司,此後,其知名度一直在上升。它以其簡單性和豐富的功能集合而聞名,所以你不妨學習用它來進行照片的編輯。現代的智慧型手機可以拍攝出很好的照片,但拍攝只是完成一張好看照片的一半,另一部分則需由編輯來完成,因為它可以將好的照片進一步變成令人驚嘆的圖像。