AI視頻摳圖有多強?無需綠幕也可達影視級效果!

2020-12-05 新浪科技

來源:雷鋒網

今天一大早就被網友們安利了一個熱門AI項目。

聽說,它可以帶你週遊世界,還能讓AngelaBaby多拍幾部電視劇。

這是啥情況??

仔細一了解,原來是一款AI視頻摳圖神器,一大早就衝上了GitHub熱榜。

官方介紹說,這個AI神器可以讓視頻處理變得非常簡單且專業,不用『綠幕』,也能達到逼真、毫無違和感的合成效果。

果然,打工人的「週遊世界」只有AI能實現了[淚目]。

其實,視頻摳圖AI已經出現過不少,但這一款確實讓人覺得很驚豔。先來看下它演示Demo。

你能看出公路背景和大海背景的視頻,哪一個是AI合成的嗎?

連撩起的頭髮都看不出一點破綻。

而且就算瘋狂跳舞也沒有影響合成效果。

再來看下它背後的摳圖細節,不僅精確到了頭髮,甚至還包括浮起的碎發。。。。。。

動態效果也是如此,瘋狂甩頭也能實時捕捉細節。

這項超強AI摳圖神器來自香港城市大學和商湯科技聯合研究團隊,論文一作還是一位在讀博士生張漢科。

接下來,我們來看下它背後的技術原理。

目標分解網絡MODNet

關鍵在於,這個AI採用了一種輕量級的目標分解網絡MODNet( Matting Objective Decomposition Network),它可以從不同背景的單個輸入圖像中平滑地處理動態人像。

簡單的說,其功能就是視頻人像摳圖。

我們知道,一些影視作品尤其是古裝劇,必須要對人物的背景進行後期處理。為了達到逼真的合成效果,拍攝時一般都會採用『綠幕』做背景。因為綠色屏幕可以使高質量的Alpha 蒙版實時提取圖像或視頻中的人物。

另外,如果沒有綠屏的話,通常採用的技術手段是光照處理法,即使預定義的Trimap作為自然光照算法輸入。這種方法會粗略地生成三位圖:確定的(不透明)前景,確定的(透明)背景以及介於兩者之間的未知(不透明)區域。

如果使用人工注釋三位圖不僅昂貴,而且深度相機可能會導致精度下降。因此,針對以上不足,研究人員提出了目標分解網絡MODNet。

如圖所示,MODNet由三個相互依賴的分支S、D和F構成。它們分別通過一個低解析度分支來預測人類語義(SP)、一個高解析度分支來聚焦縱向的邊界細節(DP),最後一個融合分支來預測Alpha Matte (αp)。

具體如下:

語義估計(Semantic Estimation):採用MobileNetV2[35]架構,通過編碼器(即MODNet的低解析度分支)來提取高層語義。

細節預測(Detail Prediction):處理前景肖像周圍的過渡區域,以I,S(I)和S的低層特徵作為輸入。同時對它的卷積層數、信道數、輸入解析度三個方面進行了優化。

語義細節融合(Semantic-Detail Fusion):一個融合了語義和細節的CNN模塊,它向上採樣S(I)以使其形狀與D(I,S(I))相之相匹配,再將S(I)和D(I,S(I))連接起來預測最終αp。

另外,基於以上底層框架,該研究還提出了一種自監督策略SOC(Sub-Objectives Consistency)和幀延遲處理方法OFD(One-Frame Delay )。

其中,SOC策略可以保證MODNet架構在處理未標註數據時,讓輸出的子目標之間具有一致性;OFD方法在執行人像摳像視頻任務時,可以在平滑視頻序列中預測Alpha遮罩。如下圖:

實驗評估

在開展實驗評估之前,研究人員創建了一個攝影人像基準數據集PPM-100(Photographic Portrait Matting)。

它包含了100幅不同背景的已精細注釋的肖像圖像。為了保證樣本的多樣性,PPM-100還被定義了幾個分類規則來平衡樣本類型,比如是否包括整個人體;圖像背景是否模糊;是否持有其他物體。如圖:

PPM-100中的樣圖具有豐富的背景和人物姿勢。因此可以被看做一個較為全面的基準。

那麼我們來看下實驗結果:

圖中顯示,MODNet在MSE(均方誤差)和MAD(平均值)上都優於其他無Trimap的方法。雖然它的性能不如採用Trimap的DIM,但如果將MODNet修改為基於Trimap的方法—即以Trimap作為輸入,它的性能會優於基於Trimap的DIM,這也再次表明顯示MODNet的結構體系具有優越性。

此外,研究人員還進一步證明了MODNet在模型大小和執行效率方面的優勢。

其中,模型大小通過參數總數來衡量,執行效率通過NVIDIA GTX1080 Ti GPU上超過PPM-100的平均參考時間來反映(輸入圖像被裁剪為512×512)。結果如圖:

上圖顯示,MODNet的推理時間為15.8ms(63fps),是FDMPA(31fps)的兩倍。雖然MODNet的參數量比FDMPA稍多,但性能明顯更好。

需要注意的是,較少的參數並不意味著更快的推理速度,因為模型可能有較大的特徵映射或耗時機制,比如,注意力機制(Attention Mechanisms)。

總之,MODNet提出了一個簡單、快速且有效實時人像摳圖處理方法。該方法僅以RGB圖像為輸入,實現了場景變化下Alpha 蒙版預測。此外,由於所提出的SOC和OFD,MODNet在實際應用中受到的域轉移問題影響也較小。

不過遺憾的是,該方法不能處理複雜的服裝和模糊的運動視頻,因為這些內容不涵蓋在訓練數據集內。下一階段,研究人員會嘗試通過附加子目標(例如光流估計)的方法來解決運動模糊下的視頻摳圖問題。

相關焦點

  • 編程去除背景綠幕摳圖,基於.NET+OpenCVSharp
    我又試用了幾個軟體,包括XSplit Vcam、抖音直播伴侶、OBS,他們的功能都做的很優秀,包括很多都還有不需要綠幕的智能摳圖的功能,非常強大,但是他們都無法滿足我的特殊要求。所以我需要自己開發這樣一款軟體。典型的人像摳圖需要在被摳圖的物體之後放上綠幕,然後再通過程序把綠幕扣除掉,這樣人像就被保留下來了,再把摳出來的人像繪製到新的背景圖上即可。
  • 漲知識,科幻電影特效為什麼要綠幕拍攝?綠幕有什麼作用
    作為一名影視劇愛好者而非專業的影視製作者,我來膚淺地聊一下綠幕的作用及特效與綠幕的關係,如有不妥,拜託專業的道友寬容。1.綠幕的作用一句話,就是為了摳像。相信略微了解PS的人都會聽說過「摳圖」這個詞,就是把圖片中的某些特定部分從整個圖片中分離出來,以便於合成到其他背景圖片裡。如下圖中,PS神奇的「魔棒」功能,就是可以選中所有顏色一致的部分,下圖中是綠色被選中,然後刪除選中區域,保留印章部分,簡單方便、乾脆粗暴。只不過PS摳圖是針對二維靜態圖片的,而影視劇是三維動態視頻,視頻摳圖俗稱「摳像」。
  • 《風聲》:AI換臉、綠幕摳圖,把諜戰劇拍成了抗戰神劇
    《風聲傳奇》集結了廖凡、張歆藝、劉威葳、胡可、田雨、李乃文在內的多位明星。雖然星光熠熠,但劇集本身卻質量平平,而沒能激起太大的水花。看過影版的觀眾都知道,影版《風聲》主要具有兩大特點:一是,陣容豪華;二是,演技高超。
  • 新手村:綠幕下的巴巴託斯,但有要注意的要點
    一般的情況下如果後期做摳圖的操作都會使用一些綠幕或者藍幕來做照片的背景。但綠幕並不是綠卡紙,基本上綠卡紙在摳圖的時候沒啥用。這就和背景材質的反光率有關係了。正經的綠幕是絨布或者無紡布製作的,在燈光下顏色可以很均勻。
  • 單塊GPU實現4K每秒30幀,實時視頻摳圖再升級,毛髮細節到位
    除了增加娛樂效果之外,背景替換可以增強隱私保護,特別是用戶不願在視頻會議中向他人分享自身位置以及環境等細節時。而這面臨著一項關鍵挑戰:視頻會議工具的用戶通常無法獲得電影特效背景替換所使用的綠幕或其他物理條件。為了使用戶更方便地替換背景,研究人員陸續開發了一系列摳圖方法。
  • 990以下無對手 麒麟820新機可以這麼玩:手機就能摳圖、摳視頻
    對於喜歡拍照、玩短視頻的小夥伴們來說,各種修圖後期軟體一定是手機裡的必備。不過熟悉後期軟體的朋友們也都知道,無論是處理照片還是視頻都需要一定的時間,在選擇濾鏡、摳圖合成的過程當中需要耐心的等待。對於有選擇困難症的用戶而言,一張一張等待生成、一個一個對比效果,使用體驗上更是不暢。現如今,很多高階的後期軟體都已經不只是在原圖上蓋上濾鏡,而是通過軟體深度學習來創造出新圖。在處理過程當中,軟體通過運算解讀圖片,也就是把圖像變成數字,然後經過運算重新轉換成圖像。
  • 老師「綠幕摳圖」帶學生「環遊世界」!東莞高校高能網課上不停
    老師「綠幕摳圖」帶同學「環遊世界」……從3月2日開始,東莞理工學院2020年春季學期在線教學全面開啟,師生們足不出戶,就能走進一節特別的課堂。只有你想不到,沒有教師做不到。一堂堂高能網課就這麼開講了。
  • 直播攝像頭透明背景實時摳像,一學就會的OBS直播綠幕摳像
    在直播過程中怎麼實現即時摳像效果?下面就教大家怎麼在直播中處理掉攝像頭裡的圖像背景,只顯示人像。這種效果看著很高端,有種好萊塢拍大片的感覺,其實,特別的簡單,只要簡單的設置一下,一學就會。首先,你得準備一塊綠色的布(之所以要準備綠幕,可能綠色比較吉祥吧,哈哈哈哈哈,什麼顏色無所謂,只要求是純色的並且和你衣服顏色不一樣就可以啦,業內習慣用綠幕,可能綠幕的背景更方便後期處理),準備的這塊綠布用於直播時,在身後作為背景布。
  • 谷歌AI又有新技能:不用綠幕摳像 自動更換視頻背景
    導語:谷歌AI又學會一項新技能,如果你拍攝自拍視頻,它可以更換視頻背景(摳像);之前我們只能更換靜態照片的背景。
  • 摳綠幕告別AE!Final Cut ProX如何導出Alpha通道透明視頻?
    我們在影視後期的流程中,在中間流程經常會遇到帶Alpha通道的透明視頻,它能夠方便我們遞進給包裝,整體使用起來非常高效!如果你是使用Final Cut Pro X進行主剪輯工具的,就知道FCPX裡有非常多優質的Motion Graphic模板,我們可以藉助這些模板快速生成透明視頻!那麼,具體該如何操作呢?
  • 摳圖小技巧之局部色彩變換
    有很多小夥伴都說摳圖太難了,其實小編剛開始用的時候也覺得很難不好扣,但是熟悉了掌握了之後就會覺得:哎?怎麼這麼好用。 所以說摳圖這個一定要多練習,多熟悉各個邊緣數據的調整就好啦。
  • 我們常說的「拍綠幕」到底是什麼?能用別的顏色嗎?
    最具代表的A計劃而且當時香港最好的醫院裡,永遠為成家班留著有七張病床的病房,方便他們隨時住院。基本上是這個剛剛出院,那個又住進去,石膏和繃帶拆了又裝。老一輩動作演員們的辛苦由此可見一斑。復仇者聯盟的綠巨人「摳綠」其實就是「綠幕扣除」,簡單地說就是摳圖。
  • 關於綠幕,你需要知道的知識點!
    綠幕特效技術一般會在一些好萊塢電影或者電視臺才能看到,現在隨著科技的進步,綠幕特效對於個人來講也可以隨意玩轉了。綠幕特效技術一般都是靠後期軟體進行摳綠色(去溢色)合成。那關於綠幕環境搭建話,需要注意哪些東西呢?
  • 摳圖P圖軟體
    P圖軟體簡介 摳圖P圖秀是一款簡單實用的摳圖P圖軟體,可以幫你輕鬆摳圖換背景,並實現圖片人像合成。
  • PS摳圖下載_PS摳圖手機版下載_PS摳圖安卓版免費下載-太平洋下載中心
    PS摳圖讓專業摳圖變得更加簡單,能夠智能地快速摳圖P圖出想要的效果,無需掌握設計技能,就能輕鬆製作出精美的圖片.
  • 三國志13ai武將文官類威名技能效果解析,如何讓ai快速升級威名
    明鏡止水威名被動技能可以提升戰術力並擴大戰術效果範圍,但若玩家不參與戰鬥並指揮戰鬥其實根本不會出現戰術布置的界面,只能勉強在戰鬥中系統計算戰鬥傷亡時有微量的加成。因此若玩家不參戰指揮,這個威名對於ai武將而言其實也比較雞肋。
  • 免費在線摳圖工具,不用PS,摳圖只需3秒!
    很多大神用PS摳圖,但是對於我們這些小白來說,PS摳圖操作複雜。有沒有一款智能的摳圖工具,只要簡單上傳圖片即可隨心所欲摳圖呢?傲軟摳圖提供完全免費的在線摳圖工具,只需上傳圖片,小白都可以快速上手摳圖。如何使用在線摳圖製作精美的圖片呢?請參考以下步驟:1. 進入在線摳圖頁面,傲軟摳圖在線摳圖工具提供人像摳圖,物品摳圖,以及電子印章/圖標摳圖這三種。
  • 竇驍承認《楚喬傳》「摳像」:是導演要求必須在現場拍,然後摳圖
    近日,竇驍與張鈞甯在出席《六人晚餐》校園活動時,被問熱播劇《楚喬傳》的摳圖情況,竇驍解釋稱:「是導演不讓我們走,必須在現場拍攝然後摳圖,因為當時實在沒有辦法。先拍的獵場的戲,我們才進組,我們沒有辦法去那邊補戲。」
  • UI互動設計教程全套視頻合集:輕鬆玩轉photoshop摳圖
    隨著UI設計的崛起,越來越多的平面設計轉行做UI設計。而UI設計人才在招聘市場上也很搶手,名企開出的薪資很高,這使得一些其他行業的人也想轉行來做UI設計。但是想做UI設計需要先了解它是什麼,需要掌握什麼技能才行。