讓電影動漫統統變絲滑,480幀毫無卡頓,交大博士生開源插幀軟體

2020-12-05 量子位

曉查 發自 凹非寺量子位 報導 | 公眾號 QbitAI

連手機都開始用上120幀的顯示屏,但是網上大部分的視頻居然還是30幀。

視頻的幀率已經遠遠趕不上人民群眾的需求了,所以有不少人都在研究如何把普通視頻變成高幀率視頻。

去年,英偉達開源了Super SloMo,從普通的視頻「腦補」出高幀率的畫面,從30fps插幀到240fps,即使放慢8倍也不會感到卡頓。

最近,來自上海交大的一個新的插幀算法DAIN開源。它比英偉達的算法效果更清晰、幀率更高,可以把30fps的進一步插幀到480fps,這已經超過了很多手機的慢動作錄像幀率。

更重要的是,英偉達的Super SloMo只用在了真實拍攝的視頻上,而這項研究卻可以擴展到常見的任何類型視頻:電影、定格動畫、動漫卡通等等。

△ 連埼玉老師的披風都變得絲滑流暢了

如果你覺得上面效果還不夠明顯,可以再看一張。

羽毛的擺動是不是變得更流暢自然了?

可以想像,如果未來把DAIN用於動漫的製作,只要用低幀的動畫就可以生成絲滑的效果,或許能大大減少插畫師的工作。

DAIN的代碼已經開源,甚至研究人員還打包了一份Windows安裝程序,即使沒有任何AI基礎的用戶也可以直接拿來用。

安裝

Windows系統的用戶有現成的exe文件安裝(地址見文末),不過現在仍處於Alpha階段,軟體可能存在一定的不穩定性。

其他平臺的用戶安裝起來也不複雜。

首先確保你的PyTorch版本不低於1.0.0,將項目克隆到本地:

gitclonehttps://github.com/baowenbo/DAIN.git

安裝PyTorch的各個擴展包:

cdDAINcdmy_package./build.sh

還要安裝英偉達預測光流網絡PWCNet的軟體包:

cd../PWCNet/correlation_package_pytorch1_0./build.sh

由於作者已經提供了預訓練模型,我們不必再花費大量精力去訓練。創建目錄model_weights,並且將預訓練模型的權重下載到相應的文件夾中:

cdmodel_weightswgethttp://vllab1.ucmerced.edu/~wenbobao/DAIN/best.pth

運行命令以下命令,就可以開始給視頻插幀啦!

CUDA_VISIBLE_DEVICES=0pythondemo_MiddleBury_slowmotion.py—netNameDAIN_slowmotion—time_step0.25

—time_step之後的參數就是視頻的放慢倍數,0.25代表視頻幀率擴展為原來的4倍。如果要生成8x和10x慢動作,參數就改成0.125和0.1,依此類推。

深度加光流,圖像更清晰

之前已經有很多給視頻插幀的算法,DAIN和它們有什麼不同呢?

DAIN的全稱是Depth-Aware Video Frame Interpolation,即深度感知視頻幀插值。

視頻幀插值的目的是在原始幀之間合成不存在的幀。但是由於大的物體運動或遮擋,插幀的質量通常會比較低。

在這篇研究中,研究人員提出了一種通過探索深度信息來檢測遮擋的方法。

具體來說,作者開發了一個深度感知光流投影層來合成中間流,中間流對較遠的對象進行採樣。此外,學習分層功能以從相鄰像素收集上下文信息。

上圖是DAIN的體系架構:給定兩個時刻的輸入幀,先估計光流和深度圖,然後使用建議的深度感知流投影層生成中間流。

然後,模型基於光流和局部插值內核對輸入幀、深度圖和上下文特徵進行扭曲,合成輸出幀。

這種模型緊湊、高效且完全可微分。定量和定性的結果表明,DAIN在各種數據集上均優於最新的幀插值方法。

作者

這篇文章的第一作者Bao Wenbo,是上海交通大學電子信息與電氣工程學院的博士生。

他目前的研究領域集中在圖像/視頻處理,計算機視覺和機器學習。另外在硬體設計、嵌入式系統和並行編程方面也很有經驗。

傳送門

論文地址:https://sites.google.com/view/wenbobao/dain

項目地址:https://github.com/baowenbo/DAIN

Windows版軟體下載:https://drive.google.com/file/d/1uuDkF4j4H1AI1ot88XdqzwMdvAPhxKN8/view

— 完 —

相關焦點

  • 如何用 60 幀播放 24 幀的視頻?
    這種 AI 補幀能夠實現遠勝於傳統運動補幀算出來的視頻效果,在上海交大開源的 DAIN(Depth-Aware Video Frame Interpolation) 插幀算法中,已經可以實現自動識別景深來輔助插幀,這樣幾乎完全解決了由於遮擋帶來的畫面 BUG。
  • 電影動漫60FPS的秘密,SVP視頻倍幀方案,縱享絲滑!
    前言幀率是畫面每秒鐘生成的數量,遊戲需要60幀已經是共識,超過60幀無意義,但144Hz顯示器、240Hz顯示器的出現卻又實實在在告訴我們,我們遠遠沒有觸及到眼睛幀率的上限。在這種情況下,我們的電影和動漫卻維持在25FPS左右,我們不斷告訴自己,電影幀連貫,不需要更高的幀率,這是臆想還是現實?其實我們只要用自己的眼睛去看一下就知道了。倍幀技術是利用計算機的強大性能,實時計算幀與幀之間的畫面,從而生成更多幀畫面,如果你學過FLASH,那麼這會很好理解。
  • NS也有60幀遊戲!10款為你帶來絲滑視覺體驗的作品!
    那麼本文就帶大家來看看,Switch那些有著60幀絲滑視覺體驗的遊戲~獵天使魔女1+2說到60幀,大家往往會想到動作遊戲。而NS上最著名的動作遊戲,莫過於魔女系列了。魔女1目前幾乎做到了全平臺,說實話PC和XBOX的體驗更勝一籌。
  • 看片要是搭配上這個軟體,就如德芙般絲滑
    一直一來我們都忽略了影片的幀率,目前電影大部分都是 24 幀,因為讀書那會書上就說了,這是人類能感知的最高幀率。 說到最後,電影採用 24Hz 是性價比最高的,畢竟幀率越高佔用硬體和軟體資源越多,製片方肯定選擇最省錢的方案。
  • 玩家將《血源詛咒》PS4 Pro解鎖60幀 效果絲滑順暢!
    FS社PS4獨佔大作《血源詛咒》受很多玩家喜愛,不過它的一大缺陷就是鎖30幀運行,即便在PS4 Pro增強模式下也是如此。而最近,一位名叫「Lance McDonald」的mod作者設法將《血源》幀率提高到了更順暢的60fps。
  • 絲滑流暢!MEMC到底是什麼黑科技?
    根據視頻效果來看,開啟MEMC的視頻的確要比正常的視頻畫面要順滑許多,肉眼可見的視頻幀數變化,換句話說那就是絲滑流暢。並且一加8系列的MEMC插幀技術,會覆蓋國內12 大主流視頻平臺和 12 款主流遊戲,包括海外主流平臺。(視頻平臺包含:Bilibili、騰訊視頻、騰訊體育、優酷、愛奇藝、YouTube、NETFLIX、prime video 等。
  • 抖音60幀高清剪輯教程來了,附4K電影資源網址
    我先來說教程啊,最後再留素材和資源網站 電影學院的應該都知道國際電影的幀數標準是23.976,因為這個數值人眼是正好識別的很流暢,所以說很少有電影會採用高幀數拍攝,那我們後期剪輯時候,素材本身不達標,如何做到高幀數呢,今天教大家常用的方法,一是PR自帶的光流法補幀,二是用插件補幀,這裡介紹了光流法
  • PC版《漫威復聯》B測演示截圖 1080p/60幀如絲順滑
    《漫威復仇者聯盟》PC版Beta測試目前正如火如荼地進行中,外媒IGN為玩家們分享了一段PC版Beta測試的實機演示,1080p/60幀的畫面表現如絲般順滑,一起來欣賞下。
  • 電影的24幀和遊戲的60幀有什麼區別
    因周星馳的《喜劇之王》這部電影,我們很多人都知道了電影一秒有24幀。但同樣是24幀,玩遊戲就會非常卡,這是為什麼呢?24幀的視頻,在跑步等快速動作時,如果你此時你按了暫停鍵,就會發現畫面是模糊的,再加上人眼有腦補的想像畫面,所以連續播放時,察覺不到卡的狀況。
  • 關鍵幀的介紹
    用專業術語來說,那關鍵幀就是指角色或者物體運動或變化中的關鍵動作所處的那一幀,屬於計算機動畫術語,相當於二維動畫中的原畫。 根據用途關鍵幀又可分為:普通關鍵幀(用於處理圖形圖像和動畫)、動作腳本關鍵幀(用於存放動作腳本,關鍵幀可以通過動作腳本控制flash影片和其中的影片剪輯)。
  • 120Hz屏幕一定絲滑流暢?沒有動態補償仍是個弟弟-120Hz屏幕,絲滑...
    MEMC技術能夠在傳統的兩幀圖像之間加插一幀運動補償幀,從而提高視頻幀率,達到更加流暢的顯示效果。電影是每秒二十四格的藝術,但也是有缺憾的技術平時我們玩遊戲,畫面至少需要達到30幀(最好60幀),才能使畫面流暢,就是兩個字——能玩。但對於電影而言,卻只需要24幀就能流暢播放,著實是一種神奇的藝術。其中的玄機在於電影拍攝錄製時的畫面是動態的,遊戲製作時每一幀畫面都是靜止不連續的。
  • 祖傳30幀的《血源:詛咒》,終於被玩家開發出了60幀補丁
    60幀的血源竟是如此美麗。《血源:詛咒》一直是PS4平臺上人氣最高的遊戲之一,亞楠曾讓無數玩家魂牽夢繞。但這款發售於2015年的遊戲,讓玩家們始終留有一個遺憾,就是遊戲畫面是鎖30幀的,用現代動作遊戲的標準看來實在不夠絲滑。
  • 「120幀」下的迷幻與真實
    炫目的「120幀」從最近幾部作品來看,李安有意在電影技術方面進行革新與探索。從《比利·林恩》開始,李安便開始嘗試採用120幀的新技術,而且這次的《雙子殺手》依然以此為不小的賣點。那麼到底什麼是「120幀」呢?電影的幀數,就是畫面數。大家所熟悉的24幀電影,就是每秒有24格畫面在人眼前放映,由於視覺的停留效果,形成了連續動作的影像。
  • 120幀《大鬧天宮》來了,它會成為動畫電影未來嗎?
    2分鐘相當於20分鐘的工作量如今,電影通行採用的是24幀,即每秒24幅畫面,這是利用人類視覺暫留功能不斷實驗發現的結果。120幀概念的聞名,始於李安的《比利·林恩的中場戰事》。它把人眼辨識度單位時間細分到更小,不僅大大增加清晰度,也帶來電影製作上的革命。
  • 【PR教程】多種方法補幀成60幀及解決補幀中的果凍效應
    我們經常可以看到一些藍光畫質的60幀視頻。畫質之細膩,清晰,流暢讓人耳目一新。但是實際上現在的電影大多都是23.976幀。而頭條上的60幀視頻都是經過後期加工而成。這裡我將介紹一下如果補幀。
  • 原來120幀《大鬧天宮》是這麼做的!
    120幀的動畫幀數變多,帶來的創作空間也變大,畫面更清晰,細節更豐富,動作更流暢,畫面更具感染力。除了畫面外,作品對配樂也重新編排,保留經典的同時又有一定變化,帶來一些新感覺。「120幀的《大鬧天宮》並不是把影片簡單重複做,動作、表情的表現相比原來都有提升,這些提升又是跟對動畫理念的新理解聯繫在一起,並建立在尊重原作品的基礎上。」王華強說。
  • 120Hz屏幕一定絲滑流暢?沒有動態補償仍是個弟弟
    4月2日,一加也在官方微博展宣布一加8系列新品將搭載的MEMC插幀技術,開啟高幀生態元年。120Hz屏幕才剛火起來,現在又來一個運動補償技術,小朋友,你是不是有很多問號?而關於24幀討論最熱烈的,是「電影是每秒二十四格的藝術」。雖然24幀的電影會擁有獨特的「電影感」,但實際上也是有缺點的,特別是從場景的快速切換和動作表現上來講,24幀的電影會給我們一種拖影感,就是不夠流暢,所以高幀遊戲的畫面的流暢度會遠遠好於24幀的電影畫面。說的通俗點,一分鐘展現的畫面幀數越多、畫面越清晰,就會讓人感覺更流暢、看得更清楚。
  • 元氣騎士2021春節更新內容:春節皮膚特效4幀變8幀圖片一覽
    2021春節更新內容:第00篇元氣騎士2021春節更新內容爆料第一彈公布,官方近日放出了【春節預告】第00篇,為大家預告了春節版本中各類皮膚全面更新升級的消息,4幀變8幀動畫即將實裝!一起來了解下元氣騎士2021春節更新爆料詳情吧。
  • ​卷積神經網絡與Transformer結合,東南大學提出視頻幀合成新架構
    ConvTransformer 使用基於多頭卷積自注意力層的編碼器將輸入序列映射到特徵圖序列,然後使用另一個包含多頭卷積自注意層的深度網絡從特徵圖序列中對目標合成幀進行解碼。在實驗階段的未來幀推斷任務中,ConvTransformer 推斷出的未來幀質量媲美當前的 SOTA 算法。研究者稱這是 ConvTransformer 架構首次被提出,並應用於視頻幀合成。