高糊視頻秒變4K,Facebook發布低解析度視頻實時渲染算法

2020-12-16 澎湃新聞

賈浩楠 發自 凹非寺

量子位 報導 | 公眾號 QbitAI

還記得那個引來巨大爭議,最後把LeCun逼退推特的低解析度圖像還原算法PULSE嗎?

PULSE是針對低解析度圖像進行還原的,而就在PULSE問世不久後,一個針對模糊視頻進行實時高解析度渲染的算法問世了。

前幾天,Facebook公布了一項在即將舉行的SIGGRAPH 2020會議上展示的新論文,提出了一種新的神經網絡算法神經超採樣。

新算法實現了低解析度視頻的4*4的實時渲染,也就是說能把大部分視頻解析度提升16倍,直接變成4K視頻!

而1080p的視頻渲染延遲更是控制到24.4ms!

除了超低延遲,這種算法的巨大進步在於擺脫了特定硬體和技術的束縛(如虛幻引擎的TAAU和英偉達的DSSL),在PC上就可以實現。

高糊騎兵視頻馬上變4K!

話不多說,直接上實時渲染效果實測。

下圖由上至下,分別是低解析度輸入視頻、神經超採樣算法(解析度提高16倍)渲染結果、離線渲染目標視頻截圖。

可以看出,「神經超採樣」算法的實時渲染輸出,視頻細節的精度已經高度接近目標渲染視頻。

這樣的優秀表現引來網友一片驚嘆,儘管Facebook方面認為這項技術未來主要用於遊戲開發和實時VR技術,但網友們紛紛喊話FB,希望看到這項技術用在早年的3D遊戲重置上,比如三角洲部隊、放逐等等。

儘管有些遊戲已經有了重製版,但這個算法可以實現自動渲染,極大提升效率。

那麼,這種高性能的實時渲染算法到底怎麼實現的呢?

秒變4K是如何實現的

神經超採樣實時渲染(Neural-Supersampling for realtime rendering)算法構造主要有4個不同功能模塊。

首先是特徵提取模塊,包含3層卷積神經網絡。這個子網絡單獨處理每個輸入幀, 並在除當前幀外的所有幀中共享權重。

對於每一幀,特徵提取模塊將顏色和深度作為輸入,並生成8個通道的學習特徵,然後與輸入的顏色和深度進行連接,從而獲得總共12個通道的特徵。網絡如下圖表示。

其次,為了降低重建網絡的複雜性,算法應用了時空重投影,通過使用渲染的運動矢量,將前一幀的像素樣本和學習的特徵投射到當前。

為了充分利用低層像素後向運動矢量,需要在目標(高)解析度空間進行時空重投影。首先,將輸入(低)解析度空間的像素樣本投影到高解析度空間,採用零上採樣的方式,即把每個輸入像素分配到其對應的高解析度像素上,並將其周圍所有缺失的像素作為零。

每個輸入像素的位置平均落在高解析度中的��像素之間,其中��為上採樣比。之所以選擇零上採樣,一是為了提高效率,二是為了給網絡提供哪些樣本有效或無效的信息。

然後,利用運動矢量的片狀平滑特性,簡單地通過雙線性上採樣將渲染的低解析度運動矢量圖調整為高解析度。雖然這種簡單的方法會給上採樣的運動矢量帶來誤差,但能夠通過這種方法實現對運動矢量的控制。

接下來,進行無採樣前幀的後向扭曲,這一步驟使用了向上採樣向量,對前一幀進行零向上採樣。在翹曲過程中則採用雙線插值。

第三部分是特徵重新加權。

渲染的運動矢量不反映動態不協調或陰影幀之間的變化。因此,扭曲的幀會包含偽影,如在遮擋區域的陰影和在不一致的陰影區域不匹配的像素。

為了解決這個問題,研究人員引入了一個特徵重新加權方法模塊,以屏蔽掉這些不匹配的樣本。

特徵重新加權模塊是一個3層卷積神經網絡。它將當前幀的零上採樣的RGB-D、零上採樣、扭曲的前一幀同時作為輸入,為之前的每一幀生成一個像素加權圖,權重值在0到10之間,其中10是一個超參數。

超參數的設置是為了讓學習到的地圖不僅能衰減,而且還能也會放大每個像素的特徵。

最後將每個加權圖乘以對應前一幀的所有特徵。

第四部分是重建,將當前幀的特徵和重新加權的先前幀的特徵連接起來,並反饋給重建網絡,該網絡會輸出恢復的高解析度圖像。重建子模塊採用3級、10層的U-Net,並帶有跳過連接。

實驗結果

團隊的實驗條件是英偉達Titan V卡,並使用了Nvidia TensorRT對算法進行了16bit優化。

下圖是算法渲染不同解析度視頻所需的運行時間(提升16倍解析度),單位為ms。其中Ours為基礎算法,Ours-Fast是經過簡化的快速版本。

這張表表示的是渲染目標為1080p解析度時,算法不同步驟的運算時間。

與現行的同功能算法相比,4*4超神經採樣算法在各個指標都領先。這些結果是在常用的4個視頻上經過10次測試得出的。

網友吐槽:不能在通用CPU上運行的實時都不叫實時

儘管4*4超神經採樣算法在低解析度視頻實時渲染上有很好的表現,而Facebook官方也宣稱這個算法突破了特殊硬體和技術的限制,在PC上就能運行。

但網友們依然吐槽,要達到實驗結果展示的「實時」渲染表現,一塊英偉達Titan V是必須的。

而現在一塊Titan V官方售價3000美元左右,經過不同廠商優化過的,更是價格高昂。

難道「實時」只是有錢人的特權嗎?

Reddit網友呼籲,應該建立一個標準,只有在通用CPU上能實現到實時的,才能叫真實時。

那麼,你認為這個實時渲染高解析度算法的價值有多少呢?你願意付出一塊Titan V的成本來實現這一算法嗎?

論文地址

https://research.fb.com/publications/neural-supersampling-for-real-time-rendering/

成果演示

https://research.fb.com/blog/2020/07/introducing-neural-supersampling-for-real-time-rendering/

本文系網易新聞•網易號特色內容激勵計劃籤約帳號【量子位】原創內容,未經帳號授權,禁止隨意轉載。

— 完 —

原標題:《高糊視頻秒變4K!Facebook發布低解析度視頻實時渲染算法,網友:是好東西,但是玩不起》

閱讀原文

相關焦點

  • 單塊GPU實現4K每秒30幀,實時視頻摳圖再升級,毛髮細節到位
    今年 4 月份,華盛頓大學研究者提出了 background matting 方法,不在綠幕前拍攝也能完美轉換視頻背景,讓整個世界都變成你的綠幕。但是,這項研究無法實現實時運行,只能以低幀率處理低解析度下(512×512)的背景替換,有很多需要改進的地方。
  • 單塊GPU實現4K每秒30幀,實時視頻摳圖再升級毛髮細節到位
    實時運行、使用單塊英偉達 RTX 2080 TI GPU 即可以實現 HD 60fps 和 4K 30fps 的速度,那個「讓整個世界都變成你的綠幕」的摳圖方法 Background Matting 發布了 2.0 版本,為用戶提供了更自然更快速的實時背景替換效果。
  • 推薦14款最佳視頻編輯軟體,讓你秒變視頻達人,分享精彩視頻!
    由於 ProRes 文件導出時採用了經過渲染的特效文件,因此無需重複渲染,導出媒體素材就如同拷貝文件一樣快速。03. Adobe Premiere Elements 2019軟體平臺: Windows、Mac | 免費試用:30天優點:簡單易學;視頻穩定、人臉檢測、自動運動跟蹤功能。缺點:功能不夠強大;視頻編輯速度慢。
  • 也想後期剪輯視頻!
    廣播級的硬體板卡加上獨有的gv hqx(10bit)和hq編碼(支持4k和hd),保證在整個編輯製作流程中擁有廣播級的質量和優異的性能。在同一工程內混編各種格式,各種解析度的視頻素材系統具有無與倫比的實時視頻轉碼技術,可實現高清與標清的不同解析度、不同寬高比和幀速率的任意實時變換。
  • 4k解析度是噱頭?2k解析度足夠人眼觀看?索尼xzp使用報告交給你
    三、4K解析度屏幕XZP是索尼的第二款4k屏手機。在索尼之前,從沒有手機廠商在一塊5.5英寸的LCD屏幕下塞下如此多的像素。因此XZP這塊屏幕參數無非是非常強勁的,4k,HDR,801ppi,TRILUMINOSTM移動顯示技術,X-RealityTM 移動圖像引擎,動態對比度增強,sRGB色域是標準視頻(SDR)的138%等等,這些諸多的黑科技,共同造就了這塊在手機領域我願稱之為「最強」的LCD屏幕。
  • 唯一的4K解析度手機,索尼XperiaZ5,為啥只有索尼發布過4K手機?
    目前大部分手機的主流解析度都基本為全高清屏幕,也就是2K屏幕,屏幕解析度的密度都在四百多ppi左右,而之前索尼發布過一部4K解析度屏幕的手機索尼Xperia Z5 Premium,這部手機可以說相比當時的手機屏幕解析度跨越了一個境界,就好比幾百萬像素攝像頭和上千萬像素攝像頭的區別,
  • 不用花錢買PR,創意音視頻軟體還能選什麼?
    它支持整個3D管道-建模,裝配,動畫,模擬,渲染,合成和運動跟蹤,視頻編輯和2D動畫管道。支持實時預覽 ·CPU和GPU渲染 ·PBR著色器和HDR照明支持 ·VR渲染支持音頻處理Audacity這是一款跨平臺音頻編輯軟體,支持
  • 高畫質和4K視頻兼顧 尼康Z6全畫幅微單相機
    尼康Z6擁有小巧的機身設計,同時提供良好的高感光度性能和視頻功能,具有約2,450萬有效像素,可在多種場景拍攝中大顯身手。憑藉EXPEED 6影像處理器,ISO常用感光度範圍100-51200,即使在高感光度下也能有效降低噪點,同時保持解析度。目前在京東商城上,尼康Z6的價格已經來到了11899元的位置。
  • 8K,4倍4k的解析度
    5G對我們生活的改變方方面面,從上網到看視頻,日常生活到處已經都是5G的影子了。與此同時,與5G有著異曲同工之妙的8K也已經開啟了首批產品的面世,歷史悠久的傳奇音響大廠天龍馬蘭士帶來了首批8k影音設備。什麼是8k?8k大家可能都很陌生,但是4k我相信大家已經耳熟能詳了。8k和4k一樣都是指解析度,但是8k解析度是4k的4倍。
  • 影史第一片《火車進站》秒變 4K 高清,AI 預測 + 插值,黑白也能變...
    來源:雷鋒網 作者:蔣寶尚最近,國外一個 YouTuber 發布了通過神經網絡增強的 1895 年拍攝的紀錄片《火車進站》,整部電影只有 45 秒長度,由路易 · 盧米埃和奧古斯特 · 盧米埃拍攝於法國一沿海城市。
  • 4K視頻剪輯特效合成調色完美硬體配置方案
    14K視頻編輯硬體配置要求分析  4K視頻時代到來,對影視後期製作的各個環節(如視頻剪輯、特效合成、視頻調色、視頻輸出等),要求計算設備具備海量存儲、多層視頻並發讀寫、多層實時預覽視頻計算、超高速計算的視頻渲染輸出能力,常規圖形工作站的硬體配置不藉助其他手段幾乎不能勝任,目前解決辦法通過壓縮方式或軟體方式大幅降低各個環節計算規模實現,另外各類專業後期軟體廠家發展和升級換代
  • 4K高清視頻錄製 體驗榮耀30S:年輕人的vlog神器
    在發力智慧型手機拍照之後,榮耀又把視頻拍攝提升到拍照一樣重要的地位上來,近期新上市的榮耀30S後置影像功能上支持拍攝4K 30fps解析度的視頻。同時超級慢動作等一系列新功能也都有加入。——4K視頻錄製1080P也稱全高清,具體為1920x1080p,4K即3840×2160,解析度是1080p的4倍,也就是1920×2×1080×2。錄製視頻後,如果在解析度超過1920x1080的設備上播放,4k視頻畫質明顯會優於1080P。
  • Premiere Pro視頻製作, Laptop各參數配置推薦
    1、主頻:對於PR剪輯來說,選擇一個高頻率的CPU至關重要,一般查看CPU的主頻,至少2.0Ghz以上,睿頻至少4.4ghz以上,因為頻率影響到實時預覽速度。尤其是剪輯4k以上高清素材、以及複雜轉場、複雜特效的實時預覽,高頻率的CPU的運算效果更加明顯。
  • 我什麼都沒做,文章就自動變成了視頻?AI神器解放視頻編輯
    而圖像方面,原文中的圖片肯定是不太夠的,需要再搜尋更多視頻和圖片素材。素材的來源可以是視頻編輯自己的素材庫,也可以直接實時的用百度搜索來找素材。找到素材後,需要藉助人臉識別、物體識別、OCR、視頻內容理解等技術來解析理解視頻素材的內容,自動剪切選取合適的片段。有了視頻素材和解說詞音頻文件,需要把兩者合二為一。
  • 騰訊雲全新發布音視頻技術產品,助力各行業智能化發展
    首先,騰訊雲發布了自研編碼器「瑤池V500」和音頻技術方案「騰訊天籟」,為提升音視頻通信質量輸出能力;其次,針對融合通信,騰訊雲發布了TRTC在金融及IOT領域的方案,超低延遲「快直播」產品結束公測,正式規模商用;另外,在內容生產方面,騰訊雲進一步升級多模態內容製作能力,發布AI媒體內容生產平臺智媒,「騰訊雲製作」方案在業務能力、素材模版資源及渠道發布能力方面全面升級;最後,「騰訊臨境
  • 虛幻4 引擎發布新的實時演示視頻,確認不支持 Wii U
    虛幻 4 引擎發布新的實時演示視頻,確認不支持 Wii U 在正在召開的 GDC 遊戲開發者大會上,Engadget 與 Epic Game 的高級副總裁 Mark Rein 進行了對話
  • 什麼軟體可以把視頻壓縮變小?熱門視頻壓縮軟體推薦
    一些網友會將拍攝的視頻上傳到一些視頻網站上,但是,有時候會遇到視頻文件太大、視頻上傳不成功的情況,那麼,什麼軟體可以把視頻壓縮變小?下面,給大家推薦幾款熱門視頻壓縮軟體,大家可以根據使用需求來選擇!一、格式工廠格式工廠把視頻壓縮變小的教程:啟動格式工廠,在任務分類中選擇「視頻」,選擇一個輸出格式(例如,MP4),在「輸出配置」這裡,可以設置視頻編碼、屏幕大小(解析度)、比特率(碼率)等參數,這些參數決定了視頻文件的大小。視頻編碼,推薦使用AVC(H264)。
  • 七彩虹發布設計師PC ProMaster H1:1秒輸出光追效果
    傲騰加速技術,並與知名渲染軟體D5 Render深度合作優化。利用NVIDIA RTX GPU以及專為創意工作流程的優化設計和測試,它可以支持8K超高清解析度的視頻、實時光線追蹤、AI輔助功能。比如使用RTX 2070 Super,實測在D5 Render中對建模文檔進行渲染、完成天光等效果調整,1080p解析度預覽過程僅需1-2秒即可成型,4K解析度輸出成品圖也只需要約30s,而且光線追蹤的軟陰影及材質反射效果、最終輸出的噪點控制都優於現有渲染軟體。
  • 惠普ENVY 15 RTX Studio設計本評測:高性能+4K屏,內容創作者的...
    這是一款4K解析度的AMOLED顯示屏,解析度足夠高的同時,由於採用了OLED屏幕,它的對比度以及色域覆蓋上表現更出色。官方宣稱,這塊屏幕能達到100000:1的對比度,以及100% DCI-P3色域覆蓋。
  • 甩筆機器人獲IROS 2020最佳論文獎;UW實時高解析度背景摳圖
    今年 4 月份,華盛頓大學研究者提出了 background matting 方法,不在綠幕前拍攝也能完美轉換視頻背景,讓整個世界都變成你的綠幕。但是,這項研究無法實現實時運行,只能以低幀率處理低解析度下(512×512)的背景替換,有很多需要改進的地方。