告別AV畫質:實時把動畫變成4k高清,延時僅3毫秒,登上GitHub趨勢榜

2021-02-14 量子位
慄子 發自 凹非寺 
量子位 出品 | 公眾號 QbitAI

看動畫 (特別是裡番) 的時候,總會覺得畫質不夠好,就算已經有1080p,還是會感到不夠清晰。

所以,這個世界十分需要一套拯救解析度的魔法。

如今,有個名叫Anime4K的開源算法,能在動畫播放中,實時把畫面變成4k,延時低至3毫秒

能把720p/1080p變成2160p,也能把480p變成1080p。

團隊說,這是當下最強 (State-of-the-Art) 的動畫實時超解析度方法,可以拿任何程式語言實現。

現在,項目已經在GitHub摘下3700多顆星,並一度登上了趨勢榜。

那麼,這個算法究竟是如何造福人類的?

只搞動畫

團隊在論文裡感慨道:

傳統超解析度算法 (如Bicubic) ,結果不怎麼好,因為它們根本不是為了動畫而生的。

傳統的去模糊 (Unblurring) 或銳化 (Sharpening) 方式,在靠近物體邊緣的時候會發生過衝 (Overshoot) ,分散觀眾注意力,降低圖像的感知質量 (Perceptual Quality) 。

而機器學習方法 (如waifu2x) 又太慢,完全不能實時 (<30毫秒) ,尤其是需要超高清的時候。

 waifu2x

而Anime4K,只處理動畫就夠了,不考慮其他視頻類型。這一點很重要。

動畫沒有真實視頻那麼多紋理 (Textures) ,基本都是用平直著色法 (Flat Shading) 處理的物體和線條。

只要畫質變好一點點,觀眾也看得出。所以團隊機智地想到,不用做整張的畫質提升,專注於細化邊緣就可以了,紋理之類的細節不重要。

具體怎樣做,要從超解析度的原理開始講:

首先,一張圖可以分為兩部分:

一是低頻分量,就是一張模糊的低解析度圖。

二是高頻殘差,代表兩種解析度之間的差別 (Difference) 。

輸入一張低清圖,把它變成一個更低清的版本,就能得出一個殘差

把殘差變薄 (Thin) 、銳化 (Sharpen) ,再加到低清圖上,就能得到一張高清圖。

但殘差稍稍有點錯誤,就會造成振鈴過衝,影響效果。這也是前輩的缺陷所在。

於是,團隊找到了一種新方法:

首先把殘差厚度最小化當做目標,這個沒有問題。

但直接把隨意變換(Arbitrarily Transformed)得到的殘差,用到一張低清圖上是不行的。低清圖要做出相應改變,才能與殘差和平相處,得出理想的超解析度結果。

所以,當輸入一張圖和它的殘差之後,「push」殘差的像素,讓殘差線變細;

同時,每做一個push,都要在彩色的低清圖上,執行一個相同的操作。

這樣,既能把模糊最小化,也不會出現振鈴和過衝,這兩個降低畫質的現象。

比一比吧

這場比賽,Anime4K (最右) 的對手有:來自madVR的不開源算法NGU前輩 (左二) ,以及開源的機器學習算法waifu2x前輩 (左三) 。

第一題,眼睛:

第二題,耳朵:

第三題,玉手:

第四題,全臉:

waifu2x前輩的效果,明顯不及Anime4K,常見虛影。速度也有明顯缺陷,每張圖耗時超過1秒。

NGU前輩生成的畫質,與Anime4K相近,但也常常被Anime4K打敗。

不止如此,NGU每張耗時~6毫秒,Anime4K只要~3毫秒,快了一倍,更加適應實時生成的需求了。

效果相近的話,為啥不直接用NGU?因為不開源。

如果,你覺得720p/1080p的動畫,沒必要變成4K這麼奢侈,那還可以把480p拯救到1080p啊:

依然,Anime4K和沒開源的NGU不相上下。

最後,儘管已經獲得了精湛的畫質提升技能,團隊也沒有就此拋棄機器學習的力量。

因為在拯救靜止畫作 (而非動畫) 的時候,Anime4K的短板顯現了。這時候,讓機器學習選手waifu2x和它並肩作戰,更加成功一些:

需要實時提升解析度,還是用Anime4K吧。

反正也已經開源了:

項目傳送門:
https://github.com/bloc97/Anime4K

論文傳送門:
https://github.com/bloc97/Anime4K/blob/master/Preprint.md

量子位MEET 2020智能未來大會啟幕,將攜手優秀AI企業、傑出科研人員呈現一場高質量行業盛會!詳情可點擊圖片:


2019中國人工智慧年度評選啟幕,將評選領航企業、商業突破人物、最具創新力產品3大獎項,並於MEET 2020大會揭榜,歡迎優秀的AI公司掃碼報名!

相關焦點

  • Python自動搶票神器,GitHub熱榜第一!
    順便把一個Python搶票工具,送到了GitHub趨勢榜第一:項目名很乾脆,就是「12306」,標星超過8.4k,來自名叫文賢平的程式設計師。這很可能是全GitHub最德高望重的購票小助手了,功能一直在更新,且現已支持Python 3.6以上版本。有些後起之秀,也是在它的基礎上開發出來,然後廣受歡迎:
  • 4K畫質!《生化危機3:重製版》免費試玩
    《生化危機3:重製版》將於4月3日推出,為了吸引更多的玩家,遊戲的Demo試玩版已可以免費下載遊玩。    現在,有外媒提前放出了《生化危機3:重製版》4k/Max設置下的高清截圖,其中遊戲用RE引擎,畫面看起來比《生化危機2:重製版》更優秀。人物模型精美細緻,吉兒顯得非常幹練。
  • 4K畫質升級,正為B站帶來哪些改變?
    升級4K畫質後,更豐富的色彩,更清晰的畫面,更具質感的光影變幻,都讓這場視覺盛宴上升到新高度。這是技術與內容互相賦能後的結果。早在4月,B站宣布啟動4K畫質升級,並推出4K超高清創作者招募計劃。面向大會員用戶開放,如今已獲得有效回應,用戶在站內搜索4K,即可看到不少UP主們的4K內容投稿。與此同時,B站也推出了部分4K畫質的版權內容,供用戶選擇。
  • 《敦刻爾克》:見識一下最強的4K畫質 - #每周4K-UHD電影點評#2018.1.18
    特別推薦最後一段」夜色歸來「,既有夜幕中登上碼頭的場景,那燈光、色調、質感和純淨的夜景畫面,沒治了;以及船隻在海中迎向夕陽航行的「HDR」場景。喜愛收藏的朋友們也可以點擊最後的UHD原盤種子。(2016)4K類型:假4KHDR類型:HDR-10 音軌: DTS-HD Master Audio畫質/音質評分: 9/7點評:被譽為畫面最美的動畫影片,但可惜的它是一部假4K影片,為什麼?要問新海誠為什麼了。可能目前大部分動畫片的水準就是2K吧。
  • Unity首次公開實時數字人類短片《異教徒》:電影大片般逼真
    全球領先的實時3D內容創作平臺Unity今日宣布,最新編輯器版本Unity 2019.3現已正式上線,同時發布了3D動畫短片《異教徒》(The Heretic)的完整版,首次對外公開展示其實時數字人類技術(Digital Human)。
  • 4K電視達不到4K畫質或與HDMI線有關
    如果你不清楚或不知道,沒關係,今天跟著小編帶你進入4K高清世界。        電視在我們生活中扮演著不可取代的角色,所以很多人是非常看重電視解析度,越高清越好;隨著技術的不斷提升,4K電視逐漸進入人們的視野;當有的人連接好新買的4K電視後,畫面出現的瞬間就傻眼了,因為畫質遠遠達不到4K,這是為什麼呢?
  • 4K片源獲取的方法和渠道,你會選哪個4K片源?
    今天我們就來聊聊4k片源的獲取方法和渠道?在了解4k片源之前,你必須要知道?影響畫質品質的原因是什麼?碼流?碼流?還是碼流?重要的事情說三遍。務必記住了。碼流是什麼?碼流是指視頻文件在單位時間內使用的數據流量,也叫碼率和碼流率,是視頻編碼中畫面質量控制中最重要的部分。一般我們用的單位是KB/S或者MB/S。
  • B站的4k想像力
    從2017年中旬開始,影視颶風所有更新的視頻都保留了一份4K版本(包含所有MG動畫,在製作的時候就是4K的工程),他們並計劃在接下來的一個月裡,把所有的視頻都換源成4k重置版。 5月28日,B站4k解析度投稿權益面向所有UP主開放,並以25萬獎金徵集優質4k內容。
  • 保姆級教程 | 如何製作一段高質量的延時攝影視頻
    至於畫質,從前期拍攝到後期處理,延時攝影的流程是比較複雜的,只有在每一步中儘量避免上一步的數據被壓縮,才能在最終的觀看端呈現給大家一個畫質細膩的作品。如何獲得高畫質是這篇文章主要想探討的問題,下文會詳細說明。
  • GitHub中文趨勢榜第一!「2020新冠肺炎記憶」項目已獲4.9K星標
    這兩天,又一個關於新冠肺炎的 GitHub 登上了中文趨勢榜的首位,截至目前,已經收穫近 5K Star,600+ Fork。項目介紹nCovMemory 項目的中文名稱是「2020新冠肺炎記憶:報導、非虛構與個人敘述」,創立該項目的目的是為研究人士提供方便自然語言處理、疫情防治取用相關資料的資料庫。
  • ​STM32延時函數的四種方法
    ,最常用的莫過於微秒級延時delay_us()和毫秒級delay_ms()。本文基於STM32F207介紹4種不同方式實現的延時函數。這種延時方式應該是大家在51單片機時候,接觸最早的延時函數。這個比較簡單,讓單片機做一些無關緊要的工作來打發時間,經常用循環來實現,在某些編譯器下,代碼會被優化,導致精度較低,用於一般的延時,對精度不敏感的應用場景中。
  • FEELWORLD 200米SDI/HDMI 高清無線圖傳 無壓縮無延時
    廣泛應用於電影拍攝、無線攝錄、影視監看、運動賽事、婚慶直播、活動直播、會議直播和商業秀等場合;真正實現高清無線直播、移動實時直播、多點無線直播、遠距離監看。,最大距離200米,傳輸延時≤1毫秒。SDI/HDMI無壓縮傳輸,傳輸延時≤1毫秒 採用高級別無線通信技術,實現廣播級無損耗、無壓縮的1080p全高清信號傳輸,內嵌同步音頻信號,廣播級畫面呈現。高帶寬無壓縮的傳送,保證了畫面的真實。
  • 《巫師3》高清Mod9月登場 4K級別的畫質
    國外Mod作者Halk Hogan PL最近放出關於《巫師3》高清Mod V12版與原版的新對比視頻,展示了兩者之間差異。
  • 怎樣讓遊戲動畫呈現電影級的畫質?Unity技術美術總監談實時渲染的應用
    在江毅冰看來:實時渲染將會取代傳統的動畫渲染,實時渲染技術在材質、燈光等方面大幅度減少了渲染消耗時間,從而可以使得創作者將精力聚集在製作漂亮的畫面上。藝術指導可以在第一時間看到成品,更容易更改畫面。對於動畫的製作方來說,實時渲染減少了對人員、時間的消耗,從而大量減少了開支。
  • 70邁4K智能行車記錄儀上架:前後雙錄 標配電子狗
    70邁4K智能行車記錄儀採用索尼IMX415傳感器,擁有1/2.8英寸星光夜視級傳感器,可拍攝4K超高清畫質,解析度3840x2160。它支持前4k後1080P雙錄功能,前後隨心切換。3英寸IPS高清屏,實時查看前後狀態。
  • GitHub很香,被中文霸榜了,但是...
    「雖然大多數讀者可能不需要這個免責聲明,但我仍然覺得有必要添加它以確保避免任何誤解:我不反對非英語 repo,不說英語的人也可以在 Trending(趨勢)頁面中佔有一席之地,我認為這是一件好事。英語也不是我的母語,而且我以前剛開始的時候用的也是我自己語言的資源。本文的目的是指出 Trending 頁面中的用戶體驗設計缺陷,Github 應該對此進行修正。」
  • 高清無碼,歐美日韓,4K看片!
    軟體的整體頁面是非常簡潔的,無論是在播放過程還是界面均沒有任何的廣告植入,至於後期會不會不好說,畢竟開發者也是需要恰飯的,不能光用愛發電。首頁這裡就是一些熱門的影視劇推薦,一些平臺熱播的電視劇在這都能看,甚至一些需要付費的這裡也能免費看。使用方法很簡單,下載我提供的安裝包到電腦桌面,然後解壓文件,找到exe直接安裝即可,軟體默認是C盤,這裡建議大家更改到別的盤,然後點擊安裝即可。
  • 微贊直播「黑科技」,極致低延時觀看體驗
    毫秒級低延時,微贊超低延時為直播賦能直播是基於視頻的即時、多向的互動,最大化真實還原人與人的線下互動場景。微贊這一套方案正好彌補了這一市場空白,微贊的超低延時直播則極大降低了基於微信h5直播的時差感,從3秒的延時優化到毫秒級的超低延時直播,用戶基本對現場延時沒有觀感。
  • 下載1G高清電影只需3秒 感受5G時代給我們帶來的便利
    下載1G的高清電影,通過5G網絡需要多長時間?答案是:3秒,比4G網絡提高10倍。「快只是5G網絡肉眼可見的第一直觀感受,但快並非5G網絡唯一要義。」劉磊解釋,以連接密度為例,5G可以達到100萬個/平方公裡,這是4G無法企及的。再看時延,5G可以達到毫秒級,僅是4G的十分之一。以我們的大腦發出指令到肢體做出反應為例,大概需要20毫秒到30毫秒,而5G的延時響應時間可以達到1毫秒。
  • 4K HDR2技術,超高清畫質?
    4K HDR2技術,超高清畫質鮮豔明亮的色彩總是能引起人們的注意,可電視的畫面太過豔麗,看電影時總覺得不自然,可能還會刺激到視覺神經。而這款KKTV U65V5T智能電視就採用了4K HDR2技術,在很大程度上提高了色彩的表現力,準確地色相和接近自然的色彩,讓我在觀看電影的時候,感到更加的舒適哦。