老北京生活影像和3D AI主播為什麼在2020年火爆全網?

2020-12-22 雷鋒網

AI給我們的生活帶來了許多樂趣,從AI美顏到AI變臉,再到今年火爆全網的AI修復1929年老北京生活的3分鐘影像資料和全球首個3D版AI合成主播。這些新鮮有趣的應用為什麼在2020年火爆全網?背後推動力是什麼?

火爆B站的AI修復老北京影像--盲人"爵士"樂隊

全球首個3D版AI合成主播新小微,圖片來自新華社

北京國際廣播電影電視展覽會(BIRTV)2020期間的一場媒體活動上,NVIDIA專業可視化亞太區業務主管沈威表示,傳統「離線式」渲染、預錄式的內容無法加入更多互動和特效的直播視頻內容已經不能夠滿足當前廣播電視行業的需求,尤其是當下的AI時代。利用NVIDA GPU的實時光線追蹤技術及深度學習技術,可以為廣播電影電視行業帶來更多不一樣的體驗。

AI帶給廣電行業的兩大變革

修復老北京生活影像和3D AI主播恰好代表了AI給廣播電影電視行業帶來的兩個變革——對過去缺損畫面、素材殘缺像素的「無中生有」,以及實時渲染帶來的更強互動性。

NVIDIA 中國區高級技術市場經理施澄秋表示:「我們看到廣電行業的趨勢是從OTT(流媒體服務)向SVOD(視頻點播)過渡,並且市場也在蓬勃壯大。在這個增長過程中,要麼內容極劇爆炸、要麼讓老影片有更高解析度。」

GPU「無中生有」修復過去

7月份火遍全網的1929年的老北京生活視頻,不僅用AI對視頻進行上色、補幀、提升了解析度,還通過時代原聲還原了老北京味。這個視頻的火爆離不開新的AI算法DeepRemaster,當然也需要有強大硬體作為支撐。

為圖像處理而生的GPU是不二的選擇。據悉,NVIDIA有一項叫做NGX的技術,先用像DeepRemaster這樣自動完成畫面修補、美化和降噪的AI算法對GPU進行訓練,然後NGX就能「無中生有」來做畫面插幀、超級解析度、慢動作等。

施澄秋對雷鋒網表示,對於插幀而言,如果用傳統的人工方式來做,一天只能做2-3幀,藉助基於GPU的AI技術後,一天的插幀和修復可以達到百萬幀級別,這是一個巨大的效率提升。

AI插幀還能在大幅縮短周期的同時實現更好效果。施澄秋以很多電影中都有千軍萬馬的場面舉例,如果用一匹馬複製,不僅呆板而且運動軌跡都一樣。但用人工的方式周期長且成本高,藉助NGX技術,就可以得到形態各異的馬。

AI插幀能讓老視頻有更好的流暢度,達到1080P甚至4K、8K。藉助AI插幀和著色技術,還能夠實現超級慢動作。超級慢動作是用超高幀率的攝像機(120楨/秒、240楨/秒)拍攝視頻,然後再以低幀率(30楨/秒、40楨/秒)播放。

但很多素材比如用手機拍攝的突發新聞本身就只有30楨/秒的幀率,如果做慢動作就會像放幻燈片一樣卡頓。利用NVIDIA NGX的「無中生有」技術生成幀間像素,就可以得到非常平滑逼真的慢動作。

幀率決定著視頻的流暢度,解析度更直接的影響著觀感。「SUPER-RES(超級解析度)不是新概念,以前要實現SUPER-RES可能需要非常昂貴的硬體,且製作周期非常長,現在利用我們的NGX AI技術就可以做實時4K解析度的超級解析度。」 施澄秋表示。

那效果如何?當虹科技就基於NVIDIA圖靈(Turing)架構GPU推出了離線超級解析度產品,支持標清轉高清/4K、高清轉4K/8K等。藉助AI算法訓練高頻細節,實現高保真縮放。

當虹科技AI超分技術

還有強氧科技的DaVinci Resolve,這是一款融合了專業8K剪輯、調色、視覺特效和音頻後期製作工具。能夠通過插補幀做慢動作,驚豔的自動調色,也能做匹配內容、物體自動移除等。

值得注意的是,當虹科技和強氧科技都提到了NVIDIA實時光線追蹤GPU的性能優勢。根據當虹科技給出的數據,不同的NVIDIA GPU的AI超分深度學習推理性能相比CPU有10倍到25倍不等的性能優勢。

強氧科技給出的4K BRAW、6K BRAW、8K BRAW的測試顯示,NVIDIA的Quadro RTX 6000相比CPU也有2倍左右的性能優勢。

GPU實時渲染增強互動性

「無中生有」技術更多的是對已有視頻素材的增強,面向未來,GPU帶來的是互動效果的增強,讓廣電的單向推薦也借GPU的AI功能變成雙向智能推薦。

文中開頭提到的AI合成的主播,其實2018年就已經有,但受限於當時的AI技術以及計算、渲染能力,那時的AI主播只有面部表情,沒有肢體動作等。因此,今年全國兩會期間進行新聞資訊播報的3D版AI主播新小微一亮相就獲得了極大的關注。

圖片來自新華社

GPU的實時渲染能力決定著數字人的逼真程度,據悉,要實現一個特別寫實的數字人,臉部的模型、加上毛髮等面數接近500-600萬。這個量級上,要做到面部表情、整個身體實時驅動,需要幀率保持在50-60幀之間,因此算力是主要的瓶頸所在。

博採傳媒前期部總監沈辰奇也表示:「2017年我們推出了國內第一部全部用GPU渲染而成的動畫電影《昆塔:反轉星球》,GPU渲染比以前用CPU渲染的成本優秀太多,但仍然是我們製作流程的一個瓶頸。」

施澄秋說:「GPU在3D建模、3D圖形圖像電視廣電素材的片源製作中非常有優勢。圖靈架構的RTX GPU非常擅長實時渲染,能夠滿足數字人的渲染能力和算力要求。另外,交互式、對話式AI也可以應用到數字人中。」

嘗到了GPU渲染整片的甜頭,博採傳媒在繼續探索純第二部GPU渲染動畫時,想要實現基於Unreal Engine(虛幻引擎)實現虛擬場景的反向投射。投射屏的尺寸規劃是800平米,驅動這個巨型屏用NVIDIA GPU進行實時渲染測試還是有點慢。

「我們最後選擇了NVIDIA RTX 8000,利用nDisplay技術,實時驅動1.8億個像素點。在實際拍攝時,攝影基地的景深和透視的變化完全同步匹配。這其中革命性的意義在於把後期合成的環節砍掉,做到所見即所得。」沈辰奇指出。

解決了拍攝背景的問題,博採傳媒開發了一個基於超寫實的數字人項目,可以用於代言、直播等。

基於虛幻引擎的天氣播報,圖片來自unrealengine

數字人是給觀眾帶來不一樣的體驗,Epic Games的虛幻引擎則幫助創作者更好的創新,它被越來越多地用來做實時預覽、特效預中期預演、後期預演等。Epic Games China商務發展經理徐良安表示:「虛幻引擎不僅可以讓所有參與製作的人員都可以實時修改,實時看到效果,具有很大的靈活性,還能大大節約成本。」

虛幻引擎和nDisplay技術不僅可以用於線性內容拍攝,還可以把場景分單元或者分組投射到不同屏幕上並進行融合,在演唱會上讓觀眾和表演者能夠更好的互動。Epic Games也和美國著名說唱歌手Travis Scott合作,在《堡壘之夜》遊戲中進行演出,讓粉絲可以一邊玩遊戲一邊觀看演唱會,實現了很好的傳播。

實時渲染正在打破行業的邊界。新奧特產品中心總監王寧也表示:「去年開始,4K、8K的內容越來越廣泛。以前我們是通過CPU進行渲染加速,CPU能處理更多線程,但實時渲染能力不強,所以我們選擇了NVIDIA的RTX系列GPU。特別是像我們石墨超清在線需要實時呈現到大屏幕的,需要GPU的顯存能力。」

 

除此之外,基於GPU的AI也能應用到智能插播廣告,通過AI算法插入5-10秒的廣告,既不影響觀眾的收看體驗,也讓廣電的互動變成雙向互動。

SDI轉向IP,高清視頻的時代即將到來

性能更強的圖靈架構RTX GPU是讓老北京視頻、數字人在2020年備受關注的重要因素,但這些AI應用能否普及還有一個關鍵因素——視頻傳輸。NVIDIA Mellanox 高級市場開發經理陳龍指出,1080P以前,廣電行業的視頻傳輸靠SDI (Serial Digital Interface,數字分量串行接口)。隨著4K和8K業務的興起,SDI不能滿足4K視頻8G-9G的傳輸帶寬需求。

如果用4根3G帶寬的SDI傳輸4K視頻,成本變高且組網複雜。直接換12G帶寬的SDI,由於高速信號在SDI銅纜中傳輸距離和速率成反比,只能傳輸大概50米的距離,不能滿足廣電行業需求。8K的最低帶寬需求將達到25G-140G,SDI更難以滿足需求。

「我們判斷,SDI轉向數據中心裡的IP解決方案是大概率事件,後者不僅成本比定製化SDI成本更低,帶寬也更高。」 陳龍介紹。

但SDI轉換為IP解決方案之後,終端CPU處理協議棧的負載就會大幅上升。為此,Mellanox的網卡集成了Rivermax技術,解決SDI轉IP化之後傳輸標準的問題,也就是通過這個技術發送符合SDI要求的數據。另外,藉助是Kernel Bypass技術,將協議棧的大量負載放在網卡,大幅降低CPU的負載。

還有Frames技術,網卡把接收到的每一行像素整合成一張圖片後再傳輸給CPU,也可以降低CPU的使用率。Mellanox的網卡也支持虛擬化和雲化,能夠滿足高清視頻傳輸的穩定性要求,也有助於開拓更廣闊的市場。

IP解決方案優勢明顯,但也面臨一層的鏈路、二層的邏輯鏈路、三層路由轉發、報文緩存等問題,帶來了故障的排查就非常複雜。這需要What Just Happened技術,實時監測交換機的狀態,以及網卡內部的一些信息,有助於故障的診斷和排查。

陳龍說:「要IP化,只需要將價格昂貴的SDI加速卡換為Mellanox的網卡,可以支持10G、25G、50G、100G、200G乃至400G的傳輸帶寬。當設備IP化之後,不僅解決了傳輸帶寬不夠、傳輸距離過短的主要的痛點,還降低了整個設備的採購成本。除此之外,因為本身IP是一個彈性的管道,在IP之上能夠傳輸任意格式的報文。」

雷鋒網了解到,Mellanox已經與全球各大視頻解決方案合作商開發了不同的產品,打入了NBC、BBC、CNN等著名的視頻內容提供商。

雷鋒網(公眾號:雷鋒網)小結

廣電行業正在越來越多地探索與AI的結合,基於更強大的GPU和優化的技術,AI正越來越多的應用於提升解析度,包括降噪、插幀、插植等應用中,讓珍貴的舊視頻煥發新的生命力,再次吸引大家的注意力。同時,GPU更強大的實時渲染能力也讓直播或者視頻內容的製作增加了更多互動和特效,更加靈活和高效的創作方式打破了行業的邊界,為未來的創新奠定基礎,當然,這裡面還需要SDI專向IP解決方案,滿足4K/8K的視頻傳輸需求。

面向數據中心的安培架構A100 GPU已經在5月推出,安培架構遊戲GPU+Mellanox網卡又會把專業可視化行業引向何方?

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 自學成才的90後AI修復師,給百年前老北京影像上色,「復活」民國...
    2016~2017年左右,大谷曾加入一家名為Mokuni的遊戲公司,負責《貓小盒》遊戲的背景、3D建模、關卡設計工作。  而對於分別體驗過獨立遊戲開發者和傳統遊戲開發者生活的大谷說,還是前者更有吸引力。他說:「我更喜歡靈活一點兒。」從公司離職後,大谷就開啟了自己的獨立遊戲開發者生涯。
  • 「昨日重現」:藝術家用AI技術「著色」老北京記憶
    這段生動的老北京街頭影像本是黑白膠片電影,畫質並不清晰。北京的藝術家胡文谷將其修復成彩色影片,畫質更加細膩流暢,人物表情也鮮活可見。修復後的片子走紅網絡,在社交平臺上收穫了數百萬的點擊量。「理髮的小夥說話一股相聲味兒!」「有沒有人在影片裡找到自己的前輩?」「百年前的人跟我們口音原來一樣啊!」
  • ...成才的90後AI修復師!給百年前老北京影像上色,「復活」民國美女...
    大谷介紹,他開始接觸AI修復的時間是2019年年底,「AI修復百年前的北京城」是他的首個老片修復作品。「AI修復老北京」原片是經過加速處理的黑白默片,由一位加拿大人拍攝。一天,大谷在瀏覽YouTube時,偶然發現了人民日報上傳的這支視頻。當視頻中百年前的人物與鏡頭發生對視,大谷頗有感觸,「百年前這些人確實在這片華夏大地上生活過,讓我有一種穿越時空的感覺」。
  • 全網主播人氣指數大盤點,快來看看有你喜愛的主播嗎?
    如今短視頻的強勢興起讓我們足不出門就能感受快樂,越來越多的直播平臺層出不窮,也有越來越多的年輕人選擇從事主播這一行業。但三百六十行,行行有本難念的經。如此龐大的主播群體,最後能夠成為人氣火爆的大主播的又能有多少呢?想要真正的打響自己的招牌,提高自己的知名度,自身的努力平臺的造勢網友的買帳,多種原因可以說是缺一不可。
  • 小夥用AI修復100年前北京影像,他如何做到的?
    5月8日,博主@大谷Spitzer在微博上傳了一段視頻,他用人工智慧技術修復了100年前北京民國初年的影像。畫面中,城門大街上馬車和行人來來往往,院門前兩人見面打招呼先鞠躬作揖、集市裡幾名留著長辮子的青年好奇地張望著鏡頭……這段視頻一經發布,就在全網掀起轉發熱潮。
  • 《糖豆人:終極淘汰賽》火爆全網背後的秘密
    最近一款由號稱「英國最大獨立遊戲開發商」——Mediatonic製作,Devolver Digital發行的休閒娛樂遊戲《糖豆人:終極淘汰賽》於2020年8月4日在steam解鎖後,便一鳴驚人地衝到了銷量榜第一名,可謂是異軍突起。為何這款休閒遊戲能夠迅速火爆全網?
  • 2020最火爆的創業項目——生活有魚,你準備好了嗎?
    生活有魚是一個超級大的服務平臺,是不改變別人消費習慣下,成人達己賺錢的平臺!同樣也是全網唯一一個跨界結合的CPS+會員制的直播社交電商。打造管道收益!其中包括了電商CPS。例如:天貓,淘寶,京東,拼多多……以及生活服務CPS。
  • 遊戲主播被全網封殺,還能靠什麼生活?小智一句話解答:過於現實
    遊戲主播被全網封殺,還能靠什麼生活?小智一句話解答:過於現實提起和直播行業有關的一些話題,相信很多人應該也都是不陌生的吧,尤其是最近這幾年隨著人們經濟生活水平的提高,以及網絡科技的不斷發展,真的是有越來越多人都對主播有了更多關注和了解。
  • 火爆全網的這合理嗎表情包走一波
    火爆全網的這合理嗎表情包走一波時間:2020-08-31 13:58   來源:521經驗網   責任編輯:沫朵 川北在線核心提示:原標題:這合理嗎是什麼意思什麼梗? 火爆全網的這合理嗎表情包走一波 這合理嗎的表情包最近火了,這句話也成為了很多人的口頭禪,相應的還有這盒裡嗎、這河裡嗎、這恆河裡嗎等說法,那麼這合理嗎是什麼意思?
  • 2019鬥魚女主播各領域一姐排位總結 全網一姐馮提莫實至名歸
    眼下2019年已經過去了一大半,在2019年鬥魚直播平臺也是經歷了很多的變化。今天,粉絲邦小編為各位鬥魚水友整理出了2019年時下鬥魚女主播當中的排位總結,從不同維度來重新介紹一下鬥魚2019年的鬥魚「一姐」女主播們。全網一姐:馮提莫說馮提莫是「全網一姐」想必也並沒有多少水友會有異議。
  • 醫療AI臨床驗證大勢所趨,深透醫療引領影像AI全球全產業鏈落地
    就在最近,深透醫療的PET醫學影像臨床研究被 2020 年全球核醫學與分子影像學會(SNMMI)年會選為全員會議(Plenary Lecture)的亮點研究(feature study)。此次研究與上海第九人民醫院合作進行,將由哈佛影像中心的主任Georges El Fakhri在會上作宣講。
  • 江西2020年首個網紅景區,全網超800W流量直播,來這裡偶遇網紅
    最近,受到疫情的影響,國內的許多景點都呈現出萎靡的狀態,用「慘澹」二字形容毫不誇張,許多人的旅遊計劃也「泡湯」了,而也有一些景點卻另闢蹊徑,找到了另一個火爆的方式!今天,小編要給各位介紹的這個景點位於江西,是省內2020年首個「網紅景點」,它火爆到什麼程度呢?
  • 單場成交額破5000萬,蘑菇街主播「yoke瑜兒_」躋身全網電商主播第...
    單場成交額破5000萬,蘑菇街主播「yoke瑜兒_」躋身全網電商主播第一梯隊 事實再一次證明大流量不是大銷量的,前提。  單場成交額破5000萬,「yoke瑜兒_」躋身全網電商主播第一梯隊  11月11日是2020年雙11的,,,也是各方都使出渾身解數,試圖爭分奪秒,進行衝刺的階段。
  • 曾經火爆全網的艾比如今怎麼樣了,有意轉行做遊戲主播?
    一方面有自己的追求和堅持,所以活成了自己想要的樣子,成為了一名網紅,看起來比很多女孩子還要可愛精緻。另一方面也有很多人罵她,說她自己喜歡就在家裡做女孩子就好了,沒必要成為網紅影響別人的三觀。不過儘管有很多的爭議,但是艾比本人還是靠著自己的善良和堅持走了下來。也許不被理解,但是她確實過上了自己想要的生活,而且家人們現在也不反對。
  • 100年前的vlog,AI揭秘真實的老北京
    這段歷史我們都知道,1912年,辛亥革命成功,國民政府建立。在未爆發強烈武力衝突的情況下,清廷以一份簡稱為《清室優待條件》的協議,保留了自己的形式。電影《末代皇帝》裡的少年溥儀依舊享受著養尊處優的皇室生活所以當時有很多人他們費盡心思,把辮子盤在頭頂,藏在胸前,遲遲不願剪去。
  • 不到2塊錢的餅成了網紅美食?讓老北京教你什麼才是實力派!
    李小老燒餅,貌似全北京最好吃的牛肉燒餅?這家網紅老店上過BTV的美食節目,為了這一個燒餅排隊20分鐘都不誇張。故宮邊上的肉餅店-河沿肉餅(Beijing Pie),好幾年上榜大眾點評必吃榜,許多北京大爺大媽和老外都愛去的店,是許多老外眼中的網紅餐廳。
  • 《中國新說唱2020》主理人公演火爆全網 張靚穎歌詞回應15年爭議
    原標題:《中國新說唱2020》主理人公演火爆全網,張靚穎歌詞回應15年爭議半島全媒體記者  王悅由愛奇藝出品的S+級自製綜藝《中國新說唱2020》第五期節目剛剛結束,就一舉登頂各大榜單TOP1,單期節目也收穫了139個全網熱搜,同時也憑藉「主理人燃炸的公演」「頂級多元化選手」「頂級的Hitsong」被網友評為「
  • AI還原地道京片子!作者親自揭秘老北京視頻語音修復,網友:黃渤穿越...
    早在5月,微博博主「大谷Spitzer」分享了他對百年前老北京視頻的修復結果,如今在和央視的合作下,時隔兩個月,第二期節目終於如約而至,在新的視頻中,除了仍然熙熙攘攘的老北京街道,你還能看到很多生活化的場景,甚至聽到他們的聲音。
  • 抖音視頻等全網所有作品全網被下架
    虎牙莉哥改編國歌事件引發了一連串的連鎖反應,近日,有消息稱莉哥徹底涼涼,作品開始全網下架。莉哥所有作品全網下架是真的嗎?一起來看看吧。  莉哥所有作品全網下架是真的嗎  相信最近大家都知道虎牙除了一位不得了的「主播」吧,在直播的時候嬉皮笑臉的哼國歌導致直播間被當場封停,隨後這件事情經過網友的傳播在網絡上迅速發酵
  • 2020年「火爆全網」的5部懸疑劇,一部沒看那就太可惜了!
    2020年「火爆全網」的5部懸疑劇,一部沒看那就太可惜了! 4、《十日遊戲》主演:朱亞文,金晨 雖說這部劇的演技和劇情相比較隱秘的角落稍微差點