影史第一片《火車進站》秒變4K高清 黑白也能變「彩電」

2020-12-23 環球網

最近,國外一個YouTuber發布了通過神經網絡增強的1895年拍攝的紀錄片《火車進站》,整部電影只有45秒長度,由路易·盧米埃和奧古斯特·盧米埃拍攝於法國一沿海城市。

這部電影採用35mm格式膠片製作,由於當時的放映機由手搖進行驅動,其原始幀率大概在16幀到24幀之間。

由於當時的膠片技術尚未成熟,我們可以看到畫面景物都是比較模糊的,火車在駛來的同時還帶有明顯的拖影。但經過了神經網絡的畫面解析度增強和插幀之後,這部老電影獲得了4K ~ 60fps的畫質。

如果不是電影黑白的畫面和膠片電影獨有的畫面抖動,畫面流暢度和清晰度幾乎可以與現在的智慧型手機相媲美。這部影片的修復工作是由一位名叫 Denis Shiryaev的男子完成的,其所使用的是Topaz實驗室的Gigapixel AI以及DAIN image 圖像編輯應用程式。在修復過程中,他不僅將鏡頭提高到4K,還將幀率提高到每秒60幀。

《火車進站》這部短片原始原片質量非常模糊,解析度非常低。Shiryaev使用Gigapixel AI渲染後,自己為這部電影加上聲音後,觀影體驗竟然完全符合現在的標準。

根據官網介紹,Gigapixel AI軟體內嵌專有的插值算法,在分析圖像的同時能夠識別圖像的細節和結構,即使將圖像放大 600%,它也可以使圖像更清晰。值得一提的是,電影中的圖像有的是通過GAN生成的。

另一方面, DAIN (Depth-Aware Video Frame Interpolation)可對電影中的幀進行預測,並將其插入現有視頻之中。換句話說, DAIN分析並映射視頻剪輯,然後在現有圖像之間插入生成的填充圖像。為了在這段1896年的視頻中達到與4K同樣的效果,Shiryaev為電影填充了足夠多圖像,從而將「圖片放映」提高到了每秒60幀。

因此,DAIN每秒會自動生成36個圖像然後添加到電影中。除此之外,基於同樣的AI技術,神經網絡可以將一堆彩色照片轉換為黑白,然後再訓練它重建彩色原稿,這樣就可以把黑白電影,轉換成彩色。如下視頻展示的那樣。

DAIN基於深度學習的視頻插幀技術

將百年老片修成4K大片,深度學習技術出了不少力,更為具體的是視頻插幀技術在深度學習裡的體現。當然,深度感知視頻幀內插(Depth-Aware Video Frame Interpolation)也不是最近才出現的技術。早在2019年,此項技術的相關論文就被收錄到CVPR 2019,相關算法也已經開源在了Github上。

DAIN這篇文章的第一作者Bao Wenbo,是上海交通大學電子信息與電氣工程學院的博士生。具體工作是基於其在2018年發表的論文MEMC-Net做的改進。

具體效果類似於英偉達開源的Super SloMo,即能夠從普通的視頻「腦補」出高幀率的畫面,從30fps插幀到240fps,即使放慢8倍也不會感到卡頓。

而這個新的插幀算法DAIN比英偉達的算法效果更清晰、幀率更高,可以把30fps的進一步插幀到480fps。具體到算法層面,研究人員提出了一種通過探索深度信息來檢測遮擋的方法。

一個深度感知光流投影層來合成中間流,中間流對較遠的對象進行採樣。此外,學習分層功能以從相鄰像素收集上下文信息。更為具體的如上圖所示,整個算法分為光流、深度、上下文特徵、插值kernel、框架合成這幾個部分。

在光流估計模塊,採用PWC-NET光流估計模型,由於在沒有監督的情況下學習光流是非常困難的,所以作者從預先訓練好的PWC-Net中初始化光流估計網絡。

在深度部分,不同於過去的網絡模型採用的是計算平均值的方式,為了處理處理遮擋區域的問題,此作者提出了一種使用深度輔助來計算tt時刻的光流融合結果。融合的權重使用的是深度值的倒數,簡單的來說就是深度值越大的像素(距離越遠的像素),在光流合成的時候所佔的權重越小。

上下文特徵部分,作者提出,在CtxSynNet論文中已經證明上下文信息(contextual feature)的加入對視頻插值有一定幫助。所以在這篇論文中,作者基於Residual block自己設計了一個提取上下文特徵的網絡,並從頭開始訓練。

插值kernel自適應warping layer部分,主要思想是通過光流找到像素的新位置後,將其新位置周圍4x4範圍內與一個特殊的kernel相乘後作為該點的像素值。這個kernel由兩部分相乘得出,一部分是我們圖像縮放時常用的雙線性插值,其中每個位置的權重只與坐標距離有關,另一部分也是一個內插值kernel,是通過網絡學習得出的。

框架合成。為了生成最終的輸出幀,作者構建了一個幀合成網絡,該網絡由3個個殘差塊組成。並將扭曲的輸入warped深度圖、warped上下文特徵、warped和插值核連接起來作為幀合成網絡的輸入。此外,還對兩個warped幀進行線性混合,並強制網絡預測地面真實幀和混合幀之間的殘差。

損失函數是真實幀和混合幀之間的殘差,這種函數名為Charbonnier Loss,是一種L1 loss的變種,只不過加了一個正則項。所採用的訓練數據集是Vimeo90K,其有51312個三元組用於訓練,其中每個三元組包含3個連續的視頻幀,解析度為256 x 448像素。

具體在訓練過程,作者用網絡來預測每個三元組的中間幀(即,t="0".5)。在測試時,模型能生成任意中間幀。另外,還通過水平和垂直翻轉以及顛倒三元組的時間順序來增加訓練數據。

在具體的訓練策略中,作者使用AdaMax優化網絡,分別設置 β1 and β2為0.9 和 0.999,並將核估計、上下文提取和幀合成網絡的初始學習率設置為1e?4。由於流估計和深度估計網絡都是從預先訓練的模型初始化而來的,因此分別使用較小的學習率1e?6和1e?7。

另外還對整個模型進行30個epoch的聯合訓練,然後將每個網絡的學習率降低0.2倍,並針對另外10個epoch對整個模型進行微調。值得一提的是,作者在NVIDIA Titan X(Pascal)GPU卡上訓練模型,大約用了5天達到收斂狀態。

關於實驗結果,放兩張在不同數據集上與近年論文的優劣,這裡不做過多分析。總的來說,作者提出了一種depth-aware視頻插幀方案,並嘗試顯式的解決遮擋區域的問題。借用PWC光流coarse-to-fine的思路,嘗試解決large motions的問題。使用學習的分層特徵和深度作為上下文信息,更好的合成中間幀。那麼,這種類型的深度學習技術在具體的電影修復中能發揮什麼樣的作用呢?2019年的幾部AI修復的影片或許能給我們答案。

開國大典、決勝時刻皆是AI修復

去年是建國70周年,除了氣勢恢宏的閱兵給人們留下了深刻的印象之外,10月下旬上映的《開國大典》也著實讓人感動了一把,這部電影展現了三次戰役勝利到開國大典的整個歷史過程。

這部電影在1989年9月21日初映,全片分為18卷,共164分鐘。由於當時的拍攝條件,重新上映必須修復畫質。在修復過程中,製作方最大化地利用DRS修復系統的功能,把自動化修復與人工修復結合。

通過AI算法,老膠片存在的收縮、捲曲等問題都可以得到解決,但是膠片的撕裂、劃痕等都需要專業的修復師一幀一幀地進行修補。但是膠片的撕裂、劃痕等都需要專業的修復師一幀一幀地進行修補。

除了《開國大典》,9月份上映的《決勝時刻》也是採用了AI技術,據電影製片方爆料,這段材料來自於俄羅斯的一段彩色紀錄片,但由於年代久遠,畫質模糊,色彩失真。而經過了複雜的 4K 修復工作之後,最終呈現出這般極致的畫面體驗。

另外,《厲害了,我的國》就是中影電影數字製作基地數字修復中心主任肖搏及其團隊利用AI修復進行的一次嘗試。

為了更順利地進行修復工作,肖搏團隊開發了「中影·神思」人工智慧圖像處理系統,靠計算機大數據深度學習算法,在四個月內修復增強了30萬幀圖像。利用「中影·神思」,修復一部電影的時間可以縮短四分之三,成本減少了一半。

而愛奇藝開發ZoomAI也是一款基於深度學習的視頻修復技術,此技術內部由多個模塊組成,每個模塊負責一種或者幾種畫質增強的方向,比如超解析度,去除噪聲,銳化,色彩增強等等。

每個模塊都是由一個或者多個深度學習模型組成。綜上所述,利用卷積神經網絡和最先進的圖像識別技術,讓經典老電影重現光彩已經不是遙不可及的事情。與其他方法相比,通過基於深度學習的技術來修復電影可以節省時間和精力。經典電影的修復和數位化也能使人們能夠更方便地獲得更多文化產品。

相關焦點

  • 影史第一片《火車進站》秒變 4K 高清,AI 預測+插值,黑白也能變...
    最近,國外一個YouTuber發布了通過神經網絡增強的1895年拍攝的紀錄片《火車進站》,整部電影只有45秒長度,由路易·盧米埃和奧古斯特·盧米埃拍攝於法國一沿海城市。Gigapixel AI官網截圖《火車進站》這部短片原始原片質量非常模糊,解析度非常低。Shiryaev使用Gigapixel AI渲染後,自己為這部電影加上聲音後,觀影體驗竟然完全符合現在的標準。
  • 百年古董電影秒變4K高清、60FPS,AI插值,還能著色
    十三 發自 凹非寺量子位 報導 | 公眾號 QbitAI古董級電影秒變4K高清,還能黑白變彩色。
  • AI技術4K復原1896年人類首個電影「火車進站」
    他用AI視頻技術成功復刻了1896年人類第一部可以成為「電影」的視頻片段《火車進站》(L'arrivée d'un Train à La Ciotat)),並生成了4K 60幀畫質的高清版本。修復版《火車進站》視頻的截圖  這部僅為40多秒的原版電影由盧米埃爾兄弟(路易斯·盧米埃爾和奧古斯塔·盧米埃爾)拍攝,下方視頻為視頻的原版畫面(360p解析度,無聲音)。
  • AI修復百年前的古早電影,4K高清、無卡頓播放終於成真
    From: Engadget; 編譯:Iris時間回到1896年,當無聲的50秒短片《火車到站》在劇院首映時,觀眾們看到火車駛來,驚異於其逼真的效果,以為火車會隨時衝出屏幕,竟一齊驚慌地向後靠。不過在電影工業早已成熟的今天,那模糊的低解析度畫質,無論如何也沒法與「逼真」扯上關係。
  • 《我的祖國》MV變4K高清彩色版
    在祖國71周歲之際,1956年黑白電影《上甘嶺》插曲《我的祖國》MV重新上線了。還是4K高清彩色版的那種,來看看一鍵高清、上色的效果~AI「百萬後期」不僅解析度大大提高,還賦予了經典黑白電影真實的色彩,這樣的「百萬後期」是如何實現的?
  • 《我的祖國》MV變4K高清彩色版
    在祖國71周歲之際,1956年黑白電影《上甘嶺》插曲《我的祖國》MV重新上線了。比如,俄羅斯網友Denis Shiryaev就曾將1896年的古董電影《火車進站》,用AI修復成4K 60fps的高清畫質。
  • 《火車進站》:123年前的經典電影,世界上第一批電影!
    《火車進站》這部短片的機位選擇很經典,火車從景深處的右上方馳入,划過銀幕,馳往左下方,右側是站臺上乘車的人,1895年的法國人的穿著,火車的形狀,以及上車,下車的人們,別離與歸來迎來的場景,被盧米埃爾兄弟永遠地紀錄下來。這是人類歷史上偉大的一筆!
  • 基於AI算法:124年前的世界第一部電影《火車進站》被重製為4K 60FPS
    法國盧米埃爾兄弟(Lumière Brothers)拍攝的《火山進站(Arrival of a Train at La Ciotat)》被認為是世界上第一部電影,其於1896年首次放映。資料顯示,當年《火車進站》第一次放映時,車頭呼嘯而來的畫面讓當時的觀眾們嚇了一跳,雖然如今看起來已經毫無新鮮感,但4K版也許能更好地還原電影工業初創時跳動的脈搏。
  • 《比利·林恩》會影史留名嗎?
    今天,就著《比利·林恩的中場戰事》「會是一部影史傑作嗎?」「真的適合120幀嗎?」「對比原著小說,電影做了什麼改動?」等熱門話題。書評君將一一為你做出解答。撰文|伯樵「接受史」是一個略顯掉書袋的名詞,對於大部分觀眾讀者來講,這個詞既無意義,也不重要。但是對於小說迷、音樂迷或者電影迷而言,接受史卻是一個無法迴避的問題。
  • 圖片秒變高清:一招教會你如何讓圖片秒變清晰
    圖片秒變高清:一招教會你不用下載app如何讓圖片秒變清晰生活中的困惑:不知道你有沒有發現,微信傳圖片,即使是傳原圖,本來是一張挺清楚的到了我們手機上就變得不清晰了?微信傳圖是有損傳圖,所以會出現這樣的情況。
  • 民間高玩4K重製百年經典電影 《火車進站》重獲新生
    民間高玩4K重製百年經典電影 《火車進站》重獲新生 時間:2020-02-08 10:16:48
  • 誰知道 我國第一臺黑白電視機誕生於哪一年?
    它就是我國第一臺國產電視機——1958年天津無線電廠試製出的「北京牌」黑白電視機。儘管現在看上去毫不起眼,但它的誕生卻開創了中國電視產業自主研發之路。60多年過去了,電視機從黑白到彩色,從CRT(顯像管)到LCD(液晶)、等離子,再到數字高清、OLED、量子點、雷射電視、4K、8K……一步步見證了中國電視產業從「追趕」到「並跑」直到走向「領跑」。
  • 為什麼火車寧願站前停留一段時間,也不提前進站,究竟是何原因?
    為什麼火車寧願站前停留一段時間,也不提前進站,究竟是何原因?對於火車,相信很多人過,畢竟它經濟實惠,還能夠欣賞沿途的風景,是長途旅行出行的不錯選擇,但經常乘坐火車的小夥伴們都會發現火車晚點是很正常的事情,有時候即使提前到了,可能也不會進站會,現在站外,聽上一段時間,那麼為何火車寧願站停停停停,時間也不提前進站,到底是何原因呢?
  • 《迷魂記》:從慘敗到影史第一
    幾乎同時,它首次闖進《視與聽》的影史十大榜單。當然,從某種程度上說,無論在何時,我們作為觀眾所看到的《迷魂記》從來沒有變過。在它「缺席」的十幾年裡,產生巨變的是我們所在的世界與社會——電影不再被鄙視為娛樂大眾的商業產品了,電影學堂而皇之地進入大學課堂,那種鼓吹現實主義和社會責任感的批判建制徹底被摧毀了,以精神分析和結構主義為代表的批判理論成為了新興主流。
  • 125年前的冬天,兄弟倆創造了世界上第一部電影《火車進站》
    1895年12月28日,法國盧米埃爾兄弟第一次把在巴黎的卡浦星路14號大咖啡館的地下室裡面公開放映他們製作的影片《火車進站》,這天被稱為電影誕生的紀念日,而盧米埃爾兄弟也成為電影史上重要的人物。盧米埃爾兄弟是世界電影的先驅,是他們開創了世界電影的歷史。
  • 黑澤明六十多年前拍的黑白片《七武士》,為何能競逐影史最佳?
    大導演黑澤明拍過很多優秀影片,黑白片《七武士》就是其中的一部經典。隨著歲月的流逝,它仍然像鑽石一般熠熠發光。影片講述的是在日本戰國時代,一個小山村的農民為了抵禦山賊,請來了七名流浪武士來幫忙。《七武士》表現了日本文化中的武士精神,也深刻挖掘了人性的複雜。
  • 影史第一部劇情片《凱利黨的故事》的現代版,你應了解的那些事
    本文作者:李嘯天一、影史第一部劇情長片是它電影誕生於1895年。是年12月28日,「世界電影之父」盧米埃爾兄弟拍攝的《火車進站》等片的公開放映,標誌著電影的正式誕生。50秒,但它開啟了一個時代。10年後,1905年中國就誕生了自己的第一部影片《定軍山》。所以說,中國電影的起步並不晚。韓國電影這麼強,第一部電影的誕生也要到1919年才達成。影史上第一部劇情長片,也就是片長超過60分鐘的故事片,正式上映於1906年。這部影片就是《凱利幫的故事》,完全用電影進行敘事,正式片長為66分鐘。
  • 1896年發行的影史首部恐怖片,由魔術師掌鏡,至今仍是開創性傑作
    唯一能確定的是,恐怖片「永遠的神」裡必定會一直保留著一個「牌位」,而這份榮譽必定屬於電影史上的第一部恐怖片。電影界很多人認為1920年的《卡裡加利博士的小屋》是第一部恐怖電影,但事實上,在這部電影誕生的數十年前,導演喬治·梅裡愛(George Méliès)就拍了一部3分鐘的無聲電影——這事實上才是嚴格意義上的「影史第一部恐怖片」。
  • 高清無碼,歐美日韓,4K看片!
    編輯 | 排版 | 製圖 | 測試 | ©隊長觀影軟體已經給大家推薦了不少,不過大多數都是手機版的,電腦好用的幾乎是鳳毛麟角,不是畫質差就是廣告多,對於影視迷來說
  • 為什麼火車寧願晚點,也不會提前進站?
    現在人們的出行機率越來越多了,而且出行的交通工具也有更多的選擇,像飛機高鐵等 是很多人都喜歡乘坐的交通工具,然而在以前相信人們最方便的交通工具就是火車了吧,那麼經常乘坐火車的人有沒有發現火車經常晚點,但是不會提前進站,你知道這是為什麼嗎?