谷歌提出"光影魔術手"技術: 機器學習增強人像照明, 「普通」照片更好看了!

2021-02-09 將門創投
From: SIGGRAPH Asia 2020;編譯: T.R在人像攝影和電影拍攝過程中,光照扮演著十分重要的作用。為了實現更好的渲染和後期製作,需要估計出圖像中人物所處的光照信息。受到投射陰影和高光反射線索的啟發,谷歌研究人員提出了一種從任意光照條件下的單張RGB圖像中學習出高動態全方位光照的技術手段,並通過不同環境光照下配對的人物照片對模型進行訓練。

實驗顯示,這一方法可以有效為多種膚色的人物照片恢復高性能的光線效果,在連續光照的作用下,也可將虛擬背景或者卡通人物添加到肖像照中來。輕量級的架構也使得其在移動端運行成為可能。

論文連結:

https://arxiv.org/pdf/2008.02396.pdf

項目主頁:

https://augmentedperception.github.io/facelight/

相關參考: 

https://augmentedperception.github.io/deeplight/

基於單張圖像的高動態照明估計

對於經驗豐富的攝影師來說,拍攝時的光線情況不僅可以從皮膚的漫反射獲取,同時還可以通過投射陰影的方向和範圍、高光反射的強度和位置來獲取。在這一經驗的啟發下,研究人員提出了一個可以從人像實現逆向光照的模型,無需任何特定的皮膚反射模型假設,也能估計出環境中全向的高動態範圍照明情況。這種技術可以得到具有更高頻率細節的照明信息,使得更真實的人像渲染和ARi視覺特效成為可能。

為了訓練這一模型,研究人員構建了一個包含人像和對應光照情況的龐大數據集。數據集中包含了70個人物在331個光照下的基礎數據,以及利用渲染技術生成的約一百萬張包含室內外光照環境的人像數據集。下面就讓我們從數據集模型架構實驗等方面來詳細了解這項技術的實現過程。


訓練模型需要大量的具有光照情況標記的肖像照片,但在現實中去收集如此龐大的數據集幾乎是不可能的,所以研究人員採用了一種基於圖像的數字驅動的重光照技術來合成具有光照標註的肖像照片,通過適當地捕捉複雜的光傳輸現象來渲染出逼真的圖像。在反射場的理論框架下,人們可以通過反射場和HDR環境光的點乘來獲取重新光照下的主體圖像。

為了記錄人物的反射場,研究人員使用了安裝在球面內的331個LED燈來進行拍攝,反射場通過一系列反射基圖像來進行記錄,每次打開一個LED燈拍攝記錄一個獨立的光照結果(One-Light-At-a-Time, OLAT),並利用6個相機在不同的角度記錄了人物的圖像。

不同光照下的拍攝結果

其中35mm的鏡頭用於拍攝不同角度的半身像,50mm的鏡頭用於拍攝面部的細節。

研究邀請了70位不同年齡、膚色和性別的人物來進行拍攝,並記錄了九種不同的表情,最終共得到了3780套在331個光照序列下的成像結果。

由於獲取對象的完整OLAT序列需要六秒鐘,因此,目標在拍攝過程中不可避免地會有一定程度的移動。為了解決這個問題,研究人員採用光流技術來對齊圖像,每隔11個OLAT幀就增加一對均勻一致的照明「跟蹤」幀,以確保滿足光流的亮度恆定約束。這一步驟可保證重光照操作時圖像特徵的清晰度,以便將對齊的OLAT圖像進行線性組合。

利用正前方的兩個相機,研究人員還獲取了每個主體的掩膜,以便於將他們渲染到新的環境中。首先利用六個LED均勻地照明灰色的背景材料,而人物不會被照明;同時還在相同條件下拍攝了沒有人物時的完整背景。這樣一來,掩膜可以用第一次拍攝的圖分離第二次拍攝乾淨的背景圖獲取。

高動態環境捕捉。為了利用拍攝好的反射場對主體進行重新打光,研究人員收集了大規模的高動態環境的數據集來驅動深度學習算法。這裡主要使用視頻級速率的圖像捕捉技術獲取了近100萬張室內和室外的數據集。

如上圖所示,其捕獲的圖像中包含了散射、磨砂銀質和鏡面的參考球體。這三個球可以有效反映環境中不同的照明線索,其中,鏡面球反映了全向的高頻信息,但會忽略較亮的光源,造成強度和顏色的改變;而近似朗伯體BRDF的漫反射球則可以視為低通濾波器,捕獲模糊但相對完整的場景照明線索。與前人的工作不同,本研究需要獲得真實的HDR照明信息來對人物進行重新打光,需要顯式地提升這三個球的質量以估計其所處環境的HDR光照條件。

在給定三個捕獲反射狀況的球體圖像後(可能會有像素缺失),研究人員希望通過解算出HDR光照來得到合理的結果。首先,利用前面提到的光照系統記錄下漫反射球和散射銀球的的反射場,並將輻射基準圖像轉換到相同的輻射空間中去,這一空間通過入射光源的顏色進行了歸一化。隨後,將反射基準圖像投射到鏡面球上(基於朗伯方位角的等面積投影),針對每一個輸入圖像積累能量來構成反射場。對於鏡面球捕捉的圖像來說,如果不存在缺失,則直接利用反射率來恢復場景光照;如果存在缺失,則通過反射模型和最小二乘法來解出對應的結果。通過一系列複雜的算法就可以重建出HDR反射場。

上圖中,上半部分是基準LDR圖像,而下半部分就是利用估計的HDR渲染出的球體光照記錄。更多詳細的推導可以參考文章的3.1的第四部分。

在為每個任務記錄下反射場和估計出HDR光照條件後,研究人員就可以將每個人物在新場景中進行重新光照渲染來生成大規模的訓練數據了。利用包含三個環境光探測器的背景圖像,研究人員可以將記錄中獲取的人像渲染到豐富的背景環境中去。下圖展示了人物主體在新背景環境中得到自然的圖像的過程。

上圖分別展示了背景圖像、對應的HDR照明結果、主體的拍攝結果和利用環境圖像重照明的結果,最後利用掩膜與背景圖像渾然天成的合成結果。

為了更有效的利用數據,研究人員還在其中增加了面部檢測的能力,為輸入的數據提供一定的人臉檢測框來幫助模型更好地學習。

合成的訓練數據集將人臉檢測部分進行了剪切,右上角是HDR照明結果。
網絡架構和實驗結果網絡的輸入圖像是256x256像素的歸一化圖像和對應的LDR光照,利用編解碼器架構進行訓練,最終輸出結果為對數空間中32x32的鏡面球HDR圖像來表示全向照明。同時還使用了輔助的判別器分支來增加對抗損失,強化合理的高頻照明估計。在最終的訓練中,同時引入了多尺度的圖像重光照渲染損失和對抗損失來引導網絡訓練。

在訓練結束後,研究人員首先將估計出的環境光照信息與多種算法進行了對比,可以看到,這一算法恢復的結果更為真實可信。

同時,研究人員還基於估計出的光照結果對人物進行重新打光,並對比了不同分量渲染結果,還將得到的光照用於渲染新的人物。


上圖中,第一列和第二列為輸入的圖像和對應的基準光照;第三列為預測出的光照結果;第四列是利用預測出的光照進行重新渲染的結果。最後三列則是利用前面的光照對新的人物在相同環境中進行渲染的結果。
此外,下圖顯示,多尺度損失可以有效提升最終環境光的估計精度,最下面的鏡面球估計的結果明顯變得更清晰了。

接下來,我們再來看一些利用渲染圖像預測出的環境光照結果,它可以在不同膚色、表情、頭部姿勢上穩定工作。

在真實的戶外場景中,也可以實現高性能的光照估計,並且將新的任務渲染在相同的環境中。

如圖所示,第一列為輸入的真實圖像,第二列為估計出的光照結果,第三列為將數字人物渲染到對應環境中的結果。可以看到,光影效果非常逼真。

此外,有了估計出的環境光,一些特效也能渲染得非常真實,下圖就展示了在自拍中渲染出虛擬氣球做背景的效果,就像真的一樣。

關於我「

將門是一家以專注於發掘、加速及投資技術驅動型創業公司的新型創投機構,旗下涵蓋將門創新服務將門技術社群以及將門創投基金

將門成立於2015年底,創始團隊由微軟創投在中國的創始團隊原班人馬構建而成,曾為微軟優選和深度孵化了126家創新的技術型創業公司。

如果您是技術領域的初創企業,不僅想獲得投資,還希望獲得一系列持續性、有價值的投後服務,歡迎發送或者推薦項目給我「門」: 

bp@thejiangmen.com

    

點擊右上角,把文章分享到朋友圈

微信:thejiangmen

bp@thejiangmen.com

相關焦點

  • 看機器學習如何駕馭光影:一鍵為照片增光添彩的「人像光效」
    在人像模式照片中,人像光效配合已有的淺景深特效,提供更豐富的光影,可帶來如在攝影棚一般的效果。由於對光影的喜好因人而異,因此Pixel 用戶在人像模式下可根據自己的喜好,在 Google 相冊中手動重新定位和調整所應用光線的亮度。對於在 Pixel 2 或後續型號上運行 Google 相冊的用戶,這種補光功能也可用於許多先前拍攝的人像照片。
  • 光影魔術手官方下載_光影魔術手下載「去水印」-太平洋下載中心
    光影魔術手官方下載是一款款針對圖像畫質進行改善提升及效果處理的軟體,迅雷公司全新設計開發的產品,希望給廣大用戶提供一款功能強大,更易上手,操作體驗更好的圖片處理軟體。本站提供光影魔術手官方下載。此前已經陸續發布過幾個內測版,現在正式版已推出,除了不斷完善產品體驗。
  • 獨家現場照片 直擊香港兩大照明展
    今年,展會重點打造的"名燈薈萃廊"匯聚超過720個國際燈飾品牌,展示其最新照明技術及燈具產品。歐普照明展位歐普照明則是通過「一天的生活空間轉換」作為線索,巧妙串接起藍牙系統、智慧燈光、Dali系統三大核心技術在辦公、家居、工業、商業等實際場景中的應用。
  • "白嫖"技術的三階段&巧克生日會
    這個問題,讓我這個"白嫖"主力,陷入思索。要不要寫一篇白嫖技術哪家強的內容?於是,就有了下文。基本操作:先點關注,送送音符,誇誇主播    剛開播時剛開時就進場,這時直接間急需熱度,先能陪主播聊聊天的用戶都會得到關注,這時你只要點個關注送個小音符,就有機會點歌了.
  • 谷歌推出Portrait Light: 手機也能拍出攝像師水準級照片
    現在,普通的手機用戶或許也能做到這點了。為了讓手機用戶也能在行動裝置上創造出優秀的作品,谷歌研究人員利用機器學習算法開發了一種名為「肖像打光器(Portrait Light)」的應用,它可以利用模擬光照為照片中的人像重新打光,從而在手機端對圖像實現完全可控的光照調整。
  • 兩個老外從中國帶回一個"神秘物品"!外國網友直呼:"這是黑魔法、巫術"!
    確定點擊上方標題下「加拿大家園」可快捷關注家園君微信號:canadau  歡迎勾搭!
  • 猜猜谷歌曾經使用多少臺相機訓練Pixel手機中的一項AI攝影功能
    Google Pixel智慧型手機以其出色的相機能力以及捕獲光線或使用AI拍攝出出色的人像照片而著稱。但是,每項功能都需要花費很多時間,輕按按鈕即可在Pixel中獲得某些功能。當公司提出改進的Pixel 3縱向模式時,它使用了5個手機殼來訓練機器學習模型,從而使Pixel手機中的圖片效果近乎完美。
  • 楊冪"不雅視頻"風波,真相在這裡!
    王思聰在新浪微博寫道:"作為一個看了9遍才刪的權威人士,我可以負責任地告訴大家這不是大冪冪。"看到王思聰化身敬業的"技術帝",有網友調侃道:"看了九次才知道,看來不是真愛。"儘管此前王健林在採訪中宣稱,自己知道兒子王思聰"嗶——"狗的行為藝術,並"希望他穩重一點";但瘋傳網絡的楊冪醉酒不雅視頻事件一出,這位富二代還是自稱"權威人士",出現在網絡熱點的舞臺上。帥哥美女如雲的娛樂圈,本該千姿百態各成風景,但因為"撞臉",明星也會煩惱,楊冪這次深受撞臉不雅視頻困擾就是其中的一個例子。
  • 照片隨便拍,「光影」任意調,MIT谷歌新研究:NLT
    △來自俄羅斯攝影師George Mayer而最近,MIT 和谷歌等機構聯手提出了一種用神經網絡「打光」的新方法,大大降低了對「光影」拿捏的門檻——神經光線傳輸去背景後的「AI 打光」效果更加明顯。於是,MIT 和谷歌的研究人員基於圖像 LT 採集(以人體為主),提出了一種半參數的深度學習框架,來學習 LT 的神經表示,名曰NLT。總體而言,NLT 可以單獨或同時完成以下兩項任務:用定向光或HDRI圖,重新照亮場景的光線真實性。合成具有視圖依賴性效果的新視圖。
  • 喝一罐就"斷片"?!北美夜店最流行的Four loko"失身酒"到底是什麼鬼?
    不含傷手的強力廉價表面活性劑SLS(80%的清潔產品,肥皂中都含sls)清潔力好,不傷手,香味非常淡。每天洗內衣,襪子等手洗衣物必備,洗後無殘留,易過水,不會引起過敏。所有產品均由海外直郵,保證正品,價格更優惠40%,支持專櫃驗貨。假1罰10!更多"輕奢"點擊文章左下角"閱讀原文"進入查看喲!Kirkland濃縮深海魚油 Omega-3 (1200mg*300粒)
  • 譚志剛的"淡"與"雅"
    我開始約他是在五月下旬,其時我回祁東差不多半個月了,就在微信上約了譚志剛,提出了要採訪的要求。        不巧的是,那時的他恰巧在廣西劉三姐的故鄉聽山歌。剛到了六月,譚志剛又聯繫我,說是要忙完了手中的事才行,因為有六十枚印章要趕緊交貨。終於到了七號,他約我第二天去他蓮花東路的工作室。        譚志剛的工作室在體育廣場後面,二樓後四間房。
  • 關於楊冪的"不雅視頻",真相在這裡!自己進來比對...
    想在朋友圈裡見到家園君嗎,想更直接了解加拿大,諮詢事情嗎,想打家園君嗎,加家園君個人微信號:cameet(之前加過微信canada365的童鞋就不用重複加了!)本期話題「加拿大人是怎樣過母親節的?」。點擊家園微信下方菜單「籤證申請」,進入「美女微電臺」收聽。(文|觀察者網授權家園發布!)
  • 練功,為何要懂得"服食"
    那麼如何增強自身的精氣呢?也就是說通過什麼方法可以積累人體的精氣呢?古人總結了三點:一是"行氣",單純的行氣之術,也就是練陽氣的方法,比如氣功,太極拳,八段錦等,這些都屬於動功。動功就是在運動,那麼運動這種狀態,就和陽氣的狀態相應,那麼就能"感召陽氣"進入體內,都能很快增強自身的陽氣。所以,內經上講,動養陽。這裡就又提到一個修行中的道理,就是相應。
  • 日本歷史上最多人出鏡的"毛片":百名女優廢棄鄉村學校拍"小電影"全記錄!
    (文:tokyokinky.com;翻譯:王大發財(jandan.net)今年三月,數百人聚集到日本某鄉村深處一座廢棄的學校,這些人並不是尋常人,他們是兢兢業業拍攝"小電影"的攝製組。這部動作片也和其它企畫"小電影"一樣,由多段"如實記錄"的片段組成,全片可以總結為教職工追著女學生滿學校跑。
  • 三葉草中隊"小廚神"雲PK賽
    為了調節同學們居家生活、學習的心情,增強集體意識,三葉草中隊在傳老師和家委會的組織下開展了歡樂的"小廚神"雲PK活動。(以上內容請忽略!重點是以下內容!高顏值美食和或雄或熊的孩子們一大波一大波湧來,忍住口水,不要舔屏,不要噴娃。忍不住的請自備紙巾,保護好屏幕!) (原諒非技術黨不會插入視頻,請大家發揮想像力😄😄)
  • 男扮女裝的中國"女間諜"時佩璞
    布希科愛佩璞愛得如痴如狂.沒有人知道他們是怎麼做愛的,到年底布希科要離開中國時,佩璞告訴布希科他懷孕了.布希科激動地對佩璞說:"等我,我會回來的!".4年後,布希科回到北京,立刻去了佩璞的家,見到佩璞他第一句話就問:"我們的孩子呢?
  • Emoji表情符號添72新丁:"打臉"、"流口水","孕婦"...你一定要試試
    你的手機裡很快就可以用上"與時俱進"的72新添Emoji表情符號。其中的"大神級"的表情符有:"在地板上打滾且大笑"及"一個在自拍的手"!蘋果和微軟反對"步槍"emoji制定新的表情符過程中一個值得玩味細節是,作為奧運會運動項目之一的"步槍射擊"emoji最後被踢出了列表。 "病毒式傳播"大神Buzzfeed News的透露的內幕是,只是蘋果公司和微軟反對的結果。這個消息在社交網絡上引起了討論。
  • 一張照片流出,中國代購黨是如何"玩殘"他們的?老外氣得直跺腳~
    快到"黑五"了,北美這邊商家打折特別狠。不少朋友爆料,加拿大的商場(特別是Costco)已經被中國代購黨玩壞了!本地論壇最近流出一張照片,中國的人肉代購黨。。。一車車的從商品裡搬東西。純金箔,打通肌膚黃金通道,迅速導入養分,純金箔親和肌膚,納米微技術使之更精純,滲入肌膚,創造良好的導入環境,宛如打通順暢的黃金通道,令肌膚迅速恢復優異的導入功能,讓養分快速滲透。
  • "鄧文迪第二":中國女子張爽起訴美國億萬富豪帕菲特性侵,生兩子!出差買"偉哥"不分晝夜性愛
    更誇張的是帕菲特的性慾極強,還曾命令張爽買「偉哥」給他,並要求不分晝夜的不停搞。。。她的主要工作是幫助美國公司到中國投資,領域多數為製藥、生命科學和生物技術行業。"在廣州市白天鵝酒店,他第一眼看到身穿中國傳統服裝的張霜下樓時,就對她一見鍾情。帕菲特隨後向她表白。"隨後,帕菲特聘用張霜擔任MPI獨立商業顧問。
  • "七夕":送你這些COSTCO最暢銷的"性感蜜物"!錯過了,就只能再等一年...
    但這一年只有一次的"七夕",送愛人一點來自北美的小禮物絕對是犒勞愛人一年來"辛勞"的最佳選擇!此時此刻,兄弟們真該動手啦!家園商城新品和Kirkland的熱銷商品仍在優惠促銷中!你真的不能再猶豫了。。。別猶豫!