騰訊優圖CVPR中標論文:不靠硬體靠算法,暗光拍照也清晰

2020-12-05 量子位

雷剛 發自 凹非寺量子位 報導 | 公眾號 QbitAI

暗光拍照也清晰,這是手機廠商目前激烈競爭的新拍照目標。

但除了堆攝像頭和硬體,AI科學家帶來算法方面的新突破。

他們提出基於深度學習優化光照的暗光下的圖像增強模型,用端到端網絡增強曝光不足的照片。

而且不是像以前的工作那樣,直接學習圖像到圖像的映射,而是在新網絡中引入中間照明,將輸入與預期的增強結果相關聯,增強網絡從專家修飾的輸入/輸出圖像學習複雜的攝影調整的能力。

結果證明,新算法模型,效果超過了市面上一眾當紅的多攝多硬手機。

這個新算法由騰訊優圖實驗室提出,王瑞星、沈小勇及賈佳亞是作者,論文已入選CVPR 2019.

傳統圖像增強算法不好用

優圖方面稱,人們在社交網絡中,往往喜歡分享自己用不同設備拍攝的照片,尤其是使用手機拍攝的照片,不過很多時候,由於低光照或者背光的環境下拍攝到的照片經常會產生欠曝光的現象,由於在圖像增強的整個過程不是線性的操作,並且增強的結果是很主觀的,因此欠曝光圖像增強是一個很具有挑戰性的任務。

雖然目前市面上存在了一些專業的圖像處理軟體,可以讓用戶交互式的處理圖像,如Adobe lightroom, PhotoShop。但是對於業餘愛好者來說,能同時處理好顏色,對比度,調節光照等操作是非常困難的。

也有一些軟體提供了一鍵自動的增強圖像的功能,比如Lightroom的Auto Tone功能和iPhone的魔法棒增強功能,但是由於平衡各方面的調整是非常複雜的一件事。

這些軟體依然會得到一些失敗的案例。

傳統夜景圖像增強算法大致可以分為幾個方面:直方圖均衡化(Histogram equalization),這種方法簡單的利用了圖像整體的統計性質,通常不能對複雜場景達到理想效果。

基於Retinex理論的增強算法,通常只能用單通道進行光照優化,顏色無法很好地回復,在光照複雜的情況下還容易出現過曝的現象。

這些傳統方法還容易在增加圖像亮度的同時,放大噪聲等瑕疵,影響圖像質量。

基於深度學習的方法,通常是直接訓練回歸(regression)模型,由於數據本身的特性,這種方法得到的結果通常清晰度、對比度比較低,而且會有一些人工痕跡。

轉換方法+網絡結構設計

對此,騰訊優圖將圖像增強問題,轉化為光照優化問題。

之前的神經網絡都是從訓練數據,學習原始圖像到清晰圖像之間的回歸映射。

優圖則是希望通過神經網絡學習出中間結果圖像的光照圖(illumination), 進而再通過輸入圖像和光照圖的關係,得到增強後的圖片。

與幾個具有代表性的商業軟體效果對比:

具體方面及網絡結構:

在網絡結構的設計方面,本方案採用創新的雙分支的網絡結構。

網絡分成了全解析度分支和低解析度分支。其中低解析度分支用於學習到全圖光照的整體信息,低解析度圖像的使用,有助於增大網絡感受野,提高算法速度。

低解析度分支的結果將會傳遞給高解析度網絡分支,用於重建全解析度下的亮度圖,並最終得到增強後的圖像。

此外,優圖設計的新的損失函數,包括:圖像重建損失、光照局部平滑損失以及顏色損失,進一步幫助騰訊優圖的網絡產生更加穩定、清晰、顏色真實鮮豔的結果。

得益於雙分支網絡的設計,以及全解析度分支中的雙邊上採樣模塊的設計,本方法可以在保證效果的同時,在GPU上對於高解析度圖片(例如:3000x2000)進行實時的增強。

實現細節如下:

夜景圖像增強的任務中,一個難點是難以獲取到成對的增強前後的訓練圖像。在該項目中,優圖使用了MIT-Adobe 5K數據集,該數據集包含了5000組原始圖片和專業美工調節後的圖像。

此外,為了適應光照程度更加複雜的場景,優圖自行採集數千組高清暗光照片作為訓練數據。由此構建出的數據集,使得本算法在複雜光照下,也能得到穩定結果。

對於上邊描述的深度神經網絡結構,優圖利用對應的暗光和清晰圖片進行網絡的訓練。因為卷積網絡不限制輸入圖片的大小,研究人員隨機從圖片中截取256x256尺寸大小的圖片塊進行網絡訓練來更好地利用GPU顯存。訓練好的模型可以利用在任何尺寸的圖片上。

除了對於欠曝光圖像增強外,優圖對於一些市面上常見的手機(華為P20, 小米MiX3, iPhoneX, 三星S9+)拍攝的結果,利用新算法也進行了進一步的美化,效果圖如下:

論文傳送門

Underexposed Photo Enhancement using Deep Illumination Estimation

《基於深度學習優化光照的暗光下的圖像增強》

http://jiaya.me/papers/photoenhance_cvpr19.pdf

One more thing

不過,近日騰訊優圖最受熱議的還有一樁AI公益的案例。

央視欄目《等著我》報導稱,優圖突破「跨年齡人臉識別」,幫助警方尋回了被拐十年兒童。

優圖方面介紹,這是優圖創新性技術在公益領域的成果。

依託騰訊海量數據,騰訊優圖首創了跨年齡人臉識別技術,重點解決尋人場景中嬰幼兒被拐的情況。

為了充分的從數據中學習人臉自然的跨年齡變化規律,騰訊優圖提出了基於DDL(分布式蒸餾學習法則)學習策略的正則化遷移學習策略。

基於該策略,算法模型可充分進行跨年齡人臉識別學習,從而讓困難的跨年齡識別更加可靠和精準。

騰訊方面稱,這是對「科技向善」的最好實踐。

相關焦點

  • 全球計算機視覺頂會CVPR 2019論文出爐:騰訊優圖25篇論文入選
    本屆大會總共錄取來自全球論文1299篇。中國團隊表現不俗,此次,騰訊公司有超過58篇論文被本屆CVPR大會接收,其中騰訊優圖實驗室25篇、騰訊AI Lab33篇,相比過去兩年成績大幅提升。作為計算機視覺領域級別最高的研究會議,CVPR2019錄取論文代表了計算機視覺領域在2019年最新和最高的科技水平以及未來發展潮流。
  • 全球計算機視覺頂會 CVPR 連續三年收錄騰訊優圖論文 2019 收錄 25...
    本屆大會總共錄取來自全球論文 1299 篇。中國團隊表現不俗,此次,騰訊公司有超過 58 篇論文被本屆 CVPR 大會接收,其中騰訊優圖實驗室 25 篇、騰訊 AI Lab33 篇,相比過去兩年成績大幅提升。作為計算機視覺領域級別最高的研究會議,CVPR2019 錄取論文代表了計算機視覺領域在 2019 年最新和最高的科技水平以及未來發展潮流。
  • 騰訊優圖25篇論文入選全球頂級計算機視覺會議CVPR 2019
    本屆大會總共錄取來自全球論文1299篇。中國團隊表現不俗,此次,騰訊公司有超過58篇論文被本屆CVPR大會接收,其中騰訊優圖實驗室25篇、騰訊AI Lab33篇,相比過去兩年成績大幅提升。作為計算機視覺領域級別最高的研究會議,CVPR2019錄取論文代表了計算機視覺領域在2019年最新和最高的科技水平以及未來發展潮流。
  • 萬字長文詳解騰訊優圖 CVPR 2019 入選論文
    今年有超過 5165 篇的大會論文投稿,最終錄取 1299 篇。此次,騰訊公司有超過 58 篇論文被本屆 CVPR 接收,其中騰訊優圖實驗室 25 篇、騰訊 AI Lab 33 篇,以下便是對騰訊優圖實驗室 25 篇被錄用論文的詳細介紹。1.
  • 騰訊優圖學術再進階 論文入選計算機視覺領頂級會議CVPR 2018
    據外媒報導,即將在6月美國鹽湖城舉行的計算機視覺頂級會議CVPR 2018,騰訊優圖的其中兩篇入選論文,由於其較高的應用價值,受到學術界和產業界的關注。騰訊優圖論文再次入庫頂級學術會議作為計算機視覺領域最高級別的會議之一的CVPR,其論文集通常代表著計算機視覺領域最新的發展方向和水平。這也是騰訊優圖繼2017年在另一計算機視覺頂級會議ICCV會議中獲得12篇論文被收錄,包含3篇口頭報告(該類論文僅佔總投稿數2.1%)的成績後,2018年,科研成果再次豐收,論文被CVPR2018收錄。
  • 騰訊優圖CVPR 2018論文:圖片去模糊及快速肖像處理等多項技術解讀
    騰訊優圖實驗室繼在 ICCV 有 12 篇論文被收錄(含 3 篇口頭報告)後,在今年的 CVPR 2018 上有多篇論文被錄用,也憑藉這一點在雷鋒網(公眾號:雷鋒網)學術頻道 AI 科技評論旗下資料庫項目「AI 影響因子」中有相應展示。騰訊優圖團隊將對其中兩篇論文做詳細介紹,並簡要介紹其它論文。
  • 解讀騰訊優圖ICCV2017 12篇論文:全球首個AI卸妝效果的算法等
    今年,即將於2017年11月8日在北京國家會議中心舉辦的AI World 2017世界人工智慧大會上,我們請到了騰訊優圖實驗室傑出科學家賈佳亞教授發表演講。 想了解更多關於騰訊優圖和計算機視覺的前沿動態?點擊文末閱讀原文,馬上參會!
  • 全球計算機視覺頂會CVPR 2020論文出爐:騰訊優圖17篇論文入選
    本屆大會總共錄取來自全球論文1470篇,騰訊優圖實驗室入選17篇。作為計算機視覺領域世界三大頂會之一,CVPR 的論文投稿量近三年持續大漲,CVPR官網顯示,今年大會論文有效投稿數量6656篇,最終錄取1470篇,錄取率僅為22%,相比去年降低3個百分點。
  • 騰訊優圖的 ICCV 2017:12篇論文入選 CV 頂會,3篇Oral|ICCV 2017
    ,雷鋒網AI科技評論獲授權轉載,並做了不改動原意的編輯。被譽為計算機視覺領域三大頂級會議之一的ICCV(另外兩個為CVPR、ECCV)近日揭曉收錄論文名單,騰訊優圖共有12篇論文入選,其中3篇被選做口頭報告(Oral),該類論文僅佔總投稿數的2.1%(45/2143)。本屆 ICCV 共收到2143篇論文投稿,其中621篇被選為大會論文,錄用比例29%。
  • 騰訊優圖:做產業網際網路時代的π型實驗室
    12月30日,騰訊優圖2020年度溝通會於海南正式舉辦,騰訊優圖實驗室總經理、騰訊雲副總裁吳運聲、騰訊優圖實驗室副總經理黃飛躍、騰訊優圖實驗室總監吳永堅、騰訊優圖實驗室總監任博,騰訊研究院高級研究員徐思彥等大咖出席了活動,並就2020年的業務進展和人工智慧趨勢做了完整的解讀和分享。
  • 騰訊優圖推出卷積神經網絡深度學習算法模型
    騰訊優圖實驗室聯合廣東省肺癌研究所吳一龍教授/鍾文昭教授團隊,與清華大學以及國內多家中心呼吸科/放射科團隊等共同開發了基於卷積神經網絡算法的肺結節診斷模型,近日,該初步研究成果已被全球癌症領域知名醫學期刊《腫瘤學家》(《The Oncologist》)收錄並全文發表。
  • 騰訊優圖2020疫情下再出發!專利800+項,AI落地直面碎片化
    溝通會最後,智東西等少數媒體對騰訊優圖實驗室副總經理黃飛躍 、騰訊優圖實驗室總監任博及總監吳永堅進行了專門提問。    也由於疫情,騰訊會議被許多人熟練使用,其中優圖計算機視覺等AI技術也被廣泛應用,體現在AI美顏、去除背景、視線矯正、暗光優化等許多智能化功能上。
  • 騰訊優圖跨年齡人臉識別 助警方尋回被拐兒童
    隨著人臉識別算法的不斷迭代優化,騰訊海量數據檢索能力的精準度已超過99.99%,毫秒級時間內便可完成千萬級人臉檢索,大大提高了走失人口匹配的精準度和速度,為警方尋人減輕壓力,節省大量人力物力,幫助更多家庭團聚。至今,騰訊優圖已協助福建、四川等多地警方打拐尋人。
  • 騰訊發起Light計劃,優圖VisionSeed全面輸出軟硬體AI能力
    (騰訊倡議發起light計劃)作為light計劃的重要參與者和推動者,騰訊優圖將結合自身優勢,通過騰訊雲及騰訊優圖AI開放平臺,全面輸出軟硬體AI能力。值得一提的是,騰訊優圖聯合英特爾正式宣布推出的AI視覺模組VisionSeed,為AI愛好者實現零門檻視覺開發組件。VisionSeed是一個融AI算法、算力和攝像頭為一體的模組,能對拍到的畫面進行實時分析,通過UART輸出分析後的結果,接入就可實現人臉檢測、屬性分析、姿態估計、人臉識別等功能。為什麼說VisionSeed是零門檻,普通AI開發者也可以使用的模塊呢?
  • 賈佳亞教授正式加盟騰訊優圖,計算機視覺大師的光榮與夢想
    新智元此前曾報導,騰訊優圖是騰訊AI的三大核心支柱之一,與微信AI團隊和新成立的騰訊AI Lab共同驅動騰訊的 AI 發展。本年度在國際上人臉識別標誌性比賽——LFW 和 MegaFace上,騰訊優圖都拿到了冠軍的成績。優圖實驗室創立於2012年,專注在圖像處理、模式識別、機器學習、數據挖掘等領域開展技術研發和業務落地,至今已有近5年的歷史。
  • 對話優圖實驗室鄭冶楓:從西門子到騰訊,醫療AI如何突圍?
    但作為局內人,鄭冶楓有自己的煩惱:西門子本質上是一家硬體公司,而自己從事的是軟體算法研究,戰略地位難免被忽視;另外,作為在外企工作的華人,他隱隱感覺到自己的事業遭遇了天花板。鄭冶楓想,也許是時候換個環境了。正在這時,他接到了騰訊海外招聘負責人的電話,對方詳細介紹了騰訊在醫療影像AI領域的發展規劃,並邀請他加盟。但面對騰訊的邀約,鄭冶楓卻猶疑了。
  • 騰訊優圖開源深度學習推理框架TNN 助力AI開發降本增效
    6月10日,騰訊優圖實驗室宣布正式開源新一代移動端深度學習推理框架TNN,通過底層技術優化實現在多個不同平臺的輕量部署落地,性能優異、簡單易用。基於TNN,開發者能夠輕鬆將深度學習算法移植到手機端高效的執行,開發出人工智慧 APP,真正將 AI 帶到指尖。
  • 刷新濾波器剪枝的SOTA效果,騰訊優圖論文入選NeurIPS2020
    本文轉自【TechWeb】;近日,騰訊優圖實驗室在模型壓縮任務中獲得創新性突破,提出的基於濾波器骨架的逐條剪枝算法(Stripe-Wise Pruning,SWP),刷新了濾波器剪枝的SOTA效果。相關論文(Pruning Filter in Filter)已被機器學習領域的國際頂級會議Conference on Neural Information Processing Systems(NeurIPS 2020)收錄。神經網絡的具有結構和參數這兩個屬性,這兩個屬性都具有重要意義。本文指出神經網絡的濾波器除了通常使用的參數屬性以外,還有一種形狀屬性。
  • 挑戰0Lux極限暗光拍照 榮耀30 Pro+超級夜景究竟有多強
    榮耀30 Pro+首次用上了IMX700傳感器,這顆傳感器擁有1/1.28英寸大尺寸,超大尺寸的傳感器帶來更大的進光量,默認模式下輸出1250萬像素的照片,提升暗光、大光比下的單像素進光量和動態範圍,可實現全時段超清畫質,暗光弱光逆光、室內室外出色的基礎畫質。
  • 刷新濾波器剪枝的SOTA效果 騰訊優圖論文入選NeurIPS2020並開源
    近日,騰訊優圖實驗室在模型壓縮任務中獲得創新性突破,提出的基於濾波器骨架的逐條剪枝算法(Stripe-Wise Pruning,SWP),刷新了濾波器剪枝的SOTA效果。