霧霾太重?深度神經網絡教你如何圖像去霧

2021-01-13 雷鋒網

雷鋒網(公眾號:雷鋒網)按:本文作者蔡博侖,華南理工大學在讀博士研究生。主要研究方向,機器學習,計算機視覺,圖像處理等

導讀

北京城被中度汙染天氣包圍,到處都是灰濛濛一片——霧霾天又來了。從11日起,霧霾天氣就開始出現,根據北京環境監測中心最新預報,這一輪霧霾短期內不會明顯好轉,尤其是今明兩天,北京空氣品質維持在4級中度汙染,霧霾會一直持續到本周日。

霧霾是特定氣候與人類活動相互作用的結果。高密度人口的經濟生產及社會活動會排放大量細顆粒物,一旦排放量超過大氣循環和承載能力,懸浮顆粒受靜穩天氣的影響持續積聚,極易出現大範圍的霧霾。

一、圖像去霧的核心

現有的圖像去霧(Image Dehazing)技術離不開一個簡單的自然模型——大氣散射模型(Atmospheric Scattering Model)。大氣散射模型描述了,在霧霾和光照的共同作用下的成像機制:

陽光在物體表面形成反射光 J(x),反射光在穿過霧霾的過程發生散射,只有部分能量 J(x)t(x) 能到達攝像頭。與此同時,陽光也在懸浮顆粒表面散射形成大氣光 α 被攝像頭接收。因此,攝像頭中的成像 I(x) 可由兩部分組成,透射的物體亮度 J(x)t(x) 和散射的大氣光照 α(1-t(x)):

其中,t(x) 是媒介透射率(medium transmission),顧名思義表示能順利透過霧霾到達攝像頭的比率。因此,透射率跟物體與攝像頭距離 d(x) 成反比,離攝像頭越遠的物體受霧霾影響更大。當距離 d(x) 趨於無窮大時,透射率 t(x) 趨於零,I(x) 趨近於 α,α=maxy∈{x|t(x)≤t0}I(y)。綜上所述,去霧的核心是如何更精確地估計媒介透射率 t(x)。

二、基於人工特徵

手工特徵是傳統機器視覺的基礎,講究的是熟能生巧,依賴的是實踐出真知。通過「觀察→經驗→設計」構建各式各樣的特徵來滿足各式各樣的任務需求。圖像去霧技術也是沿著手工特徵逐步地發展起來。

(1)暗通道先驗[2](Dark Channel Prior,DCP)

說起去霧特徵,不得不提起的暗通道先驗(DCP)。大道之行在於簡,DCP作為CVPR 2009的最佳論文,以簡潔有效的先驗假設解決了霧霾濃度估計問題。

觀察發現,清晰圖像塊的RGB顏色空間中有一個通道很暗(數值很低甚至接近於零)。因此基於暗通道先驗,霧的濃度可由最暗通道的數值近似表示:

(2)最大對比度[3](Maximum Contrast,MC)

根據大氣散射模型,霧霾會降低物體成像的對比度:Σx‖ΔI(x)‖=tΣx‖ΔJ(x)‖≤Σx‖ΔJ(x)‖。因此,基於這個推論可利用局部對比度來近似估計霧霾的濃度。同時,也可以通過最大化局部對比度來還原圖像的顏色和能見度。

(3)顏色衰減先驗[4](Color Attenuation Prior,CAP)

顏色衰減先驗(CAP)是一種與暗通道先驗(DCP)相似的先驗特徵。觀察發現霧霾會同時導致圖像飽和度的降低和亮度的增加,整體上表現為顏色的衰減。根據顏色衰減先驗,亮度和飽和度的差值被應用於估計霧霾的濃度:

三、基於深度智能

人的視覺系統並不需依賴這些顯式的特徵變換,便可以很好地估計霧的濃度和場景的深度。DehazeNet是一個特殊設計的深度卷積網絡,利用深度學習去智能地學習霧霾特徵,解決手工特徵設計的難點和痛點。

(1)   特徵提取(Feature Extraction)

特徵提取有別於傳統卷積神經網絡,DehazeNet採用「卷積+Maxout[5]」的結構作為網絡第一層:

並且可以證明,「卷積+Maxout」等價於傳統的手工去霧特徵:

當W1是反向(Opposite)濾波器,通道的最大等價於通道的最小值,等價於暗通道先驗(DCP);當W1是環形(Round)濾波器, 等價於對比度提取,等價於最大對比度(MC);當W1同時包含反向(Opposite)濾波器和全通(All-pass)濾波器,等價於RGB到HSV顏色空間轉換,等價於顏色衰減先驗(CAP)。

此外,從機器學習角度看,Maxout是一種樣條函數,具有更強的非線性擬合能力,如下圖(d)。

(2)   多尺度映射(Multi-scale Mapping)與局部極值(Local Extremum)

多尺度特徵會提高不同解析度下特徵提取的魯棒性。傳統去霧方法中也會採用不同尺度的濾波器(均值、中值、最小值)來增強特徵在不同尺度下的魯棒性。借鑑於GoogLeNet中的inception結構,採用3組不同尺度(3×3,5×5,7×7)的濾波器實現DehazeNet的尺度魯棒性:

局部極值(MAX Pooling)是深度卷積神經網絡的經典操作。局部極值約束了透射率的局部一致性,可以有效抑制透射率的估計噪聲。此外,局部極值也對應於暗通道先驗(DCP)的局部最小值和最大對比度(MC)的局部最大值。

(3)   非線性回歸(Non-linear Regression)

大氣透射率是一個概率(0到1),不可能無窮大,也不可能無窮小。受到Sigmoid和ReLU激勵函數的啟發,提出雙邊糾正線性單元(Bilateral Rectified Linear Unit,BReLU),在雙邊約束的同時,保證局部的線性。

BReLU的非線性回歸對應於傳統去霧方法中的邊緣抑制操作(如DCP和CAP)。雙邊約束引入先驗信息縮小參數搜索空間,使得網絡更加容易訓練;局部線性避免Sigmoid函數梯度不一致帶來的收斂困難。

DehazeNet基於手工特徵,又超出傳統方法,從人工到智能。因此,DehazeNet取得了更好的去霧結果,更多的對比實驗和代碼資源:


參考文獻

[1] Cai B, Xu X, Jia K, et al. DehazeNet: An End-to-End System for Single Image Haze Removal [J]. IEEE Transactions on Image Processing, 2016, 25(11): 5187-5198.

[2] He K, Sun J, Tang X. Single image haze removal using dark channel prior[J]. IEEE transactions on pattern analysis and machine intelligence, 2011, 33(12): 2341-2353.

[3] Tan R T. Visibility in bad weather from a single image[C]//Computer Vision and Pattern Recognition, 2008. CVPR 2008. IEEE Conference on. IEEE, 2008: 1-8.

[4] Zhu Q, Mai J, Shao L. A fast single image haze removal algorithm using color attenuation prior[J]. IEEE Transactions on Image Processing, 2015, 24(11): 3522-3533.

[5] Goodfellow I J, Warde-Farley D, Mirza M, et al. Maxout networks[J]. ICML (3), 2013, 28: 1319-1327.

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 人工智慧黑盒揭秘:深度神經網絡可視化技術
    但深度神經網絡又被稱為「黑盒」模型,多層隱藏結構,數據 / 特徵矢量化,海量決策關鍵元等因素讓模型使用者犯難:模型決策的依據是什麼?應該相信模型麼?特別是對於金融,醫藥,生物等關鍵型任務,深度學習模型的弱解釋性成為人工智慧項目落地的最大障礙。
  • 從手工提取特徵到深度學習的三種圖像檢索方法
    前言圖片檢索是計算機視覺,數字圖像處理等領域常見的話題,在我學習相關知識的過程中,圖像檢索算是我第一個學習的 demo,該過程都記錄在 利用python進行識別相似圖片(一) 和 利用python進行識別相似圖片(二) 兩篇文章,分別記錄了直方圖匹配,phash/average hash/dhash 三種基於哈希的方法。
  • 【大嘴說事兒】比霧霾更可怕的是……
    第一類:苦中作樂型,心甘情願的成為段子手的傳播機器,在霧厚霾重的日子裡為自己找個樂子。第二類:心靈雞湯型,告訴你如何防霾,如何調整心情,讓你在鬱悶的環境中快樂的生活。第三類:聳人聽聞型,告訴你霧霾到底有「毒」,告訴你今後你有多大的機率患肺癌,目的除了嚇人和引起恐慌外或者還有更深層的不為人知的動機。第四類:掛羊頭賣狗肉型,打著服務民眾的幌子,例如測試市場上的防霾口罩,實則藉機為公司做免費宣傳。
  • 視錯覺,神經網絡的盲點
    (來源:麻省理工科技評論)這正是深度學習的用武之地。近年來,計算機已經學會識別圖像中的物體和人臉,並能自己創建類似的圖像。所以,很容易想像到機器視覺系統應該能夠學會識別視錯覺並且自己創建錯覺圖像。    讓我們加入肯塔基州路易斯維爾大學的羅伯特·威廉士和羅曼·亞姆波爾斯基的研究。
  • 三角函數圖像與性質及函數y=Asin(ωx+∮)的圖像變換的深度剖析
    卻是,如上圖,三角公式是整個高中數學章節中結論最多,公式最多的一個章節, 如何做到不記憶公式而能達到熟練應用公式而解題的目的呢?還是一句話,只有站在理解的程度上,才能融匯貫通,一通百通,無敵於天下。還有就是巧記,利用一些口訣和圖形,幫助我們來記憶和理解,相信上面這個圖大家記憶尤深。
  • 鬧心的霧霾來來去去,但添堵的謠言卻始終不散……
    在霧霾嚴重的時候我們至少有一件事情可以做就是保護好你自己和你愛的人
  • 霧霾又雙叒叕來了百度輸入法趣味掃霾
    ,帝都第一次啟動霧霾紅色預警,嚇壞了的網友們,紛紛吐槽調侃發段子:霧霾又雙叒叕來了!由於陰沉的天氣和霧霾帶來的身體不適,大家的心情也異常煩躁抑鬱。使用百度輸入法,顏文字、特技皮膚等功能百變掃除陰鬱霧霾情緒,快來試試。賤萌顏文字,點亮聊天氣氛霧是故鄉厚,霾是北京純。看著遠處被霧霾籠罩的建築,心情頓時低落。加之自強不息的上班族們還得為工作奮鬥,如此複雜的心情用簡單的emoji表情根本不夠用。
  • 初雪漸去,霧霾寒氣再襲!未來幾天鄭州氣溫最低跌至-3℃,創入冬新低
    不過留下了道路結冰的「後遺症」,同時霧霾天氣仍在,也需防範接踵而來的「低溫攻擊」。【鄭州市區迎來初雪,嵩山積雪深度為14釐米】2020年12月的序幕,由一場初雪開啟。鄭州市區對於初雪的期待,似乎格外強烈。儘管早有預報,但由於以往總被放鴿子,此次初雪的到來,依然令人感到驚喜滿滿。
  • 如何用百度深度學習框架PaddlePaddle實現智能春聯
    其次是自然語言處理(NLP)方面,基於百度深度學習框架PaddlePaddle先進的神經網絡機器翻譯技術,可以將春聯創作轉化為「翻譯」的過程,所不同的是,翻譯是在兩種語言之間建立聯繫,而春聯是在同一種語言中建立聯繫。當然,有些人可能會中招「彩蛋」,這些不是AI寫的春聯。
  • 【AI造夢】哈佛大學用GAN+遺傳算法,創造圖像控制猴子大腦
    他們利用AI生成圖像,然後向猴子展示這些圖像,最終成功地激活特定的神經元,而不影響其他神經元。相關論文發表在最新的Cell期刊上。新智元不久前報導,MIT 的三位科學家首次利用 AI 生成圖像來激活特定視覺神經元,實現了控制動物大腦的神經元活動。該研究引起熱議,被認為是使用人工神經網絡來理解真實神經網絡的最強有力的驗證。
  • 神經網絡並不是尚方寶劍,我們需要正視深度 NLP 模型的泛化問題
    例如,就在去年,Yann LeCun 和 Christopher Manning 進行了一場引人注意的辯論(詳見雷鋒網 AI 科技評論文章 AI領域的蝙蝠俠大戰超人:LeCun 與 Manning 如何看待神經網絡中的結構設計),討論我們在深度學習框架中應該引入怎樣的固有先驗知識。Manning 認為,對於高階推理,以及利用較少的數據進行學習的任務,結構化偏置是十分必要的。
  • 霧是三橫槓 霾是躺倒的8 氣象符號你知多少?
    常見的氣象符號,你認識多少呢? 資料圖片 華龍網發    華龍網3月16日18時20分訊(記者 胡旭欣)看得懂天氣預報,你不一定了解氣象符號。三條橫槓是什麼天氣?3月23日,是第五十三個世界氣象日,今日下午,重慶科技館與重慶市氣象學會重慶市氣象學會聯合主辦專場活動,重慶市氣象學會重慶首席天氣預報員張焱,就霧霾天氣的形成與相關知識進行了講解。    張焱介紹,和常見的晴雨雲標示不同,霧和霾的氣象符號,顯得有些「難懂」:含水量高達90%的霧,氣象符號為三條橫槓,而含水量在80%以下的霾,則標示為躺倒的「8」,樣子有點像數學裡的無窮符號。
  • 乾貨分享 | 深度學習零基礎進階大法!
    ImageNet 革命當你讀完了上面的幾篇論文,相信你對深度學習也有了一個大致的了解。那麼深度學習的突破點在哪呢?在 2012 年,Krizhevsky 的《Imagenet classification with deep convolutional neural networks》預示著神經網絡的出現和發展有了突破性的研究進展。
  • 用圖像控制猴子大腦,哈佛大學是如何用算法「造夢」的?
    為了解答這個疑惑,我們就來捋捋這個實驗成果的一些獨到之處:首先,這項實驗的最大特點是嘗試了一種新的方式,即深度神經網絡,來進行腦科學實驗。XDREAM可以創造任何物體,包括那些不存在的東西。 這使得讓神經元可以不受物理世界的限制,從頭開始構建自己喜歡的圖像。
  • 萬字長文|如何直觀解釋卷積神經網絡的工作原理?
    作者:YJango 日本會津大學|人機互動實驗室博士生 量子位 已獲授權編輯發布 該文是對卷積神經網絡的介紹,並假設你理解前饋神經網絡。 如果不是,強烈建議讀完《如何簡單形象又有趣地講解神經網絡是什麼?》
  • 今冬最強霧霾來襲 360行車記錄儀提示正確使用霧燈
    入冬以來,以京津冀一帶為重災區的重度霧霾天氣成為了輿論焦點。從12月16日開始,京津冀及周邊持續一周重度霧霾,共有27個城市啟動了紅色預警。連日的霧霾天氣,不僅給人們的健康造成極大危害,也嚴重影響了道路交通,交通事故發生率大幅提升。在此,360行車記錄儀安全專家提示廣大車主,遇嚴重霧霾而不得不駕車出行時,一定要牢記交通規則緩速慢行,同時正確操作使用車輛燈光系統,也可在行車途中增添一份安全保障。
  • DNN的隱喻分析:「深度學習」,深在何處
    【編者按】DNN現在已經被網際網路公司廣泛使用,但大眾對深度學習的理解水平並不一致。Nuance的這篇文章從另外一個角度來審視DNN技術的演進——分析隱喻如何作為強大的工具來引導我們的思維進入新視野,同時又引誘思維步入新的誤區。作者告誡說:不要被「深度學習」的隱喻衝昏頭腦。隱喻在流行文化中和科學界隨處可見。
  • 從運動口罩到氣膜場館,體育在霧霾下如何掙扎求生?
    在霧霾肆虐的天氣中,風常起於傍晚或夜間,經一夜的吹刮之後,第二天天氣就會無比晴朗,我們也會出現在體育場上,享受著久違的室外體育鍛鍊。一念及此,筆者不禁仰天長嘯:安得長風千萬裡,驅霾散霧,送我中國體育一片朗朗清明!2014年北馬在霧霾中開跑天時不可違,人力有時盡,長風不可得。在大自然面前,我們沒有絲毫影響力。
  • 初學者指南,幾個小貼士,讓你了解鏡頭濾鏡的事情
    插槽濾光片的優點是你可以相對較快地增加或減去濾鏡,而較大的濾鏡可以工作在較短、較小的鏡片上。!濾波因子濾鏡改變進入鏡頭的光線的動力學,通常要求你改變你的曝光以補償這一事實。這就是所謂的過濾因子,每個過濾器都有一個特定的過濾因子,所以請閱讀它們,學習如何使用它們。
  • 黑白圖像具有獨特的藝術風格,拍攝良好的黑白圖像的關鍵是什麼?
    保持簡單黑白圖像通常可以從簡單的布局中受益。因為場景中的所有內容都縮小為單色調色板。如果你有什麼東西可以刪除以獲得更緊密的布局,而不是問自己如何自己添加更多-ask。 專注於形狀和形狀在單色風景中,缺少顏色意味著焦點將集中在形狀和形狀上,因此請嘗試在圖像中尋找強大的主體或元素。例如,一個鋸齒狀的山峰隱約可見天空和壯觀的天空,或者是田野中孤零零的橡樹的不祥形式。