空間-角度信息交互用於光場圖像超分辨重構,性能達到最新SOTA

2020-11-23 騰訊網

作者 | Yingqian Wang, Longguang Wang等

譯者 | 劉暢

出品 | AI科技大本營(ID:rgznai100)

光場(LF)相機不僅會記錄光線的強度,也會記錄光線的方向,並且會從多個視點捕獲場景。而每個視點內的信息(即空間信息)以及不同視點之間的信息(即角度信息)都有利於圖像超解析度(SR)。

在本文中,作者提出了一種用於LF圖像SR的空間角度交互網絡(即LF-InterNet)。在本方法中,作者使用兩個專門設計的卷積分別從輸入的光場圖中提取空間和角度特徵。然後,將這些提取的特徵重複地交互以合併空間和角度信息。最後,將交互的空間和角度特徵融合在一起,去超分辨每個子孔徑的圖像。

作者在6個公共的LF測試數據集上做了實驗,證明了本文方法的優越性。與現有的LF圖像和單張圖像超分辨方法相比,本文的方法可以恢復更多的細節,並且在PSNR和SSIM兩個指標上比現有技術有顯著提升。

論文連結:https://arxiv.org/abs/1912.07849

代碼地址:https://github.com/YingqianWang/LF-InterNet

引言

光場相機可以提供場景的多個視圖,因此可在許多方面都有應用,例如深度估計,顯著性檢測、去遮擋等。然而,LF相機面臨著空間解析度和角度解析度之間的權衡。也就是說,它要麼可以提供低圖像解析度的密集角度採樣,要麼提供高分辨圖像的稀疏角度採樣。因此,研究者們已經做了許多努力,通過LF重構來提升角度解析度,或者通過LF圖像超解析度(SR)來提升空間解析度。在本文中,作者主要關注LF圖像的SR問題,即從其相應的低解析度(LR)子孔徑圖像(sub-aperture image, SAI)重建高解析度(HR)的 SAI。

圖像超分辨重構是計算機視覺中一個長期存在的問題。為了獲得較高的重建效果,SR方法需要從LR輸入中吸收儘可能多的有用信息。在單張圖像SR領域,可以通過充分利用圖像中的鄰域上下文(即空間信息)來取得較好的效果。相比之下,LF相機可從多個視圖捕獲場景。而不同視圖之間的角度信息,則可以用於進一步提升LF圖像的SR效果。

但是,由於LF複雜的4D結構,在LF中合併空間和角度信息是非常有挑戰性的。現有的LF圖像超分辨方法無法充分利用角度信息和空間信息,從而導致SR性能有限。具體地,有研究人員使用單個圖像SR方法分別對SAI進行超分辨,然後將其微調在一起以合併角度信息。也有研究者僅使用部分SAI來超分辨一個視圖,並且未合併另外廢棄視圖中的角度信息。

相反,有另外的研究人員提出了一種基於圖的方法來考慮優化過程中的所有角度視圖。但是,該方法無法充分利用空間信息,並且不如基於深度學習的SR方法。值得注意的是,即使所有視圖都被送到一個深層神經網絡,要實現卓越的性能仍然十分具有挑戰。

由於空間信息和角度信息在LF圖像中高度耦合,並採用不同的方式對LF圖像超分辨做出貢獻。因此,網絡難以直接使用這些耦合信息。為了有效地合併空間和角度信息,本文提出了用於LF圖像超分辨的空間角度信息交互網絡(即LF-InterNet)。

首先,作者專門設計了兩個卷積,以將空間和角度特徵與輸入的LF分離。然後,作者提出了LF-InterNet以重複交互並合併空間和角度信息。最後,作者做了多個消融實驗驗證了本文的設計。並將本文方法與最新的單一圖像和LF圖像SR方法,在6個公開LF數據集上進行了比較。結果顯示,本文的LF-InterNet顯著提升了PSNR和SSIM性能。

方法

空間-角度特徵解耦

光場圖像按照上圖左邊的方式進行排列可以組成陣列的SAI,將每幅陣列SAI相同空間位置的像素按照視角順序進行排列,則可以構成宏像素的圖像(macro-pixel image,MacPI)。本文所提出的空間信息特徵提取(SFE)與角度信息特徵提取(AFE)均以MacPI作為輸入,如下圖所示。

作者對光場宏像素圖進行了簡化示例,其中光場的空間解析度與角度解析度均為3*3。圖中塗有不同底色的3*3區域表示不同的宏像素,每個宏像素內的3*3標有不同的符號(十字、箭頭等),表示其屬於不同的視角。然後作者分別對兩種特徵提取器進行了定義。AFE是kernel size=A*A,stride=A的卷積;SFE是kernel size=3*3,stride=1,dilation=A的卷積。注意,將AFE應用於MacPI時,只有單個MacPI內的像素參與卷積運算,而不同像素之間信息不互通。同理,將SFE應用於MacPI時,只有屬於相同視角的像素參與卷積運算,而屬於不同視角的像素不互通。因此,AFE和SFE可以分別提取光場的角度信息和空間信息,實現信息的解耦。

網絡設計

上圖是作者構建的LF-InterNet網絡,該網絡主要分為三個部分,特徵提取、空間角度特徵交互、特徵融合重構。

特徵提取:將上述的AFE與SFE兩種特徵提取器應用於輸入的光場MacPI時,可以分別提取光場的角度特徵與空間特徵。

空間角度特徵交互:用於實現空間角度特徵交互的基本單元為交互塊(Inter-Block)。該文將4個交互塊級聯構成了一個交互組(Inter-Group),再將4個交互組級聯構成網絡的交互部分。如圖4(b)所示,在每個交互塊中,輸入的空間特徵與角度特徵進行一次信息交互。交互上是相互的,一方面角度特徵上採樣A倍後與空間特徵進行級聯,而後通過一個SFE與ReLU實現角度信息引導的空間特徵融合;另一方面,空間特徵通過AFE卷積提取新一輪的角度特徵,並與輸入的角度特徵進行級聯,而後通過一個1*1卷積與ReLU進行角度特徵的更新。空間特徵分支與角度特徵分支均採用局部殘差連接。

特徵融合構建:網絡的每個交互組輸出的空間特徵與角度特徵分別進行級聯,而後通過bottleneck模塊進行全局特徵融合。如圖4(c)所示,在bottleneck模塊中,角度特徵首先通過1*1卷積與ReLU進行通道壓縮,而後通過上採樣與空間特徵進行級聯。融合得到的特徵通過SFE進行通道擴增,而後通過光場結構reshape為陣列的SAI形式,最後通過pixel-shuffle層與1*1卷積層輸出高解析度光場SAI。

實驗

作者首先介紹了數據集和實現的細節,然後進行了消融實驗。最後,將LF-InterNet與最新的LF圖像SR和單圖像SR方法進行比較。

數據集和細節

該文採用下表所示的6個公開數據集進行訓練與測試。訓練時,會把每張SAI分割成64*64的大小,生成一個LR patches。網絡訓練採用L1 loss,數據增強採用了翻轉和旋轉。評價指標採用PSNR和SSIM。算法是使用pyTorch實現,已開源。針對2倍和4倍的超分辨,輸入光場的角度解析度為5*5,LF-InterNet的通道數設為64。

消融實驗

空間信息和角度信息

通過表格2可以看出,空間信息和角度信息對於超分辨的提升均有幫助。且不能僅單獨使用角度信息,空間信息對於超分辨性能的提升更有益。而本文提出的SFE和AFE對於信息的解耦可以進一步提升SR性能。

特徵交互組的數量

可以看出,如果沒有特徵交互,效果較差。而隨著特徵交互組數量的增多,效果變得越來越好。

角度-空間上採樣方式 & 角度解析度

表格4可以看出,nearest、bilinear相較於pixel shuffling的採樣方式,均不夠好。表格5可以看出,2倍和4倍的超分辨重構效果均隨著角度解析度的增加而提升。

算法對比

本文在6個公開數據集上將LF-InterNet與單圖超分辨算法VDSR、EDSR、RCAN、SAN、SRGAN、ESRGAN以及光場圖像超分辨算法LFBM5D,GB,LFSSR,resLF,以及LF-ATO進行了比較,結果如下表格所示,本文算法是目前的SOTA。

視覺上的效果以及性能對比

通過視覺上的對比,本文算法可以更好的保持紋理和細節信息。且從模型參數量和FLOPs數上,性能是明顯優於LF-ATO算法。

結論

本文提出了空間-角度信息交互的光場圖像超分辨網絡(LF-InterNet),首先設計了空間特徵提取器與角度特徵提取器分別提取光場圖像的空間與角度特徵,而後構建LF-InterNet對兩類特徵進行漸進式交互融合。實驗驗證了該文算法的有效性,達到了目前的SOTA。

相關焦點

  • OEE封面 |【上海交大施聖賢團隊】多尺度特徵的光場圖像超解析度方法
    這種設計使得光場相機能夠同時捕獲空間中光線的位置和角度信息,因此,光場相機可利用記錄的4D光場信息對光場進行渲染從而實現先成像後聚焦的能力。微透鏡陣列的存在使得光場相機能夠記錄視差,這為3D 測量和3D 重建應用提供了新的可能性。作為新一代成像設備,光場相機已逐漸被廣泛應用於工程測試領域,如粒子圖像測速技術、火焰三維溫度場測量以及物體三維形貌測量等。
  • 我校桑新柱教授團隊「離屏空間懸浮裸眼3D光場顯示」科研成果亮相...
    我校桑新柱教授團隊的科研成果「離屏空間懸浮裸眼3D光場顯示」應邀參加了科技創新新技術新產品展,引起廣大觀眾的興趣和關注。中國科協黨組書記懷進鵬、北京市長陳吉寧、市科委主任許強等蒞臨參觀,讚賞創新性強、呈現效果好、把科幻變為現實。
  • 陳黎明教授聯合中科院專家首次實現超分辨的X射線鬼成像
    而自1895年倫琴發現X射線以來,成像的方法並沒有根本上的改變,都是採用直接投影到面探測器,通過累計帶有物體信息的光子來展現出一定灰度分布的技術,因此這種方式的成像效率很低,不僅難以大幅度地降低成像所需劑量,而且解析度受光源尺寸及探測設備分辨力的限制,成為制約傳統成像方法的兩大相互牽制的瓶頸問題。
  • 基於CNN的單一圖像超分辨(SISR)方法總結
    此外,這項工作也嘗試將不同SR倍率的圖像混合在一起進行訓練,訓練得到的單一模型可以解決不同SR倍率的超分辨問題。LapSRN參考了傳統圖像處理方法的Laplacian金字塔結構,在特徵提取網絡中逐次放大輸入的LR圖像,每次放大後將在該尺度提取出的殘差特徵疊加到圖像重建分支的圖像上,構建出該尺度的圖像超分辨結果。這樣的結構可以同時輸出不同尺度的超分辨圖像。
  • 超分辨螢光輔助衍射層析成像揭露細胞器相互作用全景
    超分辨螢光成像技術的出現極大的推動了現代生命科學對細胞內新結構和新的動態過程的研究。然而,受限於較寬的發射光譜及光毒性,其僅能對有限幾種螢光標記同時成像,難以用於細胞內不同細胞器間複雜代謝過程的研究。電子顯微鏡雖然具有更全面及高解析度的成像能力,但不能對活細胞進行動態成像。即使在活細胞的超分辨螢光成像中,依然也需面對螢光漂白效應對三維成像速度、成像總時程的限制。
  • AI驅動的超分辨技術落地實踐
    近年來,隨著深度學習技術的快速發展,基於AI的超分辨技術在圖像恢復和圖像增強領域呈現出廣闊的應用前景,受到了學術界和工業界的關注和重視。但是,在RTC視頻領域中,很多AI算法並不能滿足實際場景下的應用需求。本文將著眼於AI技術從研究到部署的落地問題,分享超分辨技術在RTC領域落地應用所面臨的機遇與挑戰。
  • 【Light在線】問答實錄:超分辨成像與單細胞分選技術
    問:想從應用的角度了解有關STED幾點:(1)精度問題:XY解析度,Z軸解析度各能達到多少nm,10nm?(2)想用來做3D活體成像,其光對活體損傷性,以及成像速度,對比下要選擇那種超分辨技術,了解到還有MINFLUX,結合了STED和PALM。
  • 速度、準確率與泛化性能媲美SOTA CNN,Facebook開源高效圖像...
    研究者在最初用於卷積神經網絡的現有研究基礎上進行了調整與改進,並提出了一種基於蒸餾 token 的新型蒸餾流程,它的作用與 class token 相同,不過其目的在於複製教師網絡估計的標籤。實驗結果表明,這種特定 transformer 策略大幅度優於 vanilla 蒸餾方法。蒸餾流程如下圖所示。
  • 潘雷霆:2014年諾貝爾化學獎-超分辨光學成像小談
    若螢光產生過程是多光子吸收過程,則可激發出螢光的光斑區只能是中間的大光強區,此時簡單有效的實現了超分辨螢光成像,最終通過掃描獲得超分辨圖像。該方法優點是激發光源是長波長光,光毒性小,穿透能力強,不過容易造成熱損傷。目前最成功的應用是雙光子掃描螢光顯微鏡(注意不是雙光子掃描共聚焦顯微鏡),主要應用在腦部神經活動研究,因為較好的穿透深度。
  • 深度學習之圖像超分辨重建技術
    圖9 RAISR在2x上採樣率時與SRCNN, A+等超分辨算法的技術指標對比左圖為PSNR-runtime指標,右圖為SSIM-runtime指標【4】 結語超分辨重建在醫學影像處理、壓縮圖像增強等方面具有廣闊的應用前景,近年來一直是深度學習研究的熱門領域
  • NBT|新型光場顯微鏡高速記錄大腦神經元活動和血流的快速動態變化
    其特點在於可以在相機的單次曝光瞬間,記錄來自物體不同深度的信號,通過反卷積算法重構出整個三維體,實現快速體成像,在線蟲、斑馬魚幼魚等小型模式動物上已獲得初步應用。首先,重構的結果會出現失真。其次,現有光場顯微成像技術缺乏光學切片能力,無法對較厚組織,比如小鼠的大腦進行成像。讓光場顯微鏡具有共聚焦顯微鏡一樣的光學切片能力,濾除大樣品中焦層之外的背景信號來提高信噪比,是提高成像質量、可廣泛應用的關鍵所在。
  • 稿件速遞|超分辨螢光偏振成像
    該技術利用一個旋轉半波片來調製激發光的偏振方向,並結合稀疏反卷積進行偏振解調製,從而提升螢光偶極子成像的空間解析度和取向角度解析度。為了驗證這一技術與SIM的廣泛兼容特性,研究人員測試了多種商用SIM系統及自主搭建的SIM平臺,以及2D-SIM、3D-SIM、TIRF-SIM成像能力,成功提取螢光分子的偶極子方位信息與超分辨結構信息。同時,研究人員進行了大量的生物學實驗來證明pSIM廣泛的適用性,如λ-DNA、BAPE細胞和小鼠腎組織中的肌動蛋白絲、肌動蛋白和肌球蛋白之間的相互作用,以及中GFP染色的U2OS活細胞微管。
  • 神策分析重構信息架構,視覺、易用性等全面升級
    首頁 > 傳媒 > 關鍵詞 > 神策最新資訊 > 正文 神策分析重構信息架構,視覺、易用性等全面升級
  • 浙江大學阮智超課題組:空間微分器——亞波長厚度全光模擬運算
    研究團隊通過構建空間耦合模理論,設計並在實驗上實現了一種基於金屬表面等離激元的空間光場微分器,能夠在光的反射過程中,實時地對光場的空間分布進行微分模擬運算。隨著信息技術的迅猛發展,對信息處理性能的需求不斷提高。與傳統電子器件的信息處理方式相比,光學信息處理技術憑藉其超快速、大帶寬、大通量和低損耗等優勢,已經逐漸發展成為一種重要的信息處理手段。
  • 信息維度與互動設計原理
    結論 新型信息維度影響下的互動設計原理與方法,將交互內容、信息功能、傳媒介質的互動設計元素進行抽象本質的分析,從信息升維與信息降維角度,闡釋由交互載體、功能、內容三要素構成的新的人機互動範式,與信息維度的全息映射轉化關係。
  • 多源空譜遙感圖像質量改善問題之討論
    究其原因,一方面是有限的空間解析度會導致純像元(稱為端元,endmember)光譜混合,使得部分像素的光譜曲線混合了多種端元物質,進而影響高光譜圖像的辨識性能;另一方面,對礦物勘探、城市精細製圖、弱小目標檢測等應用而言,需要高空間解析度的高光譜圖像,而有限的空間解析度嚴重影響了高光譜成像在遙感技術中的應用。
  • 浙大科學家提出三維光學超分辨成像新方法
    2014年的諾貝爾化學獎頒發給了超分辨螢光顯微技術的發明者,這一技術利用特定的螢光染料實現光學的超分辨,突破衍射極限,到達200納米以下的尺度。科學家們可以通過光學顯微鏡,看到細胞的精細結構。然而,這項技術也有自己的弊端,比如對螢光染料有特殊的擦除或者開關效應要求,或需要獲取成百上千張原始圖像以重構超分辨圖像,因此成像時間較長。
  • 基於光子晶片的超分辨顯微鏡
    在這種方法中,整個照明光路都是使用光子晶片提供的(光傳輸、圖案生成和光束控制),這種晶片可以很容易地進行改造,允許任何標準顯微鏡獲取超分辨SIM圖像。該文章被發表在Nature Photonics。02背景介紹自從大約400年前胡克發現細胞(在一片軟木中)以來,光學顯微鏡一直是生物學發現的終極工具。
  • 點讚 | 空間微分器——亞波長厚度全光模擬運算
    針對這一挑戰,物理學系阮智超教授突破傳統光信息處理傅立葉變換的思路,通過構建空間耦合模理論[Ruan et al., 2014, Optics Letters, 39(12): 3587-3590],提出利用空間光場與金屬表面等離激元之間的耦合與幹涉,使得反射的光場對應於一階微分和積分的空間模擬運算[Ruan, 2015, Optics Letters, 40(4): 601-604