ICCV 2019 | RankSRGAN:排序學習 + GAN 用於超解析度

2021-02-25 我愛計算機視覺

單幅圖像超解析度重建旨在從一幅低解析度(LR)圖像重建或生成一幅高解析度(HR)圖像。近期基於CNN的SISR研究逐漸增多,主要分為兩類:一類是將SR視為重建問題,利用MSE作為損失函數以獲得高PSNR值;另一類方法是將SR轉換為圖像生成問題,以獲得更好的視覺質量。第二類方法能獲得更加逼真的重建圖像,該文就是研究這種感知SR方法。

感知SR方法面臨的最具挑戰性的問題是評估,依靠人類主觀判斷不可靠也不公平。為了解決這個問題,該文提出了許多與人類評價高度相關的無參考圖像質量評估(NR-IQA)指標,例如NIQE(相關係數0.76)和PI(相關係數0.83),PIRM2018-SR挑戰已成功使用了這些指標。但是這些NR-IQA指標大多數是不可微分的,例如它們包括手工特徵提取或統計回歸操作,因此無法用作損失函數來優化網絡。

為了使感知指標能用於優化網絡,進一步提高重建質量,作者提出了一個通用且可微分的模型--Ranker,該模型可以模擬任何NR-IQA指標,並提供明確的目標(作為損失函數)以優化感知質量。Ranker是一個孿生CNN,它通過學習排序方法來模擬感知指標。Ranker與標準的SRGAN模型一起形成一個新的感知SR框架--RankSRGAN(帶有Ranker的SRGAN)。所提出的框架還具有rank-content loss(內容排序損失),用訓練好的Ranker來度量輸出圖像質量,這樣SR模型可以針對特定的感知指標穩定地優化。圖1顯示了RankSRGAN的結果,它融合了SRGAN和ESRGAN的圖像效果並獲得了更好的NIQE得分(NIQE值越小越好,PSNR值越大越好)。

作者進行了全面實驗證明了所提出方法的有效性。總結本文的貢獻有三點。(1)提出了一個通用的感知SR框架--RankSRGAN,該框架可以利用不可微分的感知指標優化生成器,並實現了最先進的性能。(2)本文首次利用其他SR方法的結果來構建訓練數據集。所提出的方法結合了不同SR方法的優勢,並產生了更好的結果。(3)所提出的SR框架具有高度的靈活性,並且在構造的不同數據集,感知指標和損失組合的情況下產生多種結果。

圖 1 RankSRGAN與其它感知SR方法的比較

RankSRGAN是在基於GAN的SR方法上建立的,它包含一個生成器和一個判別器。判別器網絡區分是真實圖像還是超解析度重建的結果,訓練生成器網絡來愚弄判別器。為了獲得更自然的紋理,作者通過利用感知指標的先驗知識為標準SRGAN增加額外約束,以提高輸出圖像的視覺質量。RankSRGAN的整體框架如圖2所示,主要包括三個階段。

圖 2 RankSRGAN的整體框架

階段一:利用感知度量生成不同SR方法的重建圖像,獲得rank數據集。首先在公開的SR數據集上生成不同SR方法的超解析度重建圖像;然後在生成的圖像上應用選定的感知指標(例如NIQE),之後選出內容相同的圖像組成圖像對(即相同圖像經不同SR方法得到的HR圖像組成的圖像對),並根據感知指標計算出的圖像質量得分對圖像對進行排序。最後就獲得了成對圖像和對應的排序標籤(標籤的分配規則是:最好的NIQE值標記為1,即重建質量好的、NIQE值低的用1標記)。

階段二:訓練Ranker。Ranker採用孿生網絡結構來學習感知指標的行為,Ranker具有兩個相同的網絡分支,其中包含一系列的卷積、LeakyReLU激活、池化和全連接層。在特徵提取器之後使用全局平均池化GAP層,這樣網絡可以擺脫輸入大小的限制。為了得到排序得分,使用一個全連接層作為回歸器來量化排序結果。注意這裡並不是預測感知指標的實際值,而是只關注排名信息。最後,兩個分支的輸出構成margin-ranking loss,這樣我們可以計算梯度並應用反向傳播來更新整個網絡的參數。訓練好的Ranker應該具有根據圖像感知得分對圖像進行排序的能力。

階段三:訓練重建網絡RankSRGAN,判別器D的損失與SRGAN中的相同,生成器G的總損失包含三部分:感知損失、對抗損失和rank-content loss。其中rank-content loss由階段二用訓練好的Ranker給出,是本文方法新引入的損失函數,能使標準SRGAN生成視覺逼真的圖像。

相關焦點

  • lightGBM用於排序(Learning to Rank )
    為什麼需要使用機器學習的方法來進行排序  對於傳統的排序模型,單個模型往往只能考慮某一個方面(相關度或者重要性),所以只是用單個模型達不到要求。搜尋引擎通常會組合多種排序模型來進行排序,但是,如何組合多個排序模型來形成一個新的排序模型,以及如何調節這些參數,都是一個很大的問題。
  • 超解析度 | 綜述!使用深度學習來實現圖像超解析度
    近年來,目睹了使用深度學習技術的圖像超解析度的顯著進步。文中將現有的使用深度學習方法解決圖像超解析度問題的研究工作主要分成三個部分:1.supervised SR(有監督學習的圖像超解析度)2.unsupervised SR(無監督學習的圖像超解析度)3.domain-specific SR (特定應用領域的圖像超解析度)
  • 基於深度學習的圖像超解析度技術
    繼昨天對微信掃碼中的圖像超解析度技術詳細介紹後,為了讓大家更充分的認識並學習圖像超解析度,今天給大家介紹一篇綜述性文章,作為「圖像超解析度」系列文章的第2篇,本文從problem settings、數據集、performance metrics、SR方法、特定領域應用以結構組件形式等方面總結了圖像超解析度,同時,討論了超分方法的優點與限制、存在的問題和挑戰以及未來的趨勢和發展方向。
  • 基於深度學習的超解析度圖像技術一覽
    先說監督SR如今已經有各種深度學習的超解析度模型。這些模型依賴於有監督的超解析度,即用LR圖像和相應的基礎事實(GT)HR圖像訓練。雖然這些模型之間的差異非常大,但它們本質上是一組組件的組合,例如模型框架,上採樣方法,網絡設計和學習策略等。從這個角度來看,研究人員將這些組件組合起來構建一個用於擬合特定任務的集成SR模型。
  • 這個模型腦補能力比GAN更強,ETH提出新型超解析度模型SRFlow
    近日,來自蘇黎世聯邦理工學院計算機視覺實驗室的研究者提出了一種新的超解析度模型 SRFlow。該模型是一種基於歸一化流的超解析度方法,具備比 GAN 更強的腦補能力,能夠基於低解析度輸入學習輸出的條件分布。
  • 推薦系統中的Learning to Rank
    摘要本文涉及learning to rank,即構建排序對象的模型或函數。learning to rank對於文檔檢索、協同過濾和許多其他應用非常有用。有一些將對象pair作為學習實例的learning to rank的方法被提出。本文將它們稱為pairwise方法。儘管pairwise具有優勢,但它忽略了排序是對象列表的預測任務。
  • ICCV 引用量最高的10篇論文!何愷明兩篇一作論文:Mask R-CNN和PReLU,Facebook佔據四席!
    這個排名是依據過去五年發表研究的數據(覆蓋2015-2019年發表的文章),並包括截止2020年6月在谷歌學術中被索引的所有文章的引用量。眾所周知,CV領域的三大頂會就是:CVPR、ICCV和ECCV。
  • excel不改變數據位置進行排序,rank函數可以幫到你
    我們在實際工作中,當我們使用excel表格處理大量數據的時候,有時候我們需要對數據進行排序,數據排序我們通常會使用到excel自帶的排序工具,這個工具方便快捷,但是使用排序工具對數據進行排序,會改變數據的位置,假如我們不想打亂數據的位置,又想對數據的大小進行排序操作,我們該如何處理
  • 用於單圖像超解析度的對偶回歸網絡,達到最新SOTA|CVPR 2020
    作者 | Yong Guo, Jian Chen等譯者 | 劉暢通過學習從低解析度(LR)圖像到高解析度(HR)圖像之間的非線性映射函數,深度神經網絡在圖像超解析度(SR)任務上取得了較好的性能。具體而言,除了學習從LR到HR圖像的映射外,本文方法還學習了另外的對偶回歸映射,用於估計下採樣的內核並重建LR圖像,從而形成了一個閉環,可以提供額外的監督。更關鍵的是,由於對偶回歸過程不依賴於HR圖像,因此我們可以直接從LR圖像中學習。
  • 學界 | NTIRE2017奪冠論文:用於單一圖像超解析度的增強型深度殘差網絡
    (SR)問題,尤其是單一圖像超解析度(SISR)問題,在近幾十年中已經受到了廣泛的研究關注。論文連結:http://cv.snu.ac.kr/publication/conf/2017/EDSR_fixed.pdf摘要:近期關於超解析度(super-resolution)的研究已經隨著深度卷積神經網絡(DCNN)的發展而進步了。殘差學習的方法(residual learning )尤其能展現出其性能表現的提升。
  • 普通視頻轉高清:10個基於深度學習的超解析度神經網絡
    在 AlphaGo 對弈李世石、柯潔之後,更多行業開始嘗試通過機器學習優化現有技術方案。其實對於實時音視頻來講,對機器學習的研究已有多年,我們曾分享過的實時圖像識別只是其中一種應用。我們還可以利用深度學習來做超解析度。我們這次就分享一下用於超解析度的深度學習基本框架,以及衍生出的各種網絡模型,其中有些網絡在滿足實時性方面也有不錯的表現。
  • RANK函數:一招搞定,讓排名變得如此簡單
    今天函數哥要分享一個排名函數-rank函數。rank函數常被我們用於排位。rank函數的排名機制正序、倒序都可以從上圖中,細心的小夥伴已經看到了,相同數值的排名是並列的,而並不影響整體排名秩序。,非數值將被忽略;3)排序指令:用於指定數字大小位置的評定方式 (要麼從小到大,要麼從大到小):如果排序指令為 0 (零) 或被省略,則按照從大到小的評定方式來判定目標數值在數值列陣當中的位置;
  • ESRGAN:基於GAN的增強超解析度方法(附代碼解析)
    超解析度生成對抗網絡(SRGAN)是一項開創性的工作,能夠在單一圖像超解析度中生成逼真的紋理。這項工作發表於 CVPR 2017。但是,放大後的細節通常伴隨著令人不快的偽影。一些基於感知域信息驅動的方法已經提出來用於提升超解析度結果的視覺質量。例如,感知域的損失函數提出來用於在特徵空間(instead of 像素空間)中優化超解析度模型;生成對抗網絡通過鼓勵網絡生成一些更接近於自然圖像的方法來提升超解析度的質量;語義圖像先驗信息用於進一步改善恢復的紋理細節。 通過結合上面的方法,SRGAN 模型極大地提升了超解析度結果的視覺質量。
  • 科學家開發出新型超解析度顯微鏡平臺
    科學家開發出新型超解析度顯微鏡平臺 作者:小柯機器人 發布時間:2019/10/23 16:17:54 法國波爾多大學U.
  • Learning to rank基本算法小結
    最近工作中需要調研一下搜索排序相關的方法,這裡寫一篇總結,總結記錄一下幾天的調研成果。包括Learning to rank排序學習是推薦、搜索、廣告的核心方法。排序結果的好壞很大程度影響用戶體驗、廣告收入等。
  • Excel統計排名函數RANK
    置頂公眾號或設為星標,否則可能收不到文章關注後發送函數名稱,即可獲取對應教程個人微信號 | (ID:ExcelLiRui520)微信公眾號 | Excel函數與公式(ID:ExcelLiRui)微信服務號 | 跟李銳學Excel(ID:LiRuiExcel)本文關鍵詞:rank
  • Learning to Rank 小結
    一、學習排序(Learning to Rank)      LTR(Learning torank)學習排序是一種監督學習
  • TF - GAN入門:TensorFlow 2.0 的輕量級 GAN 庫
    【新智元導讀】LSTM的發明人、著名深度學習專家Jürgen Schmidhuber詳細論述了近30年前,即1990~1991年之間他和團隊進行的許多研究。他們的早期思想為當今的許多深度學習前沿研究奠定了基礎,包括 LSTM、元學習、注意力機制和強化學習等。
  • 驗證集評估可能是錯的,阿里,南大最新論文或推翻以往電商排序算法
    這種學習過程首先是尋找與查詢相關的一個小型的候選商品集合,然後在重排名階段決定候選商品的順序。這種重排名策略可以極大地減小組合空間,因此可以對候選項有全面的理解,以便找到適當的順序。Ai et al., 2019 提出的逐分組評分函數(GSF)框架也關注的是商品之間的影響力,其與重排名方法採用了同樣的設置。圖 1:誘餌效應的一個示例。
  • SRCliqueNet: 基於小波子帶共同學習的集團結構超解析度網絡
    圖1:基於小波子帶共同學習的Clique結構超解析度網絡的整體結構。2.2 特徵嵌入網絡特徵嵌入網絡中我們主要以clique block作為特徵提取主模塊,具體結構如圖2所示。相對於residual block和dense block,該模塊有更多的信息流,能更充分地利用各層的特徵。