美國東北大學提出MoNet,使用緊密池化緩解特徵高維問題

2020-12-05 機器之心Pro

近日,來自美國東北大學和美國信息科學研究所的研究者聯合發布論文《MoNet: Moments Embedding Network》,提出 MoNet 網絡,使用新型子矩陣平方根層,在雙線性池化之前執行矩陣歸一化,結合緊湊池化在不損害性能的前提下大幅降低維度,其性能優於 G^2DeNet。目前該論文已被 CVPR 2018 接收。

將圖像的局部表示嵌入成既具有代表性、又不受輕微噪聲影響的特徵,是很多計算機視覺任務中的重要一步。在深度卷積神經網絡(CNN)成功之前,研究人員使用手動的連續獨立步驟解決該問題。典型包括 HOG、SIFT、協方差描述子、VLAD、Fisher 向量和雙線性池化。儘管 CNN 是端到端地訓練的,但是它們可以被看作兩部分:卷積層負責特徵提取步驟,後面的全連接層是編碼步驟。現在已有多項研究探索用卷積嵌入方法替換全連接層,無論訓練採用兩段式還是端到端方式。

表 1. 不同神經網絡的二階統計信息對比。雙線性 CNN(BCNN)僅具備二階信息,沒有使用矩陣歸一化。改進後的 BCNN(iBCNN)和 G^2DeNet 都利用了矩陣歸一化,但是都受制於高維度,因為它們需要計算一個很大的池化矩陣的平方根。本論文提出的 MoNet,在新型子矩陣平方根層(sub-matrix square-root layer)的幫助下,可以直接歸一化局部特徵,同時,通過使用緊湊池化(compact pooling)替代全雙線性池化,可以大幅降低最後的表示維度。

雙線性 CNN 由 Lin et al. 首次提出,旨在池化不同空間位置的二階統計信息。雙線性池化已被證明在多項任務中有用,包括細粒度圖像分類、大規模圖像識別、分割、視覺問答、人臉識別和藝術風格重建。Wang et al. 提出,使用高斯嵌入層納入一階信息。實踐證明,歸一化方法對這些 CNN 的性能也很重要。研究者提出了兩種歸一化方法用於雙線性池化矩陣:對於

其中

表示局部特徵,一方面,由於 M 是正定對稱矩陣(SPD),Ionescu et al. 提出使用矩陣對數(matrix-logarithm)來將 SPD 矩陣從黎曼流行映射到歐氏空間,即

另一方面,Wang et al. 提出矩陣方冪(matrix-power)方法,將 M 非線性地擴展到

。兩項研究中,矩陣方冪的性能和數值穩定性都優於矩陣對數。此外,Li et al. 對矩陣方冪歸一化在解決通用大規模圖像識別問題上的優秀性能提供了理論支持。因此,本論文提出將矩陣方冪正則化整合進 MoNet 架構中。

圖 1. 論文提出的 MoNet 架構圖示。該架構使用論文提出的子矩陣平方根層,這使得在雙線性池化之前執行矩陣歸一化或進一步使用緊湊池化,在不損害性能的前提下大幅降低維度成為可能。

上述特徵編碼的一個重要缺陷是編碼後特徵的維度極高。由於張量相乘,最後的特徵維度是

請點擊輸入圖片

,其中 C 是最後一個卷積層的特徵通道數。即使在 C 相對較低的情況下,如 VGG16 中,C = 512,最後特徵的維度也超過 260K。該問題可通過隨機投影(random projection)、張量速寫(tensor sketching)和低秩屬性來緩解。但是,由於矩陣方冪歸一化層應用在池化矩陣 M 上,因此很難結合矩陣歸一化和緊湊池化來同時達到更好的性能和更低的最後特徵維度。

本論文使用同質填充局部特徵(homogeneous padded local feature)的張量積重寫了 G^2DeNet 的方程,使之對齊 BCNN 架構,以使高斯嵌入操作和雙線性池化解耦合。本論文沒有特別關注雙線性池化矩陣 M,而是推導出子矩陣平方根層,對(非)同質局部特徵上直接執行矩陣方冪歸一化。在新型子矩陣平方根層的幫助下,研究者利用緊湊池化逼近張量積,同時使維度更低。

本論文的貢獻有以下三方面:

利用實證矩矩陣(moment matrix)結合 G^2DeNet 和雙線性池化 CNN,並將高斯嵌入與雙線性池化解耦合。提出新型子矩陣平方根層,在雙線性池化層之前直接對特徵執行歸一化處理,從而利用緊湊池化降低表示的維度。利用矩陣反向傳播推導出子矩陣平方根層的梯度,這樣 MoNet 架構可以進行協同優化。

MoNet

MoNet 網絡的架構概述如上述圖 1 所示。在本節中,我們將詳述每個模塊的設計。

對於輸入圖像 I,ReLU X 之後最後一個卷積層的輸出由整個空間位置 i = 1, 2, . . . , n 上的局部特徵 x_i 組成。接著,我們將其映射到齊次坐標,方法是添加額外的值為 1 的維度,並把所有元素除以

。之後,應用一個適當的子矩陣平方根歸一化。最後,使用一個緊密雙線性池化層池化整個空間位置中所有 n 個特徵,並在最後的全連接層之前進行逐元素的平方根正則化和

歸一化。

表 4:細粒度分類上的實驗結果。雙線性和 TS 分別表徵全雙線性池化和 Tensor Sketch 緊密池化。每欄中的最佳表現標為紅色。

論文:MoNet: Moments Embedding Network

論文連結:https://arxiv.org/abs/1802.07303

近期雙線性池化作為一種特徵編碼層被提出,可在深度網絡的卷積層之後使用,提升在多個視覺任務中的表現。與傳統的全局平均池化層或全連接層相比,雙線性池化以平移不變式的形式收集二階信息。但是,這一池化層家族的一個嚴重弊端是其維度爆炸。為解決這一問題,已探索了緊密的近似池化方法。另外,最近成果表明,通過矩陣歸一化來調整不穩定的較高階信息可獲得顯著的性能提升。然而,緊密池化與矩陣歸一化的結合至今未被探索。

在本論文中,我們通過實證矩矩陣結合了雙線性池化層與全局高斯嵌入層。此外,我們提出一個全新的子矩陣平方根層,藉助此層,可以直接歸一化卷積層的輸出,並通過現成的緊密池化方法來緩解維度問題。我們在三個廣泛使用的細粒度分類數據集上進行了實驗,實驗表明,我們提出的 MoNet 架構相比 G^2DeNet 架構有著更好的表現。與緊密池化技術結合使用時,本方法可以用維度數降低了 96% 的編碼特徵獲得可比的表現。

相關焦點

  • 池化融資平臺 盤活企業流動資產
    如何讓企業閒置資產「轉起來」,提高資金使用效率,進而實現「去槓桿、降成本」,成為浙商銀行在產品創新時著力思考和應對的問題,並促使浙商銀行進行有益探索,取得初步成效。  探尋「去槓桿」最佳途徑  「浙商銀行通過建立湧金票據池、出口(應收帳款)池、資產池,有效解決了這個難題。」
  • 中科大學者實現高效的高維量子隱形傳態
    中科大學者實現高效的高維量子隱形傳態】記者從@中國科學技術大學 獲悉,該校郭光燦院士團隊李傳鋒、柳必恆研究組近期利用6光子系統,實現了高效的高維量子隱形傳態。實驗結果表明,量子幹涉可見度在45小時內保持在98%,高維量子隱形傳態保真度達59.6%,為構建高效的高維量子網絡打下堅實基礎。
  • 美國東北和五大湖區
    文章內容整理自本公號連載《美國是怎樣煉成的》(簡稱《美國論》)將發布的「地緣影響」部分 # 美國的東北地區和五大湖區(有時候也合稱美國東北部)是美國的工業基礎和商業發源地。隨南北戰爭北方取得對南方的決定性勝利,這裡更成為美國政治、經濟和文化重心,在美國歷史上有著舉足輕重的地位。該區域也是美國和加拿大關聯最緊密的部分。
  • 東北大學斬獲國際遺傳工程機器設計競賽金獎
    11月5日,在第十六屆國際遺傳工程機器設計競賽(iGEM)上,東北大學NEU-CHINA團隊斬獲金獎及最佳海報提名獎。  國際遺傳工程機器設計競賽由美國麻省理工學院發起,是全球合成生物學領域的國際大學生頂級科技賽事。
  • 學界| 新型池化層sort_pool2d實現更快更好的收斂:表現優於最大...
    sort_pool2d,表現優於最大池化層,同時解決了最大池化層無法使用來自多層激活函數信息的問題,以及反向傳播只會提升最大池化的激活函數的問題。作者還給出了該池化層的代碼實現。作者表示,介紹此研究的論文將會提交至 arXiv 上。 現在的最大池化層(應用於當前幾乎所有頂級的計算機視覺任務,甚至是一些 NLP 任務中)大約去掉了 75% 的激活函數。本文試圖設計一種新型池化層 sort_pool2d,擺脫與之關聯的一些問題。
  • 中國科學家實現相距一公裡的高維量子糾纏分發
    IT之家3月20日消息 據央視新聞消息,中國科學技術大學郭光燦院士團隊近日在量子通信實驗方面取得重要進展。該團隊李傳鋒、黃運鋒研究組與暨南大學李朝暉教授、中山大學餘思遠教授等合作,首次實現公裡級三維軌道角動量的糾纏分發。
  • 天蠍3.0項目:實現真正的資源解耦與池化
    天蠍3.0項目:實現真正的資源解耦與池化 天蠍3.0項目:實現真正的資源解耦與池化 2016-09-26 14:57:57  來源:貿訊網搶沙發 2016-09-26 14:57:57  來源:貿訊網 摘要:  雲計算推進了網際網路行業的飛速發展,同時也對傳統伺服器架構提出了挑戰。
  • NIPS 2018 | 哪種特徵分析法適合你的任務?Ian Goodfellow提出顯著...
    本論文提出了一種基於隨機化檢驗(randomization test)的可行方法來評估解釋方法的性能。作者在神經網絡圖像分類任務上分析了一些顯著性方法。實際上,本論文提出的方法論適用於任何解釋方法。而且本文提出的隨機化檢驗是很容易實現的,可以幫助人們評估某個解釋方法對手頭任務的適用性。
  • 走進高維空間——概率論與高維空間的深層次聯繫
    歡迎來到高維繫列的第四部分,在這裡我們將探索高維空間中一些奇怪而又令人匪夷所思的現象。開始之前,我們一起複習一下前三個部分的一些重要結論:第一部分,我們得出,在無限維空間中球體的體積都集中在邊界上,我們只能知道這個結論,但是無法想像!走進高維空間——體驗難以置信的感覺第二部分的結論是,在高維空間中,內切於求內的立方體不完全在球體以內。
  • 美國留學東北大學本科專業有哪些呢?
    美國留學美國東北大學本科專業有哪些呢?這個問題對於很多準備前往東北大學讀本科的同學而言十分的重要,下面就是小編對此的相關介紹,希望對您有所幫助。美國東北大學本科專業名單:一、商學類專業:會計Accounting統計學statistics國際商業管理IBMS精算科學 Actuarial Science管理科學management市場營銷 marketing生產管理Production Management
  • 我國科學家實現相距一公裡的高維量子糾纏分發
    【來源:央視新聞客戶端】記者從中國科學技術大學獲悉,該校郭光燦院士團隊在量子通信實驗方面取得重要進展。該團隊李傳鋒、黃運鋒研究組與暨南大學李朝暉教授、中山大學餘思遠教授等合作,首次實現公裡級三維軌道角動量的糾纏分發。該研究成果於近日發表在國際知名光學期刊Optica上。
  • 光波和物質與高維哲學基本陽性量的關係
    導語:討論現代物理繞不開光,同樣討論高維哲學也離不開光,光作為哲學陰陽二元的一極包含很多特徵;光是人類認知世界的介質,光攜帶的外部信息被大腦接受引發了人類各種思考;光明成為人類文明擴張延續最偉大的正能量;1657年費馬發現,光在任何均勻介質中都走最短路徑,並由此推導出幾何光學三定律
  • 高維空間可能真的存在,科學家發現了一些高維空間的疑似證據
    隨著對宇宙的研究逐步深入,人們發現了宇宙遠比想像中的複雜,於是越來越多的人都在開始懷疑,在宇宙中除了我們熟悉的三維空間以外,還存在著其他未知的空間,因此,科學家們提出了一些有關高維空間的理論。在此之後提出的「M理論」,又增加了一個新的維度,這個維度將「超弦理論」中除了時間以外的所有維度都包含其中。該理論認為,我們所處的宇宙空間在這個新提出的維度裡,只是眾多「宇宙膜」中的一員,也就是說在我們所處的三維空間之外,還有很多其他的三維空間,而且在一般情況下,這些空間是不會互相影響的。
  • 港城大提出任意比例的上採樣方法, 實現自由三維點雲稠密重建
    From: 香港城市大學 編譯: T.R  近日,來自香港城市大學的研究人員提出了一種基於線性近似的網絡模型MAPU-Net  近日,來自香港城市大學的研究人員提出了一種基於線性近似的網絡模型 MAPU-Net ,可以在一次訓練後對輸入的稀疏點雲實現任意「放大比例」的上採樣。這種方式在一次訓練後可以應用於多個尺度的上採樣過程中,並能夠生成較為精細的幾何結構,具有更強的可解釋性和更好的內存效率。
  • 哈工大提出基於光流估計與光照不一致監督的人臉正向化模型
    2 方法人臉正向化本質上是人臉圖像的旋轉變化,本文使用光流場來構建側臉-正臉之間的特徵對應關係,光流估計網絡使用FlowNetSD[1],正向光流場(Forward Flow Field)表徵側臉到正臉的特徵轉換,反向光流場(Reverse Flow Field)表徵正臉到側臉的特徵轉換。
  • 如何使用特徵提取技術降低數據集維度
    如果這些特徵數量與數據集中存儲的觀察值數量相差無幾(或者前者比後者更多)的話,很可能會導致機器學習模型過度擬合。為避免此類問題的發生,需採用正則化或降維技術(特徵提取)。在機器學習中,數據集的維數等於用來表示它的變量數。
  • 中國科大實現高效的高維量子隱形傳態
    央廣網合肥12月20日消息(記者劉軍 通訊員桂運安)記者從中國科學技術大學獲悉,該校郭光燦院士團隊李傳鋒、柳必恆研究組近期利用6光子系統,實現了高效的高維量子隱形傳態。為了實現高維量子通信,李傳鋒、柳必恆等人從2016年開始採用光子的路逕自由度編碼,解決路徑比特相干性問題,製備出高保真度的三維糾纏態;解決路徑維度擴展問題,實現了32維量子糾纏態
  • 科學家實現高效高維量子隱形傳態
    本報訊(通訊員桂運安)中國科學技術大學教授、中國科學院院士郭光燦團隊李傳鋒、柳必恆研究組近期利用6光子系統,實現了高效的高維量子隱形傳態。為了實現高維量子通信,李傳鋒、柳必恆等人從2016年開始採用光子的路逕自由度編碼,解決路徑比特相干性問題,製備出高保真度的三維糾纏態;解決路徑維度擴展問題,實現了32維量子糾纏態
  • 英方軟體助力安信證券打造「多對多池化」高可用集群技術方案
    02 「多對多池化」高可用集群技術實踐 安信證券通過了解英方軟體高可用集群方案可以實現備端伺服器的池化管理,具備資源池伺服器可迭代接管的功能,於是雙方通過技術合作,在安信證券應用場景下,由安信證券提出了「多對多池化」的概念,