哈達瑪矩陣指導下的在線哈希學習新方法

2020-12-06 AI 科技評論

者 | 蔣寶尚

編輯 | 叢 末

越來越多的數據流,讓視覺相似度檢索在應用場景中越來越難,例如微信每天都會產生十幾億甚至上百億的流數據網絡圖片,給相似圖片搜索帶來了挑戰。而視覺哈希編碼技術逐漸成為實現相似性檢索的有效途徑。

近日,廈門大學紀榮嶸關於在線哈希學習新方法的論文被發表在 IJCV 上,在論文中紀教授引入哈達瑪矩陣指導哈希函數的學習,即吸取了傳統在線哈希方法的優點,也最大程度上降低了精度損失。另外,對比當前最先進的七種技術,引入哈達瑪矩陣的在線哈希學習都有一定程度的性能提高。

論文地址:

https://arxiv.org/pdf/1905.04454.pdf

最近鄰搜索在搜索領域一夫當關,作為一種找尋最優點的思路,在很多領域中都有很廣泛應用,如:計算機視覺、信息檢索、數據挖掘、機器學習,大規模學習等。

但最近鄰搜索有兩個關鍵問題:1、特徵維度較高;2、數據量較大。例如,簡單的窮盡搜索,需要將原始數據從存儲中加載到內存,這將面臨非常高的時間複雜度,成為現實應用中所必須解決需要解決的一個瓶頸問題。

為解決這個問題,近年來,在實際應用中出現了一些時間複雜度為次線性的、快速有效的最近鄰搜索方法,例如KD樹、Ball樹、Metric樹。但基於樹的方法需要的存儲空間往往很大,在某些時候存儲這些索引樹的空間甚至超過存儲數據本身所需的存儲空間。

不同於基於樹的索引將數據空間進行遞歸的劃分,哈希類算法重複的對整個數據空間進行二類劃分,同時對於每一個劃分進行一次二值編碼。

即哈希算法將輸入數據映射到一個離散的漢明空間,每一個數據點用一串二值碼表示。漢明距離可以通過異或操作進行快速計算,因此使用哈希碼對資料庫進行窮盡檢索,時間複雜度也能滿足應用要求。

所以,哈希算法成為解決最近鄰搜索的希望之一。而最近鄰搜索思路在視覺相似度領域的應用也推動著哈希算法解決視覺相似性難題。

更進一步,網絡數據流源源不斷地產生使得資料庫急劇增長,在線哈希學習成為減少視覺哈希編碼複雜度不可或缺的技術途徑。

吸取了傳統在線哈希方法的優點,廈門大學的紀榮嶸,林明寶兩位老師,引入哈達瑪矩陣在線學習哈希函數,通過用Sylvester方法構造的正交二進位矩陣,其在一定程度上克服了強約束、需要大量的訓練批次的困境。

此項工作日前已經發表在International Journal of Computer Vision( 國際計算機視覺雜誌)期刊上。作為人工智慧領域最重要的頂級學術期刊之一,IJCV 每年出版的文章數量極小,但卻擁有較高的影響因子(5年影響因子為12.389)。

方法介紹

根據紀教授在論文中介紹,這項方法被稱為:哈達瑪矩陣指導下的線哈希學習。旨在解決解決大規模流數據問題。方法的創新點在於引入哈達瑪矩陣,矩陣中的每一列都作為目標代碼來指導哈希函數的學習。

註:哈達瑪矩陣,英文為Hadamard Matrix,定義是由+1和-1元素構成的且滿足Hn*Hn』=nI(這裡Hn』為Hn的轉置,I為單位方陣)n階方陣。

不同於傳統的方法,該方案進行哈希編碼的時候僅僅只需要利用當前階段的流數據,因此學習效率在每一階段都是恆等的。為此,作者把具有正交性質的哈達瑪矩陣作為同一類流數據的目標編碼,目標編碼進一步作為感知機的虛擬類別來學習分類器。

另外,需要的訓練設備要求較低,對於內存的需求僅需要滿足一對數據的大小盡可,基於數據對的訓練方式又極大壓縮了訓練時間的消耗。

為了釋放強約束的需要,作者將哈達瑪矩陣的每一列作為每個類標籤的目標碼,它本質上滿足哈希碼的幾個期望性質。由於目標編碼是已知的,不需要去設計很複雜的約束性條件。相比於目前已有的最佳方法,所題方案以更少的訓練時間,在不同的數據集(CIFAR-10, Places205, MNIST、NUS-WIDE四個經典數據集)下獲得10%~30%的精度增長,該技術可應用於大規模城市視覺目標布控、特定網絡產品查找等。

方法細節

在線哈希框架:數據到來→在漢明空間中學習目標碼→學習獨立的二進位分類器進行預測

哈希學習的目的是學習一系列哈希編碼,使得期望的鄰域結構被保留。通過用一組哈希函數對數據集進行投影來達到此目標。

註:B是學習目標,即哈希編碼,H(x)是哈希函數,X是數據集,sign 是符號函數,W是投影矩陣。

定義完學習目標之後,作者使用核技巧來利用線性模型的優勢,同時使它們能夠捕獲非線性數據模型。具體而言,通過基於錨點的核函數將原始空間中的數據映射到特徵空間,然後數據Xi有了一種新的表示,如下:

註:下標m,代表有m個錨點。

為了獲得這些錨,作者假設了在初始階段有m個數據點可用。因為在收集到m個數據點之前,學習過程不會開始。所以這m個數據點被認為是內核技巧中使用的m個錨。另外,在核函數方面,作者使用了高斯徑向基函數核。例如:

註:η2 被定義為在學習過程中需要調整的寬度。

整個算法的流程如上圖所示。其中,W-ensemble為:

註:π^t是可調參數,作者設置 π^t=1/T

實驗

在實驗部分,作者使用了幾種最先進的方法進行了大規模的圖像檢索實驗,用到了四個廣泛使用的數據集,即CIFAR-10、 Places205、MNIST、NUS-WIDE。

CIFAR-10:該數據集共有60000張彩色圖像,這些圖像是32*32,分為10個類,每類6000張圖。作者將整個數據集分為59K圖像檢索集,以及1000圖像的測試集。此外,作者從從檢索集中隨機抽取20000張圖像組成訓練集來學習哈希函數。

Places205:作為Places 數據集的一個子數據集,裡面包含250萬張圖像,205個場景類別。作者首先從AlexNet的FC7層提取每個圖像的特徵,然後通過執行PCA將其表示為128維特徵。為了拆分整個數據集,作者從每個類別中隨機選擇20個實例,其餘的被視為檢索集。最後,使用檢索集中的100K圖像的隨機子集來更新哈希函數。

MNIST:數據集包含從0到9的70000手寫數字圖像。每個圖像均由784像素的歸一化原始像素表示。作者將數據集分為一個測試集,一個檢索集。

NUS-WIDE:從Flickr收集,包含296648張圖,共有81個標籤,作者根據前10個頻繁標籤從整個數據集中保留了186577張標記圖像,其中2000幅圖像作為查詢集,其餘的作為檢索集。並從檢索集中隨機抽取40000張圖像作為訓練集。

評價指標有兩個,分別為:mAP( mean Average Precision)、Precision@H2(Precision within a Hamming ball of radius 2)。比較的基準方法有七個,分別為:OKH、SketchHash、AdaptHash、OSH、MIHash、BSODH、HCOH。

在CIFAR-10中mAP、 Precision指標的性能表現如上。

在CIFAR-10數據集的mAP指標上,除了在48-bit的實驗中,HCOH略勝HMOH一籌。其他實驗都是HMOH更加優秀。而在Precision@H2指標下,HMOH超越了所有的SOTA方法。

在Places205中mAP、 Precision指標的性能表現如上。

在Places205數據集中,mAP指標下,HMOH勝過了所有的SOTA方法。在Precision@H2指標下,HMOH輸給了MIHash。

在MNIST中mAP、 Precision指標的性能表現如上。

在MNIST數據集中,mAP指標下,HMOH勝過了所有的SOTA方法,在Precision@H2指標下,HMOH輸給了MIHash。

在NUS-WIDE 中mAP、 Precision@H2指標的性能表現如上。

在NUS-WIDE數據集中,兩個指標的表現中,HMOH勝過了所有的SOTA方法。

相關焦點

  • No.3 矩陣乘法
    他還研究了新主題,撰寫了幾篇有關概率論的論文,尤其是關於馬爾可夫鏈的論文。他還發表了許多有關數學教育和一般教育的文章。         他先後於1930年和1934年訪問了蘇聯,還在1936年訪問了中國。第二次世界大戰爆發後,法國於1940年淪陷,哈達瑪和他的家人逃到了美國,在那裡他被任命為哥倫比亞大學的客座教授。
  • 機器學習時代的哈希算法,將如何更高效地索引數據
    哈希算法一直是索引中最為經典的方法,它們能高效地儲存與檢索數據。但在去年 12 月,Jeff Dean 與 MIT 等研究者將索引視為模型,探索了深度學習模型學習的索引優於傳統索引結構的條件。本文首先將介紹什麼是索引以及哈希算法,並描述在機器學習與深度學習時代中,如何將索引視為模型學習比哈希算法更高效的表徵。
  • 2015考研數學大綱解析:特徵值和特徵向量學習方法指導
    下面我以特徵值和特徵向量為例,深度解析考研數學大綱,希望對大家的學習有所幫助。、性質及矩陣可相似對角化的充分必要條件,會將矩陣化為相似對角矩陣;理解實對稱矩陣的特徵值和特徵向量的性質.從題型上來看,主要從以下角度進行考察:求解矩陣(數值矩陣和抽象矩陣)的特徵值和特徵向量;判定兩矩陣是否相似;矩陣的對角化問題;根據特徵值和特徵向量反求矩陣,實對稱矩陣問題。  四、複習指導  既然矩陣的特徵值和特徵向量是高頻考點,一定要熟練掌握。首先真正理解特徵值和特徵向量的概念,這是求解特徵值和特徵向量的一種方法。
  • 從哈希函數、哈希衝突、開散列出發,一文告訴你哈希思想與哈希表構造到底是什麼!
    哈希概念構造一種儲存結構,通過某種函數,使得其元素的儲存位置與他的關鍵碼之間能夠建立一一映射關係,那麼在查找時通過該函數很快找到相應元素。哈希函數散列函數(英語:Hash function)又稱散列算法、哈希函數,是一種從任何一種數據中創建小的數字「指紋」的方法。
  • 哈希算法、愛因斯坦求和約定,這是2020年的注意力機制
    研究者們在這個問題上思考了很多方法,本文中可以看到採用哈希算法、參數壓縮等的方法。這些方法有的是強化多頭注意力機制。有的則是利用哈希算法的高效性,替換掉原本的架構,使模型性能更加優秀。哈希改造下的注意力機制Transformer 因為 Multi-Head Attention 而成功,也因為它而受到重重限制。
  • AAAI 2018 | 從哈希到CNN:中科院自動化所提出高精度&低功耗訓練方法
    [1],揭示了哈希與二值權重的神經網絡之間的緊密關係,表明了網絡模型的參數二值化問題可以轉化為哈希學習問題,從而大幅提高了二值化深度神經網絡模型的性能,使其能在資源受限場景下能兼顧性能和功耗。在一些場景下,當前深度卷積網絡性能已經足以部署到實際應用中,這也鼓舞著人們將深度學習落地到更多的應用中。
  • 「新」動時刻, 讓你心中的哈希最強新品C位出道
    「新」動時刻, 讓你心中的哈希最強新品C位出道Original 哈希公司 過去一年裡,哈希研發團隊也不斷推陳出新,為用戶們帶來多款新品儀器、試劑及解決方案。七大新成員們將按照在線分析儀、實驗室儀器、數位化解決方案分為三大天團,來一場2020年終新品選秀大賽。
  • 越難增長也要增長,在線教育的增長活動矩陣
    編輯導讀:在線教育在激烈的競爭下,業務要怎麼去開展,整體性的的增長要怎麼做?本文作者介紹了在線教育(K12)增長活動矩陣的5個設計思路,並分別展開了梳理分析,與大家分享。希望能給大家作為參考,並在工作中產生助益。2020年的在線教育發展快速,可謂是當紅的明星行業。
  • 疫情防控期間常州工學院在線課程學習指導手冊
    疫情防控期間常州工學院 在線課程學習指導手冊(學生版) 各位同學: 為貫徹落實教育部和江蘇省教育廳應對新型冠狀病毒肺炎疫情防控工作要求,確保疫情防控期間我校教學工作正常開展
  • Comunion 區塊鏈深度學習系列|什麼是哈希
    特工A將其所發的信息進行哈希,然後將信息和哈希碼一起傳給特工B,特工B收到之後,也可以對文本進行哈希,然後和這個哈希碼進行匹配,如果匹配上的話,說明信息在傳播的過程當中沒有丟失或者被篡改。最開始誕生的是 MD4 和 MD5 。
  • 10分鐘了解一致性哈希算法,全網(小區區域網)(建議收藏)
    萌新 :這個我知道,我們用的是輪詢方式,第一個key 給第一個存儲節點,第二個 key 給第二個,以此類推。面試官:還有其他解決方案嗎?萌新:可以用哈希函數,把請求打散隨機分配到緩存集群內機器。面試官:考慮過這種哈希方式負載均衡的擴展性和容錯性嗎?萌新:...面試官:回去等通知吧。
  • 一種利用兩個輕型的卷積神經網絡來學習獲取任意遷移矩陣的方法
    一種利用兩個輕型的卷積神經網絡來學習獲取任意遷移矩陣的方法 李倩 發表於 2018-08-31 11:16:03 藝術風格轉換算得上是AI最有趣的應用之一了,你可以將梵谷的名畫風格添加到自己的照片中,也可以個自己的頭像來一幅映像派的油畫
  • 在線教育紅海,夸克如何破題「自主學習」?
    2020年讓線上教育迎來新機遇,疫情期「停課不停學」的政策為在線教育帶來大批用戶流量,在市場需求的驅動下,在線教育行業吸引了眾多投資加入。猿輔導、作業幫、VIPKID、掌門一對一等頭部教育企業紛紛拿到巨額融資。在海量資本的扶持之下,各教育企業紛紛開啟了營銷投放大戰。
  • 教程| 基礎入門:深度學習矩陣運算的概念和代碼實現
    本文從向量的概念與運算擴展到矩陣運算的概念與代碼實現,對機器學習或者是深度學習的入門者提供最基礎,也是最實用的教程指導,為以後的機器學習模型開發打下基礎。在我們學習機器學習時,常常遇到需要使用矩陣提高計算效率的時候。如在使用批量梯度下降迭代求最優解時,正規方程會採用更簡潔的矩陣形式提供權重的解析解法。
  • 新媒體流量矩陣:三大實用方法,建立新媒體矩陣,新手需知
    不知道小夥伴們有沒有想過,像十點讀書、papi醬這種有重大知名度的平臺或者個人是採取了什麼樣的方法才獲得了這麼大的名氣的,準哥告訴大家:這就是新媒體矩陣的效力,運營好新媒體矩陣,對我們是百利而無一害的。一、新媒體矩陣是什麼?首先,我們先來認識下新媒體矩陣是什麼?
  • 人民慕課助力新職業發展 參與「在線學習服務師」國家職業標準制定
    12月27日,「在線學習服務師」國家職業技能標準開發啟動會在京召開,人民在線慕課事業部受邀成為「在線學習服務師」的國標制定參與單位,人民在線總經理助理、慕課事業部主任陳泰然授聘為專家委員會委員。
  • 新東方在線張老師:初中英語學習無捷徑,掌握方法最重要
    由此可見,小學英語和初中英語在學習要求、學習內容、學習方法上都有很大的不同。也正因此,升入初中後,很多學生會發現英語變難了,自己不會學,甚至也學不好。  新東方在線張老師提醒家長及同學們,要想學好初中英語,就要儘早養成好的學習習慣和學習方法。對此,新東方在線張老師給出了以下幾點建議。
  • 她任教山東大學,後被清華聘請,破解國際通用哈希函數而出名
    有密碼牆,就是破裂密碼牆的計算方法。儘管沒有永遠足夠安全的密碼,但我們會一直進步。在中國有一位這樣女教授,她破解了世界上著名的通用哈希函數,就好比一個人赤手空拳,在一天之內造出一架飛機飛上天!讓我們來一起了解王小雲教授吧。1966年,王小雲出生在山東省的諸城。
  • (大綜合)矩陣方法與線性變換方法證實(反)對稱矩陣的正交對角化
    實對稱矩陣正交相似與對角矩陣, 這是高代中最簡單也是最重要的結果. 它的證明可以用矩陣的方法, 也可以用線性變換的語言.
  • 一文讀懂深度學習中的矩陣微積分,fast.ai創始人&ANTLR之父出品
    雖然網絡上已經有不少關於多元微積分和線性代數的在線資料,但它們通常都被視作兩門獨立的課程,資料相對孤立,也相對晦澀。不過,先別打退堂鼓,來自舊金山大學的Terence Parr教授說:矩陣微積分真的沒有那麼難。