CVPR 2020 Oral:一行代碼提升遷移性能,中科院計算所研究生一作

2020-12-08 量子位

賈浩楠 發自 凹非寺量子位 報導 | 公眾號 QbitAI

在遷移學習任務中,一直存在這樣的問題:

目標域由於沒有標籤,常常導致分界面附近混淆較多的數據。

中科院計算所的在讀研究生崔書豪等,提出了一種新的解決方法:批量核範數最大化(Batch Nuclear-norm Maximization,BNM)。

在典型的標籤不足場景下(如半監督學習等),BNM可以有效地提升學習效果。

並且,大量實驗表明,BNM的性能要優於目前主流的一些方法,並且搭配起來使用,效果也很不錯。

這篇論文已被接收為CVPR 2020 Oral。

主要思路

類別預測的判別性與多樣性同時指向批量響應矩陣的核範數,這樣就可以最大化批量核範數來提高遷移問題中目標域的性能。

可以通過分析批量類別響應組成的批量矩陣A,嘗試從判別性和遷移性進行優化。

判別性

所謂判別性,指的是預測類別的過程是否堅定。比如對於二類問題的響應:1、[0.9,0.1]判別性較高2、[0.6,0.4]判別性較低。

常見的方法採用最小化熵來得到較高的判別性。我們發現矩陣A的F範數與熵有著相反的單調性,從而可以通過最大化A的F範數來提升判別性。

多樣性

多樣性可以近似表達為批量矩陣中預測的類別數量,即預測的類別數量多則響應多樣性大。

考慮不同類別響應的線性相關性,如果兩個響應屬於不同類別,那麼響應會差別較大線性無關,如果屬於相同類別則近似線性相關:1、[0.9,0.1]與[0.1,0.9]線性無關2、[0.9,0.1]與[0.8,0.2]近似線性相關。

那麼預測類別數也就是矩陣中最大的線性無關向量數,即矩陣的秩。

BNM

核範數是矩陣奇異值的和,在數學上有兩點結論:

1、核範數與F範數相互限制界限2、核範數是矩陣秩的凸近似

所以類別預測的判別性與多樣性同時指向矩陣的核範數,我們可以最大化矩陣核範數(BNM)來提升預測的性能。

比如上圖中,如果使用熵最小化(EntMin)和BNM來優化,當熵相同的時候,使用BNM優化更容易使得核範數更大,從而預測對擁有較少數量的類別(綿羊)。

實現

在常用的框架Pytorch與Tensorflow中,均可通過一行代碼實現BNM。

Pytorch:

TensorFlow:

應用

我們將BNM應用到三個標籤不足的場景中:半監督學習、領域適應和開放域物體識別。

實驗表明,在半監督學習中可以提升現有方法;在領域適應中BNM約束明顯優於EntMin,並且單一的BNM約束可以達到與現有方法相近的性能,如下圖:

在開放域物體識別中單一的BNM約束超過有著冗雜損失函數的UODTN,達到SOTA性能,如下圖:

同時在開放域物體識別中,我們統計了隨機採樣的批量響應中未知類所佔比例,如圖:

我們發現BNM確實可以保持未知類所佔比例,從而保障整體預測的類別數量與準確性,從而保持多樣性。

此方法主要針對的是缺少標籤場景下分界面附近數據密度較大的問題,對於遷移相關的任務有著較為普遍的改善價值。

作者介紹

論文作者包括中科院計算所學生崔書豪,卓君寶;計算所副研究員王樹徽,李亮;國科大講席教授黃慶明和華為諾亞方舟實驗室田奇博士。

本文第一作者崔書豪,2018年本科畢業於清華大學自動化系,現在是中科院計算所VIPL實驗室二年級碩士生,研究方向為深度領域適應學習與開放域學習技術。指導老師王樹徽,長期從事跨模態、跨域分析推理技術研究

值得一提的是,崔書豪以第一作者向CVPR 2020提交了兩篇論文,另一篇是Gradually Vanishing Bridge for Adversarial Domain Adaptation,目前也被接收。

傳送門

論文原址:https://arxiv.org/pdf/2003.12237.pdf

第二篇CVPR:https://arxiv.org/abs/2003.13183

BNM項目Github主頁:https://github.com/cuishuhao/BNM

崔書豪知乎:https://zhuanlan.zhihu.com/p/121507249

相關焦點

  • 新突破:亮風臺投影AR新成果入選CVPR 2019 oral presentation
    相關論文《End-to-end Projector Photometric Compensation》已經入選CVPR 2019的oral presentation環節。數據顯示,今年有超過 5165 篇的大會論文投稿,最終錄取1299 篇,而oral presentation的入選率只有提交論文的5%左右。可以預見,該成果將成為投影AR技術應用落地提供重要的技術基礎。
  • 中科院自動化所智能感知與計算研究中心11篇論文被CVPR接收 | CVPR...
    「智能感知與計算研究中心」微信公眾號,AI 科技評論獲授權轉載。智能感知與計算研究中心為中科院自動化所獨立建制的科研部門,致力於研究泛在智能感知理論與技術以及與之相伴的海量感知數據的智能分析與處理。智能感知與計算研究中心在今年的 CVPR 2018 上共有 11 篇論文被接收,再次創下歷史新高。
  • CVPR2019| 05-17更新11篇論文及代碼合集(含一篇oral,視覺跟蹤/實例分割/行人重識別等)
    加入極市專業CV交流群,與6000+來自騰訊,華為,百度,北大,清華,中科院等名企名校視覺開發者互動交流!
  • 華人問鼎CVPR!最佳論文最佳學生論文一作均為華人,清華最高產機構
    在剛剛結束的CVPR 2020 開幕式上,悉數公布了本屆CVPR最佳論文、最佳學生論文等獎項。值得一提的是,兩個獎項的論文一作均為華人。在接收主題方面,根據大會統計,視覺領域依然是當前最熱門的主題,遷移/low-shot/半監督/無監督學習緊隨其後,圖像與視頻合成、3D等也持續火熱。
  • 如何評價CVPR 2021的論文接收結果?
    HourNAS: Extremely Fast Neural Architecture Search Through an Hourglass Lens分數 | pre-rebuttal:234簡介:這個論文也是曲折,主要的目的是降低NAS的成本,在2020年初我們就與很多業界的朋友們一起探討過,NAS的成本下不去,NAS的商用成本就有些高
  • 四篇入選oral,深睿醫療8篇科研論文被國際學術會議IEEE CVPR、ISBI...
    CVPR 2020本次收錄四篇科研論文,其中三篇為oral。從IEEE CVPR 2020公布的論文接收結果來看,在6656篇有效投稿中有1470篇論文被接收,接收率僅為22%,相比去年又降低3個百分點,oral按照往年經驗,一般只有5-7%,競爭越發激烈。
  • 一行代碼搞定Git遷移
    第1步:git clone -- bare xxxx1xxx1:為原來git地址,就是你要遷移的地址這一句主要是把代碼基礎包下載下來第2步第一步結束後,回你生成xxx2.gitcd xxx2.git第3步git push --mirrir xxxx3地址xxx3:是你要往哪遷移的git地址附:截屏--mirrorSet up a mirror of the source repository.
  • CVPR 2020文本圖像檢測與識別論文/代碼
    ABCNet: Real-time Scene Text Spotting with Adaptive Bezier-Curve Network論文:ABCNet: Real-time Scene Text Spotting with Adaptive Bezier-Curve Network代碼:github.com/Yuliang-Liu/# 遷移學習!
  • CVPR 2019:中科院、牛津等提出SiamMask網絡,視頻跟蹤最高精度
    【新智元導讀】今年CVPR有一篇亮眼的視覺跟蹤方面的論文,作者提出新算法SiamMask,在視頻跟蹤任務上達到最優性能,並且在視頻目標分割上取得了當前最快的速度。作者來自中科院自動化所、牛津大學等,本文帶來一作自動化所王強的解讀。
  • CVPR2019無人駕駛相關論文
    加入極市專業CV交流群,與6000+來自騰訊,華為,百度,北大,清華,中科院等名企名校視覺開發者互動交流!
  • 中科院計算所沈華偉:圖卷積神經網絡的思想起源
    而如何將神經網絡應用到圖網絡中進行計算,在幾年前卻是懸而未決的難題。現今,我們提到的圖神經網絡,往往指圖的卷積,那麼,卷積是如何應用在圖的非歐結構上的?帶著這個問題,我們一起走進10月30日,中科院計算所研究員沈華偉在CCL2020「圖卷積神經網絡」的報告,報告中沈華偉介紹了卷積應用於圖模型的思想起源、譜域方法和空間方法的發展,探討了其表達性能,並對未來發展方向進行思考。
  • 【特別關注】牛剛帶隊到中科院計算技術研究所、中科院自動化研究...
    【特別關注】牛剛帶隊到中科院計算技術研究所、中科院自動化研究所等考察調研 2020-09-28 20:11 來源:澎湃新聞·澎湃號·政務
  • CVPR 2019 召開在即,亮風臺端到端的投影儀光學補償入選 oral 論文
    近日,AR 產品與服務提供商亮風臺公布了投影 AR 算法研究最新成果,主要用於解決投影儀光學補償問題,即當投影屏幕不是理想的白色漫反射時,儘可能消除投影面上的圖案,相關論文《End-to-end Projector Photometric Compensation》已經入選 CVPR 2019 的 oral presentation 環節。以下便是亮風臺對這篇論文的詳細解讀。
  • CVPR 2017 全部及部分論文解讀集錦
    cvmart.net/community/article/detail/61)知識表示學習的思想(TransE)已經被成功應用於視覺關係提取(Visual Relation Extraction),提交 CVPR 2017 的新論文《Visual Translation Embedding Network for Visual Relation Detection》提出的 VTransE 方法是在這方面所邁出的重要一步
  • ECCV 2020 | 再見,遷移學習?可解釋和泛化的行人再辨識
    相關論文已被 ECCV 2020 接收。(註:本文遷移學習是指行人再辨識領域單模態跨場景的遷移學習。)通過直接跨庫測試,本文提出的 QAConv 方法大幅超越一些主流的分類 / 度量學習方法(10%+ mAP),同時它無需遷移學習便可超越近兩年的大部分遷移學習方法。此外,本文還提出一種模型無關的基於時序共現的相似度分數加權方法,稱為時序提舉(Temporal Lifting, TLift)。該方法進一步提升了結果,達到當前最好的跨庫行人再辨識性能。
  • 中科院計算所大數據研究院&DataFountain聯合實驗室的成立
    2020年5月30日,「中科院計算所大數據研究院&DataFountain聯合實驗室籤約掛牌暨數據科學與人工智慧教育研討會」在鄭州市鄭東新區智慧島大廈8F圓滿舉行。中科院計算所副所長程學旗、中科院計算所大數據研究院院長王元卓、北京數聯眾創科技有限公司CEO陳娟、中科院計算所廈門數據智能研究院院長徐勇軍、中科天璣數據科技股份有限公司CEO 戚宜齋、華北水利水電大學副校長劉雪梅、中科院計算所大數據研究院副院長程伯群,以及科研學術界、企業界等近40位專家、領導出席了揭牌儀式及研討會活動。
  • 中科院數學與系統科學研究院2020考研複試線(研究生分數線)
    新東方考研網為同學們整理了中科院數學與系統科學研究院2020考研分數線(研究生複試線),供考生參考。   專業代碼 專業名稱
  • 保研講座 | 計算機專業研究生如何做科研?聽聽中科院學霸怎麼說 (附機器學習入門指導)
    CS引路人2020計算機保研系列講座是由已經保研至清華、北大、中科院等學校的學長學姐倡議展開,目的是為學弟學妹們傳授經驗
  • CVPR 2017國內外亮點論文匯集:史上最盛大會議,華人佔據半壁江山
    機器之心是首家報導騰訊 AI Lab 研究的媒體,我們注意到騰訊 AI Lab 首次公開的有關風格遷移的研究論文此次也被 CVPR 2017 所接收據統計,騰訊 AI Lab 共有 6 篇論文被 CVPR 2017 接收,以下是對這些論文的簡要介紹: 論文一:Real Time Neural Style Transfer for Videos簡介
  • 中科院-馬普學會計算生物學夥伴研究所接受第五次國際評估
    9月14日至15日,中國科學院-馬普學會計算生物學夥伴研究所(簡稱「計算生物學所」)接受了建所以來的第五次國際評估。中科院副院長張杰、德國馬普學會副主席Bill Hansson出席了相關活動。  評估工作按慣例遵循馬普學會所屬研究所統一評估模式和標準。