年度最精彩研究,CVPR 2017六篇最佳論文介紹(附打包下載)| CVPR...

2020-12-12 雷鋒網

雷鋒網 AI 科技評論按:CVPR 2017的獲獎論文已經在大會的第一天中公布,共有6篇論文獲得四項榮譽。雷鋒網 AI 科技評論對6篇獲獎論文做了簡要介紹如下。

CVPR最佳論文

本屆CVPR共有兩篇最佳論文,其中就有一篇來自蘋果。

「Densely Connected Convolutional Networks」

論文作者:康奈爾大學 Gao Huang,清華大學 Zhuang Liu,康奈爾大學 Kilian Q. Weinberger,Facebook 人工智慧研究院 Laurens van der Maaten

論文地址:https://arxiv.org/abs/1608.06993 

論文簡介:近期的研究已經展現這樣一種趨勢,如果卷積網絡中離輸入更近或者離輸出更近的層之間的連接更短,網絡就基本上可以更深、更準確,訓練時也更高效。這篇論文就對這種趨勢進行了深入的研究,並提出了密集卷積網絡(DenseNet),其中的每一層都和它之後的每一層做前饋連接。對於以往的卷積神經網絡,網絡中的每一層都和其後的層連接,L層的網絡中就具有L個連接;而在DenseNet中,直接連接的總數則是L(L+1)/2個。對每一層來說,它之前的所有的層的 feature-map 都作為了它的輸入,然後它自己的 feature-map 則會作為所有它之後的層的輸入。

DenseNet 類型的網絡有這樣幾個引人注目的優點:它們可以緩和梯度消失的問題,可以加強特徵傳播,可以鼓勵特徵的重用,而且顯著減少參數的數量。論文中在 CIFAR-10、CIFAR-100、SVHN、ImageNet 這四個高競爭性的物體識別任務中進行了 benchmark,DenseNet 在多數測試中都相比目前的頂尖水平取得了顯著提升,同時需要的內存和計算力還更少。

「Learning From Simulated and Unsupervised Images through Adversarial Training」

論文作者:蘋果公司 Ashish Shrivastava, Tomas Pfister, Oncel Tuzel, Josh Susskind, Wenda Wang, Russ Webb

論文地址:https://arxiv.org/abs/1612.07828 

論文簡介:隨著圖像領域的進步,用生成的圖像訓練機器學習模型的可行性越來越高,大有避免人工標註真實圖像的潛力。但是,由於生成的圖像和真實圖像的分布有所區別,用生成的圖像訓練的模型可能沒有用真實圖像訓練的表現那麼好。為了縮小這種差距,論文中提出了一種模擬+無監督的學習方式,其中的任務就是學習到一個模型,它能夠用無標註的真實數據提高模擬器生成的圖片的真實性,同時還能夠保留模擬器生成的圖片的標註信息。論文中構建了一個類似於 GANs 的對抗性網絡來進行這種模擬+無監督學習,只不過論文中網絡的輸入是圖像而不是隨機向量。為了保留標註信息、避免圖像瑕疵、穩定訓練過程,論文中對標準 GAN 算法進行了幾個關鍵的修改,分別對應「自我正則化」項、局部對抗性失真損失、用過往的美化後圖像更新鑑別器。

論文中表明這些措施可以讓網絡生成逼真的圖像,並用定性的方法和用戶實驗的方法進行了演示;定量測試則是用生成的數據訓練模型估計目光注視方向、估計手部姿態。結果表明,經過模型美化後的生成圖像可以為模型表現帶來顯著提升,在 MGIIGaze 數據集中不依靠任何有標註的真實數據就可以取得超過以往的表現。

論文詳解:上周時候蘋果開放了自己的機器學習博客「蘋果機器學習日記」,其中第一篇就是對這篇獲獎論文的詳解,雷鋒網(公眾號:雷鋒網) AI 科技評論編譯文章在這裡,歡迎感興趣的讀者詳細了解。

CVPR最佳論文提名

「Annotating Object Instance with a Polygon-RNN」

論文作者:多倫多大學計算機學院Llu´ıs Castrejon,Kaustav Kundu,Raquel Urtasun,Sanja Fidler

論文地址:https://arxiv.org/abs/1704.05548 

論文簡介:論文中介紹了一種半自動的物體標註方法。這套系統的思路是,不再像以往一樣把圖像中的物體分割作為一種像素標註問題,把它看作一個多邊形位置預測問題,從而模仿目前已有的標註數據集的方式生成檢測標註框。具體來講,論文中的方法在輸入圖像後可以依次生成多邊形的邊把圖像中的物體圍起來。這個過程中,人類標註員可以隨時參與並糾正錯誤的頂點,從而得到人類標註員眼中儘可能準確的分割。

根據論文中的測試,他們的方法可以在 Cityscapes 的所有類別中把標註速度提升至4.7倍,同時還可與原本真值的重合度 IoU 達到78.4%,與人類標註者之間的典型重合率相符。對於車輛圖像,標註速度可以提升至7.3倍,重合度達到82.2%。論文中也研究了這種方法對於從未見過的數據集的泛化能力。

「YOLO9000: Better, Faster, Stronger」

論文作者:華盛頓大學,Allen 人工智慧學院的 Joseph Redmon 與 Ali Farhadi

論文地址:https://arxiv.org/abs/1612.08242 

論文簡介:論文中介紹了名為「YOLO9000」的頂級水平的實時物體檢測系統,它可以檢測的物體種類達到了9000種。論文中首先介紹了對原始的 YOLO 系統的多方面提升,有些是論文中新提出的方法,有些是從之前別人的成果中借鑑的。提升後的 YOLOv2 模型在 PASCAL VOC 和 COCO 這樣標準的物體檢測任務中有頂級的表現。在使用一個新的、多尺度訓練方法之後,這個 YOLOv2 模型可以處理各種不同的圖像,從而在速度和準確性之間輕鬆地取得了平衡。在67FPS下,YOLOv2 可以在 VOC 2007中取得76.8mAP;在40FPS下,分數可以提升為78.6mAP。這樣的準確率不僅超越了目前最好的帶有 ResNet 和 SSD 的 Faster R-CNN,而且運行速度還明顯更快。論文中最後還提出了一種將物體檢測和物體分類合併訓練的方法,論文作者們藉助這種方法,同時運用物體檢測數據集 COCO 和物體分類數據集 ImageNet 訓練得到了 YOLO9000。有的物體類別並沒有對應的物體檢測數據,而合併訓練的方法讓 YOLO9000 遇到它們的也時候也能夠預測檢測結果。

為了驗證方法的效果,論文中進行了物體檢測的驗證測試,YOLO9000 只用了200個類別中44個類別的檢測數據,就在  ImageNet 的檢測驗證數據集中取得了 19.7mAP;對於 COCO 中沒有的156個類別,YOLO9000得到了16.0mAP。不過YOLO9000能夠檢測的類別遠不只這200個類,它可以預測超過9000個不同類別物體的檢測結果,而且仍然可以實時運行。

最佳學生論文獎

「Computational Imaging on the Electric Grid」

論文作者:以色列理工學院電氣工程學院 Mark Sheinin、Yoav Y. Schechner,多倫多大學計算機學院 Kiriakos N. Kutulakos

論文地址:http://openaccess.thecvf.com/content_cvpr_2017/papers/Sheinin_Computational_Imaging_on_CVPR_2017_paper.pdf 

論文簡介:夜晚的風景隨著交流電照明一起跳動。通過被動方式感知這種跳動,論文中用一種新的方式揭示了夜景中的另一番畫面:夜景中燈泡的類型是哪些、上至城市規模的供電區域相位如何,以及光的傳輸矩陣。為了提取這些信息需要先消除燈光的反射和半反射,對夜景做高動態範圍處理,然後對圖像採集中未觀察到的燈泡做場景渲染。最後提到的這個場景渲染是由一個包含各種來源的燈泡響應函數資料庫支持的,論文中進行了收集並可以提供給讀者。並且論文中還構建了一個新型的軟體曝光高動態範圍成像技術,專門用於供電區域的交流電照明。

Longuet-Higgins 獎

Longuet-Higgins 獎以英國著名理論化學家、認知科學家 H. Christopher Longuet-Higgins 的名字命名。該獎設立於 2005 年,用以獎勵對 CV 研究產生根本性影響的學術論文,專門用來獎勵十年以前在 CVPR 發表、「經得起時間考驗」產生廣泛影響的論文。它是世界上第一個針對過往論文的獎項。這個獎項是由 IEEE 計算機協會的「模式分析和機器智能技術委員會」TCPAMI 評選的。

在頒布該獎項時還有一個有意思的花絮——主持人介紹說,設立這樣一個獎項的初衷,是因為「大家都知道,許多對學界貢獻很大、影響力也很大的論文,在當年並不是最佳論文。」

「Object retrieval with large vocabularies and fast spatial matching」

論文作者:牛津大學科學工程學院James Philbin、Ondˇrej Chum、Josef Sivic、Andrew Zisserman,微軟矽谷研究院 Michael Isard

論文地址:https://pdfs.semanticscholar.org/943d/793f6cbbc6551d758c1eefca2a9333bd8921.pdf 

論文簡介:這篇論文介紹了一個大規模的物體圖像搜尋系統。系統把用戶在一副圖片中框選的區域作為查詢輸入,然後就可以返回一個有序列表,其中都是從指定的大數據集中找到的含有同一個物體的圖像。論文中用從 Flickr 上爬超下來的超過100萬張圖像組成一個數據集,用牛津大學的地標作為查詢輸入,展示了系統的可拓展性和查詢性能。


由於數據集規模的原因,實驗過程中給圖像特徵構建列表的過程是時間和性能的主要瓶頸。基於這個問題,論文中對比了不同規模拓展的方法在構建特徵列表方面的表現,並且介紹了一種全新的基於隨機樹的量化方法,這種方法在廣泛的真值中都具有最好的表現。論文中的實驗表明這種量化方法對搜索結果質量的提高也有重要作用。為了進一步提升搜索性能,系統中還增加了一個高效的空間驗證階段來對論文中構建的這種基於特徵列表的方法進行重新標識,結果表明它可以穩定地提高搜索質量,雖然當特徵列表很大的時候效果並不顯著。作者們覺得這篇論文是通往更多圖片、網際網路規模的圖像語料庫的前途光明的一步。

六篇論文打包下載如下連結: http://pan.baidu.com/s/1dFgq4d7 密碼: 3t73

更多 CVPR 後續報導、更多近期學術會議現場報導,請繼續關注 雷鋒網 AI 科技評論。

相關文章:

CVPR最有趣的5篇論文,不容錯過!內含最佳學生論文! | CVPR2017

CVPR現場直擊:一文盡覽最頂級的CV+學術盛會!| CVPR 2017

騰訊 AI Lab入選 CVPR 的六篇論文逐一看 | CVPR 2017

CVPR 獲獎論文公布,蘋果斬獲最佳論文!| CVPR 2017

雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 史上最全!歷年 CVPR 最佳論文盤點
    接收論文列表:   http://cvpr2019.thecvf.com/files/cvpr_2019_final_accept_list.txt   正當學界紛紛議論各家獲接收論文多寡的當兒,雷鋒網 AI 科技評論為大家精心整理了一份從 2000 年——2018 年的 CVPR 最佳論文清單
  • CVPR 2017 全部及部分論文解讀集錦
    這篇論文是作者將何愷明(Kaiming He)博士殘差網絡Deep Residual Networks與其之前研究的Dilated Convolution相結合的結果。6.CVPR 2017 目標跟蹤相關論文(http://cvmart.net/community/article/detail/68)文中包括main conference中單目標跟蹤相關的論文,總共11篇,相關濾波7篇,其中1篇是oral,3篇用到卷積特徵,相關濾波佔了64%,(非卷積特徵的)CNN相關4篇,
  • 史上最全!歷年 CVPR 最佳論文盤點(2000 年——2018 年)
    雷鋒網 AI 科技評論按:作為計算機視覺領域的頂級學術會議,CVPR 2019 近期公布了最終論文接收結果,引來學界密切關注。據悉,CVPR 2019 今年一共獲得 5165 篇有效提交論文,最終抉出了 1300 篇接收論文,接收率達到 25.2% 。
  • CVPR 2017國內外亮點論文匯集:史上最盛大會議,華人佔據半壁江山
    國內公司不僅提交論文,也在會議期間舉辦演講和各類活動,中國公司在機器學習領域的積累正在逐漸顯現。 以下,我們將介紹國內幾家人工智慧公司和機構在 CVPR 2017 上的論文接收情況,其中也包括這些參會者在 CVPR 2017 上將要介紹的重點論文。
  • 投稿量激增56%,CVPR 2019接收論文的關鍵詞是什麼?
    本屆 CVPR 大會共收到 5165 篇有效提交論文,比去年增加了 56%。大會接收了其中的 1300 篇,接收率約為 25.1%。近日,一個 GitHub 項目對本屆大會的論文接收情況、關鍵詞等相關信息進行了可視化分析,也許能為我們提供有關計算機視覺熱門研究方向的洞見。
  • CVPR2019無人駕駛相關論文
    點擊文末「閱讀原文」立刻申請入群~CVPR2019 accepted list ID已經放出,極市已將目前收集到的公開論文總結到github上(目前已收集210篇),後續會不斷更新,歡迎關注,也歡迎大家提交自己的論文:https://github.com/extreme-assistant/cvpr2019
  • CVPR2019| 05-17更新11篇論文及代碼合集(含一篇oral,視覺跟蹤/實例分割/行人重識別等)
    點擊文末「閱讀原文」立刻申請入群~前段時間,計算機視覺頂會CVPR 2019 公布了接收結果,極市也對此做了相關報導:1300篇!CVPR2019接收結果公布,你中了嗎?。目前官方已公布了接收論文列表,極市已匯總目前公開的所有論文連結及code(目前已更新612篇),今日更新論文如下:CVPR2019 全部論文匯總:https://github.com/extreme-assistant/cvpr2019CVPR2019 論文解讀
  • CVPR 2018獎項出爐:兩篇最佳論文,何愷明獲PAMI 青年研究員獎
    據統計,本屆大會有超過 3300 篇的大會論文投稿,錄取 979 篇(接受率約為 29%,其中包括 70 篇 Oral 和 224 篇 Spotlight 論文)。而在一個小時前,最受關注的 CVPR 2018 最佳論文結果揭曉:來自史丹福大學和 UC Berkeley 的 Amir R.
  • 華人問鼎CVPR!最佳論文最佳學生論文一作均為華人,清華最高產機構
    在剛剛結束的CVPR 2020 開幕式上,悉數公布了本屆CVPR最佳論文、最佳學生論文等獎項。值得一提的是,兩個獎項的論文一作均為華人。根據本次Accept list接收情況來看,本次共接收文章1470篇(有效提交總數為5865篇),接受率為22%,比2018年的29.6%和2019年的25%都有下降,堪稱CVPR史上最嚴的收稿會。
  • 如何評價CVPR 2021的論文接收結果?
    論文Idea也非常有新意,得到了所有reviewer的一致認可,自認為開劈了所在領域中之前所有人都去迴避的問題。論文的主要欠缺在性能沒有刷的很高,但是投稿結束後也超過了競爭對手模型,rebuttal中因為政策並未提及新結果。
  • CVPR2017精彩論文解讀:用於生物醫學圖像分析的精細調節卷積神經...
    2017已經落下帷幕,但對精彩論文的解讀還在繼續。文章介紹:這篇主要針對醫學圖像處理領域標註數據匱乏的問題,如何通過卷積神經網絡(CNN)的Fine-tune和主動學習(Active Learning)來解決。
  • 【專知薈萃18】目標跟蹤Object Tracking知識資料全集(入門/進階/論文/綜述/視頻/專家,附查看)
    >請掃描專知小助手,加入專知人工智慧群交流~往期專知薈萃知識資料全集獲取(關注本公眾號-專知,獲取下載連結),請查看:【專知薈萃01】深度學習知識資料大全集(入門/進階/論文/代碼/數據/綜述/領域專家等)(附pdf下載)【專知薈萃02】自然語言處理NLP
  • 【快訊】CVPR2021結果出爐,1663篇上榜, 你的paper中了嗎?
    【導讀】計算機視覺頂會CVPR2021接收論文列表已公布,你的文章中了嗎?
  • 300篇 CVPR 2019 Oral 論文精選匯總,值得一看的 CV 論文都在這裡
    今年有超過 5165 篇的大會論文投稿,最終錄取 1299 篇,其中 Oral 論文近 300 篇。為了方便社區開發者和學術青年查找和閱讀高價值論文,AI 研習社從入選的 Oral 論文中,按應用方向挑選了部分精華論文,貼在本文。
  • CVPR 2019 Accepted Papers List & TUTORIALS
    周末彩蛋:在公眾號後臺回復:'search 關鍵詞『,可以查詢最新的相關論文,例如search kaiming he、search CVPR2019
  • 從CVPR2019看計算機視覺的最新趨勢
    今年共收到1300篇論文,錄取率達到創紀錄的5165篇(25.2%)。CVPR帶來了計算機視覺領域的頂尖人才,每年都有許多令人印象深刻的論文。我從CVPR中選取已被錄用的論文進行分析,了解研究的主要領域和論文題目中的常見關鍵詞。這可以提供研究進展的一個跡象。
  • 【CVPR2018最佳論文重磅出爐】斯坦福伯克利折桂,何愷明獲TPAMI年輕研究員獎
    最佳論文最佳論文題目:Taskonomy: Disentangling Task Transfer Learning論文地址:https://arxiv.org/pdf/1804.08328.pdf作者來自史丹福大學和加州大學伯克利分校,包括計算機視覺領域的著名教授Jitendra
  • CVPR 2018 最牛逼的十篇論文!
    今年,CVPR 收到3300篇主要會議論文並且最終被接收的論文多達 979 篇。超過6,500人參加了會議,這可以說是史詩級的大規模! 在這裡,我將向您展示我認為在2018年CVPR上的10篇最酷論文。我們將看到最近才使用的深度網絡實現的新應用,以及其他的一些提供了新的使用方法和技巧的應用。您可能會在此過程中從中獲得一些新想法;)。話不多說,讓我們開始吧!
  • CVPR 2018 最酷的十篇論文
    在這裡,我將向您展示我認為在2018年CVPR上的10篇最酷論文。我們將看到最近才使用的深度網絡實現的新應用,以及其他的一些提供了新的使用方法和技巧的應用。您可能會在此過程中從中獲得一些新想法;)。話不多說,讓我們開始吧!