曠視CVPR 2019摘得6項世界冠軍 全方位解密獲獎模型

2020-12-17 CSDN技術社區

 近日,全球計算機視覺頂會 CVPR 2019 在美國長灘拉開帷幕。北京曠視科技有限公司在 CVPR 2019 的3項挑戰賽中,最終擊敗Facebook、通用動力、戴姆勒等國內外一線科技巨頭/知名高校,共計斬獲6項世界冠軍!

本次賽事中,曠視共參加 CVPR 2019 WAD(Workshop on Autonomous Driving)、CVPR 2019 FGVC(Workshop on Fine-Grained Visual Categorization)、CVPR 2019 NTIRE(New Trends in Image Restoration and Enhancement workshop)3項挑戰賽,涵蓋自動駕駛、新零售、智慧型手機、3D 等眾多領域。

圖:曠視斬獲 CVPR 2019 挑戰賽6項世界冠軍

CVPR 2019 WAD nuScenes 3D Detection Challenge

CVPR 2019 WAD 是自動駕駛領域的權威比賽,其中nuScenes比賽方向是3D detection,旨在通過模型分析3D雷射雷達/相機數據,賦予自動駕駛汽車偵測物體的能力,保障行駛安全。

nuScenes 是今年自動駕駛公司Aptiv發布的一個全新數據集,除了包括每段20秒的1000個場景以及140萬幅圖像外,該數據集使用了新的3D方法來整合物體檢測,並且發布了39萬個雷射雷達掃描輸出。nuScenes不僅需要同時識別10類物體(相比KITTI只需預測單個類別),還加入了速度和屬性的預測,而且需要解決嚴重的類別不均衡問題,因此任務難度大幅提高,因而也更具有實際意義。

對此,曠視設計了一個多尺度、多任務的模型,藉助新型檢測網絡,結合均衡採樣等策略,極大提高了模型的檢測精度,尤其是在小物體上。由最終結果可知,相較於官方Baseline 45.3%,曠視的模型高出18個點,達到63.3%,比第二名也高出8.8個點,擊敗一系列頂尖團隊,一舉奪魁。

圖:曠視 nuScenes 3D Detection Challenge冠軍獎牌

CVPR 2019 WAD  Detection/Tracking Domain Adaptation Challenge

Detection Domain Adaptation Challenge 是 CVPR 2019 WAD 的另一項挑戰賽,旨在對自動駕駛場景下的環境(二維圖像信息)進行感知,今年的比賽主要解決領域自適應問題,即美國道路場景和中國道路場景的相互適應。

具體而言,即利用7萬張美國道路場景數據進行訓練,對近15萬張中國道路場景進行測試,不允許使用任何標註測試數據,只允許使用 ImageNet 進行預訓練。圖像本身的不一致之外,不同天氣、不同道路以及複雜的交通狀況都給任務增加了額外挑戰,同時也為實際使用提供了可能性。

曠視基於自身積累的檢測算法之外,加之復現/使用的最前沿的檢測算法(比如 NAS-FPN、Cascade RCNN),進而對 Cascade RCNN 做出一系列改進,使得網絡在不同 IOU 閾值下的檢測結果都有一定漲幅;同時,為了解決兩個數據集之間數據分布不一致的問題,曠視還利用合併訓練、AdaBN、Data Distillation 等技術手段,最終在測試集上高出第二名深蘭科技1.7個點,同時在所有單類別上取得最高結果。

圖:曠視Detection Domain Adaptation Challenge冠軍獎牌

此外,在 Tracking Domain Adaptation Challenge 上,曠視使用 Online方法進行多目標跟蹤,即在高精度檢測結果的基礎上,使用 IOU Tracker 進行跟蹤;跟蹤過程中,改進和調試影響結果的多種因素,最終也在 Tracking 任務上取得第一。

CVPR 2019 FGVC iNaturalist\Herbarium Challenge

CVPR 2019 FGVC 是細粒度識別領域最權威的賽事,iNaturalist Challenge 是此項領域的旗艦比賽,旨在讓計算機自動識別物體的精細類別,它不僅要求識別1000多個品種的動、植物,還要識別其在不同發育期的狀態;Herbarium Challenge 則要解決開花植物野牡丹科的物種分類問題,所採用的圖像集僅包括保存於臘葉標本上的幹標本圖像。

因此,在這兩個比賽中,除了大模型/大解析度圖圖像進行訓練、測試等常規操作外,曠視還集成最前沿細粒度技術成果(比如 Coarse-to-fine hierarchical classification、iSQRT、Class-Balanced Focal Loss 等),同時創造性提出「後驗概率重校準」技術,即通過先驗知識對模型輸出的後驗概率進行校準,極大提高擁有較少訓練圖像的長尾類別的識別準確率,兩項比賽結果均高出第2名近1個點,一舉奪魁。

在業務方面,商品識別、菜品識別、缺陷檢測、生產線零件識別、車型/車輛識別等均是細粒度圖像分析技術的應用,目前已應用於產品研發中。在 iNaturalist 上,曠視擊敗了通用動力等頂尖團隊;在 Herbarium 上,曠視擊敗了大連理工(上年冠軍)、瑞典自然歷史博物館、Facebook。

CVPR 2019 NTIRE Real Image Denosing Challenge

CVPR 2019 NTIRE Real Image Denosing Challenge 則基於最近新提出的智慧型手機圖像降噪數據集(Smartphone Image Denoising Dataset, SIDD),它由很多真實的噪聲圖像及其相應的 ground truth 組成,且每幅圖像都有以原始傳感器數據(raw)和標準 RBG(sRGB)格式存儲的兩個版本。因此,該項比賽分為了兩項子賽,分別針對 raw 與 sRGB 圖像進行去噪,而曠視研究院參戰前者。

事實上,圖像降噪一直是曠視研究院「手機攝影超畫質」的技術儲備項目,自第一版原型誕生以後,就在不斷迭代。其中,針對原始傳感器數據(raw)的圖像降噪更是整個項目的基礎技術。但就學術界來看,對圖像降噪的關注點一直以 RGB 圖像為主,對 raw 圖(尤其是手機上)少有關注。人們不了解如何對圖像進行前處理、後處理,也不了解在降噪過程中的具體注意事項,往往導致無法發揮數據百分百的力量。基於上述背景,曠視研究院希望藉此機會分享在 raw 圖像降噪上的心得,同時驗證團隊實力,進行進一步鍛鍊。

在這次比賽中,曠視研究院提出針對 raw 圖像的基於 U-Net 框架的「拜爾陣列歸一化與保列增廣」方法。儘管不同輸入圖像間的數據格式存在差異,但是,為保持網絡輸入一致性,曠視精心設計了一種數據預處理方法,使得相同的網絡工作應用到具有不同拜耳模式的輸入上,從而在保證性能的前提下用更大的圖像集合訓練網絡。此外,團隊還提出了適用於 raw 圖像的數據增廣方法。這些優勢可以幫助網絡獲得更好的泛化能力(且沒有額外的運行時)。

圖:「拜爾陣列歸一化與保列增廣」方法圖示

曠視研究員還發現了主辦方提供的第一版數據集裡驗證集的錯誤,經分析,這很可能是由於人們對 raw 圖像處理的知識相對不足所造成的。由上述可知,學界對 raw 圖像展開的圖像降噪研究還處於剛剛起步階段,因此,這個小插曲從某種層面也說明了對 raw 圖像降噪研究的重要意義。對於錯誤的指出,主辦方及時進行了更正,並向曠視研究院參賽團隊發來了感謝信。

圖:曠視Real Image Denosing Challenge 冠軍獎牌

依託圖像降噪算法,曠視超畫質技術在智能降噪的同時,能夠更好地保留畫面質感,大幅度優化拍攝和影像處理的時間,顯著提升用戶在夜晚和低光照環境下的拍攝體驗。目前,該算法已成功落地於 OPPO Reno 10 倍變焦版。OPPO Reno 10 倍變焦版搭載了基於曠視 MEGVII 超畫質技術研發的「超清夜景2.0」功能,能夠為用戶提供非同凡響的夜拍體驗。這也是曠視超畫質技術首次運用在大規模量產機型上。

能夠在CVPR 2019滿載而歸,對曠視而言意義重大。曠視首席科學家、曠視研究院院長孫劍表示:「一流的人才往往希望在一個開放的環境中成長。發表論文、參加學術會議,其實是有人對你的工作鼓掌,激勵你繼續前行。曠視研究院最寶貴的財產是人才。如何吸引、培養、保留人才是一個組織健康和高速發展最關鍵的。我的工作第一優先級是打造一個好的研發環境,讓公司贏,讓我們贏,讓每個人贏。因為我始終相信兩點:中國不缺乏聰明人,中國有世界上最好的發展機會。我們就是要把一幫聰明人聚起來,齊心協力,貫徹『發展就是硬道理』。」

值得一提的是,曠視能夠在CVPR 2019斬獲六項冠軍的背後源自曠視深度學習框架 Brain++的有力支撐作用。Brain++是一套由曠視研究院自主原創的算法引擎,致力於從雲、端、芯三個方面全面賦能物理世界,以實現對世界的感知、控制、優化。Brain++ 不僅助力曠視拿下世界冠軍,在未來,還將推動智能汽車、商品識別、手機影像處理、智慧農業等應用領域的進步發展。

 

 【免責聲明:CSDN本欄目發布信息,目的在於傳播更多信息,豐富網絡文化,稿件僅代表作者個人觀點,與CSDN無關。其原創性以及中文陳述文字和文字內容未經本網證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本網不做任何保證或者承諾,請讀者僅作參考,並請自行核實相關內容。凡註明為其他媒體來源的信息,均為轉載自其他媒體,轉載並不代表本網贊同其觀點,也不代表本網對其真實性負責。您若對該稿件由任何懷疑或質疑,請即與CSDN聯繫,我們將迅速給您回應並做處理。】

 

相關焦點

  • CVPR 2019|曠視斬獲6冠,彰顯深度學習算法引擎優勢
    當地時間6月16日,全球計算機視覺頂會 CVPR 2019在美國長灘拉開帷幕,超過9200位相關人士共赴盛會,推進計算機視覺技術的交流與落地。曠視通過 Oral、Poster、Workshop、Demo、Booth等形式,同世界分享在計算機視覺理論與應用領域的最新進展。
  • CVPR 2019|奪取6項冠軍的曠視如何築起算法壁壘
    不遠千裡來到長灘會議中心的曠視研究員,在今年的 CVPR 上滿載而歸:拿下 6 個挑戰賽世界冠軍,包括自動駕駛、細粒度識別等等,數量位列今年國內參會公司之首;首次在 CVPR 舉辦研討會和挑戰賽,吸引了超過 300 多支隊伍註冊參加;14 篇論文入選了今年的 CVPR,比去年多出 6 篇,其中 1 篇入選口頭報告(Oral Presentation,5.6%
  • CVPR 2019 | 奪取6項冠軍的曠視如何築起算法壁壘
    不遠千裡來到長灘會議中心的曠視研究員,在今年的 CVPR 上滿載而歸:拿下 6 個挑戰賽世界冠軍,包括自動駕駛、細粒度識別等等,數量位列今年國內參會公司之首;首次在 CVPR 舉辦研討會和挑戰賽,吸引了超過 300 多支隊伍註冊參加;14 篇論文入選了今年的 CVPR,比去年多出 6 篇,其中 1 篇入選口頭報告(Oral Presentation,5.6%
  • 曠視科技Face++公開COCO2017冠軍模型
    今年 ICCV 2017會議期間,COCO +Places 2017挑戰賽公布了獲獎榜單。在COCO Challenge 和 Places Challenge 兩個板塊的七項比賽中,曠視科技(Face++)拿下了 COCO Detection/Segmentation Challenge(檢測/分割)、COCO Keypoint Challenge(人體關鍵點檢測)、Places Instance Segmentation(實體分割)三個項目的冠軍。
  • 曠視論文三連發,揭秘COCO +Places 2017比賽獲獎模型
    在COCO Challenge 和 Places Challenge 兩個板塊的七項比賽中,曠視科技(Face++)拿下了 COCO Detection/Segmentation Challenge(檢測/分割)、COCO Keypoint Challenge(人體關鍵點檢測)、Places Instance Segmentation(實體分割)三個項目的冠軍。
  • 曠視科技Face++公開COCO2017冠軍模型_2018歸檔-稿件庫-中文科技...
    今年 ICCV 2017會議期間,COCO +Places 2017挑戰賽公布了獲獎榜單。在COCO Challenge 和 Places Challenge 兩個板塊的七項比賽中,曠視科技(Face++)拿下了 COCO Detection/Segmentation Challenge(檢測/分割)、COCO Keypoint Challenge(人體關鍵點檢測)、Places Instance Segmentation(實體分割)三個項目的冠軍。
  • CVPR 2018 | 8篇論文、10+Demo、雙料挑戰賽冠軍,曠視科技掀起CVPR...
    曠視科技亮相CVPR 2018:融合基礎研究與產業落地的學術交流盛會第 31 屆計算機視覺和模式識別大會 CVPR 2018(Conference on Computer Vision and Pattern Recognition)在 6 月 18 日至 22 日於美國鹽湖城召開。
  • 明年中國頂級AI論文有望超越美國 曠視被CVPR 2019收錄14篇
    作為中國人工智慧領域的獨角獸企業,曠視就是其中一支重要的力量。如在頂級學術會議CVPR 2019 上,曠視就共有14篇論文被接收。這14篇論文分別涉及行人重識別、場景文字檢測、全景分割、圖像超解析度、語義分割、時空檢測等技術方向。同時,在CVPR 2018上,曠視也有8篇論文被收錄。
  • 曠視科技研究院包攬 COCO、Places 三項世界冠軍
    曠視科技研究院包攬 COCO、Places 三項世界冠軍 2017在共七項挑戰項目中,曠視科技研究院團隊(Megvii)參與了其中最重要的四項,並獲得了三項第一、一項第二的優異成績,一舉擊敗了來自微軟、Facebook、Google、商湯科技等企業,以及卡內基梅隆大學、北京大學、香港中文大學、上海交通大學等高校的競爭者,成為了第一個在 COCO 競賽中獲得冠軍的中國企業。
  • 曠視天元深度學習框架全球首發!3個實習生寫下一行代碼,27項全球AI...
    6年前3名實習生從第一行代碼寫起,艱難創業中在全球AI競賽斬獲27項冠軍,今日天元開源,敢與TensorFlow等全球主流深度學習框架爭雄。這個絕密武器又解決了開發者哪些痛點?「新智元急聘主筆、高級主任編輯,添加HR微信(Dr-wly)或掃描文末二維碼了解詳情。」
  • CVPR 2019丨京東AI斬獲3項冠軍和2項亞軍,京東技術轉型成果顯著
    摘要:2019年6月18日,京東AI研究院在美國長灘召開的計算機視覺頂級會議CVPR 2019上獲得視頻動作識別、商品圖片識別、精細粒度蝶類圖片識別3項學術比賽第一。2019年6月18日,京東AI研究院在美國長灘召開的計算機視覺頂級會議CVPR 2019上獲得3項學術比賽第一。這3項比賽分別為視頻動作識別、商品圖片識別,以及精細粒度蝶類圖片識別。此外,京東AI研究院還在多人人體解析、菜品類圖像識別競賽中獲得第二名,其中多人人體解析比賽是繼在2018年獲LIP單人及多人姿態估計賽道兩項第一後,再次獲獎。
  • 呼和浩特市政府、和林格爾新區與北京曠視科技有限公司籤署三方...
    2020年10月,曠視宣布包括河圖2.0版本和7款AI+物流硬體新品,並發起成立人工智慧物流產業聯盟,2020年6月,曠視召開企業服務戰略峰會暨新品發布會,推出全新一代人臉識別門禁一體機等系列產品,2020年4月,曠視擔任智能測溫標準工作組組長,牽頭制定全國首個智能測溫標準,2020年4月,曠視發布FaceStyle美業解決方案,2019年11月,
  • 曠視發布通用物體檢測數據集 Objects365,開啟 CVPR 物體檢測挑戰賽
    2019(Conference on Computer Vision and Pattern Recognition)將於當地時間 6 月 16-20 日在美國長灘舉行,隨著會議的臨近,一系列 workshop 以及賽事也慢慢公布。
  • 百度AI進入「光速」質變時刻 硬核技術實力狂攬23項世界冠軍
    回顧2019年,是AI「叱吒風雲」的一年,AI技術滲透生活方方面面的一年,隨處可見的「刷臉」支付、「善解人意」的智能音箱、甚至還有田野中自由翱翔可精準揮灑農藥的無人機……這些都是科技的饋贈,是AI服務生活的最佳效果。AI賽道上作為提前布局、重倉技術的百度AI,在國際AI算法上屢次突破、獲獎。
  • 科大訊飛摘得ICFHR 2020數學公式識別挑戰賽冠軍
    這是科大訊飛繼ICPR 2018 MTWI圖文識別挑戰賽上獲得三項冠軍、ICDAR 2019 CROHME數學公式識別挑戰賽上獲得兩項冠軍後,在複雜版面文檔圖像識別理解方向上所取得的又一佳績,再次展現科大訊飛在相關領域的技術先進性。
  • 曠視首席科學家孫劍:深度學習變革視覺計算丨CCF-GAIR 2019
    7月12日-7月14日,2019第四屆全球人工智慧與機器人峰會(CCF-GAIR 2019)於深圳正式召開。而具體到計算平臺上,目前包括雲、端、芯上的很多硬體上都可以部署智能,技術發展趨勢是如何自適應地根據計算平臺做自動模型設計。在
  • 科大訊飛摘得ICFHR 2020 OffRaSHME數學公式識別挑戰賽冠軍!
    這是科大訊飛繼ICPR 2018 MTWI圖文識別挑戰賽上獲得三項冠軍、ICDAR 2019 CROHME數學公式識別挑戰賽上獲得兩項冠軍後,在複雜版面文檔圖像識別理解方向上所取得的又一佳績,再次展現科大訊飛在相關領域的技術先進性。
  • 百度的CVPR2020高光時刻 ——22篇論文 8項冠軍 2場Workshop
    受到全球疫情影響,CVPR 2020改為6月14-19日舉行線上大會;讓人喜出望外的是,華人學者及團隊大放異彩,組成「中國軍團」向全球展示AI實力。 作為「中國AI頭雁」,百度已多年連續出徵CVPR,驕人成績一如既往。
  • 全方位解讀全景分割技術, 曠視冠軍團隊最新分享
    同時,他也是 2018 COCO + Mapillary 全景分割比賽曠視 Detection 組冠軍團隊成員。本文原載於知乎,雷鋒網(公眾號:雷鋒網)獲授權轉載。),以及曠視研究院 Detection 組參與的 2018 COCO Panoptic Segmentation 比賽工作介紹;最後對全景分割當前研究進行總結與分析。
  • 百度的CVPR2020高光時刻——22篇論文 8項冠軍 2場Workshop
    受到全球疫情影響,CVPR 2020改為6月14-19日舉行線上大會;讓人喜出望外的是,華人學者及團隊大放異彩,組成「中國軍團」向全球展示AI實力。作為「中國AI頭雁」,百度已多年連續出徵CVPR,驕人成績一如既往。