CVPR 2019|曠視斬獲6冠,彰顯深度學習算法引擎優勢

2020-12-19 中國日報網

當地時間6月16日,全球計算機視覺頂會 CVPR 2019在美國長灘拉開帷幕,超過9200位相關人士共赴盛會,推進計算機視覺技術的交流與落地。曠視通過 Oral、Poster、Workshop、Demo、Booth等形式,同世界分享在計算機視覺理論與應用領域的最新進展。值得一提的是,在 CVPR 2019的3項挑戰賽中,曠視最終擊敗 Facebook、通用動力、戴姆勒等國內外一線科技巨頭/知名高校,共計斬獲6項世界冠軍!

持續創新Brain++拓展AI認知邊界

做人工智慧不能閉門造車。作為以算法為基因的公司,曠視自誕生之日起便一直積極參與計算機視覺在全球範圍內的學術交流,一方面是為了與世界分享自己的研究成果,另一方面也是為了吸取全球的智慧,研發最好的技術來助力世界發展,創造社會價值。

展會現場

此行,曠視共參加 CVPR 2019 WAD(Workshop on Autonomous Driving)、CVPR 2019 FGVC(Workshop on Fine-Grained Visual Categorization)、CVPR 2019 NTIRE(New Trends in Image Restoration and Enhancement workshop)3項挑戰賽,拿下6項冠軍,涵蓋自動駕駛、新零售、智慧型手機、3D等眾多領域,其背後起支撐作用的是曠視深度學習框架 Brain++。這是一套由曠視研究院自主原創的算法引擎,致力於從雲、端、芯三個方面全面賦能物理世界,以實現對世界的感知、控制、優化。Brain++不僅助力曠視拿下世界冠軍,還將推動智能汽車、商品識別、手機影像處理、智慧農業等應用領域的進步發展。

曠視斬獲 CVPR 2019挑戰賽6項世界冠軍

大會現場,挑戰賽主辦方宣布比賽成績,並向冠軍隊伍頒發獲獎證書;隨後,曠視相關的參賽人員通過一張張 Slides、一場場 Talks、一張張 Posters向與會人員分享了奪冠背後的技術方法,以及冠軍之路上滿滿的收穫。

今年是曠視自成立以來連續第5年參加 CVPR,在談到參加這種頂級學術會議對公司戰略意義的時候,曠視首席科學家、曠視研究院院長孫劍表示:

「一流的人才往往希望在一個開放的環境中成長。發表論文、參加學術會議,其實是有人對你的工作鼓掌,激勵你繼續前行。

曠視研究院最寶貴的財產是人才。如何吸引、培養、保留人才是一個組織健康和高速發展最關鍵的。

我的工作第一優先級是打造一個好的研發環境,讓公司贏,讓我們贏,讓每個人贏。因為我始終相信兩點:中國不缺乏聰明人,中國有世界上最好的發展機會。我們就是要把一幫聰明人聚起來,齊心協力,貫徹『發展就是硬道理』。」

冠軍之路,滿是收穫

CVPR 2019 WAD nuScenes 3D Detection Challenge

nuScenes 3D Detection Challenge冠軍獎牌

CVPR 2019 WAD是自動駕駛領域的權威比賽,其中 nuScenes比賽方向是 3D detection,旨在通過模型分析 3D雷射雷達/相機數據,賦予自動駕駛汽車偵測物體的能力,保障行駛安全。

nuScenes不僅需要同時識別10類物體(相比 KITTI只需預測單個類別),還加入了速度和屬性的預測,而且需要解決嚴重的類別不均衡問題,因此任務難度大幅提高,因而也更具有實際意義。

比賽中,曠視設計了一個多尺度、多任務的模型,藉助新型檢測網絡,結合均衡採樣等策略,極大提高了模型的檢測精度,尤其是在小物體上。由最終結果可知,相較於官方 Baseline 45.3%,曠視的模型高出18個點,達到63.3%,比第二名也高出8.8個點,擊敗一系列頂尖團隊,一舉奪魁。

CVPR 2019 WAD Detection/Tracking Domain Adaptation Challenge

Detection Domain Adaptation Challenge冠軍獎牌

Detection Domain Adaptation Challenge是 CVPR 2019 WAD的另一項挑戰賽,旨在對自動駕駛場景下的環境(二維圖像信息)進行感知,今年的比賽主要解決領域自適應問題,即美國道路場景和中國道路場景的相互適應。

具體而言,即利用7萬張美國道路場景數據進行訓練,對近15萬張中國道路場景進行測試,不允許使用任何標註測試數據,只允許使用 ImageNet進行預訓練。圖像本身的不一致之外,不同天氣、不同道路以及複雜的交通狀況都給任務增加了額外挑戰,同時也為實際使用提供了可能性。

曠視基於自身積累的檢測算法之外,加之復現/使用的最前沿的檢測算法(比如 NAS-FPN、Cascade RCNN),進而對 Cascade RCNN做出一系列改進,使得網絡在不同 IOU閾值下的檢測結果都有一定漲幅;同時,為了解決兩個數據集之間數據分布不一致的問題,曠視還利用合併訓練、AdaBN、Data Distillation等技術手段,最終在測試集上高出第二名深蘭科技1.7個點,同時在所有單類別上取得最高結果。

另外,在 Tracking Domain Adaptation Challenge上,曠視使用 Online方法進行多目標跟蹤,即在高精度檢測結果的基礎上,使用 IOU Tracker進行跟蹤;跟蹤過程中,改進和調試影響結果的多種因素,最終也在 Tracking任務上取得第一。

CVPR 2019 FGVC iNaturalistHerbarium Challenge

FGVC頒獎現場

CVPR 2019 FGVC是細粒度識別領域最權威的賽事,iNaturalist Challenge是此項領域的旗艦比賽,旨在讓計算機自動識別物體的精細類別,它不僅要求識別1000多個品種的動、植物,還要識別其在不同發育期的狀態;Herbarium Challenge則要解決開花植物野牡丹科的物種分類問題,所採用的圖像集僅包括保存於臘葉標本上的幹標本圖像。

除了大模型/大解析度圖圖像進行訓練、測試等常規操作外,曠視還集成最前沿細粒度技術成果(比如 Coarse-to-fine hierarchical classification、iSQRT、Class-Balanced Focal Loss等),同時創造性提出「後驗概率重校準」技術,即通過先驗知識對模型輸出的後驗概率進行校準,極大提高擁有較少訓練圖像的長尾類別的識別準確率,兩項比賽結果均高出第2名近1個點,一舉奪魁。

在業務方面,商品識別、菜品識別、缺陷檢測、生產線零件識別、車型/車輛識別等均是細粒度圖像分析技術的應用,目前已應用於產品研發中。

在 iNaturalist上,曠視擊敗了通用動力等頂尖團隊;在 Herbarium上,曠視擊敗了大連理工(上年冠軍)、瑞典自然歷史博物館、Facebook。

CVPR 2019 NTIRE Real Image Denosing Challenge

Real Image Denosing Challenge冠軍獎牌

CVPR 2019 NTIRE Real Image Denosing Challenge基於新近的智慧型手機圖像降噪數據集 SIDD,它由很多真實的噪聲圖像及其相應的 ground truth組成,且每幅圖像都有以原始傳感器數據(raw)和標準 RBG(sRGB)格式存儲的兩個版本。

圖像降噪一直是曠視研究院「手機攝影超畫質」的技術儲備項目,自第一版原型誕生以後不斷迭代;其中,針對原始傳感器數據(raw)的圖像降噪更是整個項目的基礎技術。

這次比賽中,曠視研究院提出針對 raw圖像的基於 U-Net框架的「拜爾陣列歸一化與保列增廣」方法。儘管不同輸入圖像間的數據格式存在差異,但是,為保持網絡輸入一致性,曠視精心設計了一種數據預處理方法,使得相同的網絡工作應用到具有不同拜耳模式的輸入上,從而在保證性能的前提下用更大的圖像集合訓練網絡。

本次冠軍算法已成功落地於 OPPO Reno 10倍變焦版。OPPO Reno 10倍變焦版搭載了基於曠視超畫質技術研發的「超清夜景2.0」功能,能夠為用戶提供非同凡響的夜拍體驗。這也是曠視超畫質技術首次運用在大規模量產機型上。

價值創造驅動技術創新做真正WORK的科研

人工智慧自誕生之日起便已宣稱了其改變世界的雄心。當圖靈於1950年在論文《Computing Machinery and Intelligence》尾頁畫上句號的剎那,一個前所未有的屬於人類的智能時代就此拉開序幕。

從 Marvin Minsky於1966年對機器人模仿人類抓取物品的研究,到神經心理學家 David Marr於80年代初創建的關於計算機視覺研究的理論框架;從手工特徵設計到受生物視覺神經網絡為啟發而誕生的卷積網絡(CNN),人類將機器智能從小說幻想帶進了現實,為世界裝上了明眸。

人工智慧,其本質是造福人類,便利生活,所以能否為世界帶來足夠的價值是曠視關注的核心。通過深挖社會痛點,找出致病原因,曠視一直在尋找著讓世界更美好的方法

曠視成立早期便上線了自主原創的深度學習框架——Brain++。作為企業級的人工智慧算法製造工廠,Brain++從底層有力支撐著曠視研究院整體的研究生產工作與曠視核心產品的工程化建設。這次6冠的勝利,即是上述算法和底層系統優越性的再次證明。

憑藉強大的軟硬體結合能力,曠視目前已在個「人設備大腦」、「城市大腦」和「供應鏈大腦」三個核心 AIoT場景深度布局。在與行業龍頭力量的聯合下,曠視正在推進尖端技術方案的強垂直落地,為整個產業結構調整及商業變革激活引擎,積聚力量;與生態夥伴一起服務於數位化建設,用軟硬結合的解決方案為客戶提供閉環的商業價值,成為行業智能物聯方案專家。

來源:中國網

相關焦點

  • CVPR 2019|奪取6項冠軍的曠視如何築起算法壁壘
    不遠千裡來到長灘會議中心的曠視研究員,在今年的 CVPR 上滿載而歸:拿下 6 個挑戰賽世界冠軍,包括自動駕駛、細粒度識別等等,數量位列今年國內參會公司之首;首次在 CVPR 舉辦研討會和挑戰賽,吸引了超過 300 多支隊伍註冊參加;14 篇論文入選了今年的 CVPR,比去年多出 6 篇,其中 1 篇入選口頭報告(Oral Presentation,5.6%
  • 曠視CVPR 2019摘得6項世界冠軍 全方位解密獲獎模型
    近日,全球計算機視覺頂會 CVPR 2019 在美國長灘拉開帷幕。北京曠視科技有限公司在 CVPR 2019 的3項挑戰賽中,最終擊敗Facebook、通用動力、戴姆勒等國內外一線科技巨頭/知名高校,共計斬獲6項世界冠軍!
  • CVPR 2019 | 奪取6項冠軍的曠視如何築起算法壁壘
    參加 CVPR 對以算法為核心的曠視有重要的戰略意義。2019 年伊始,在成立八年之際,曠視宣布了從品牌到戰略的全面升級,並且確立了以算法為核心基因,圍繞計算視覺及相關傳感技術開發感知、控制、優化算法,包括但不限於人臉識別、手勢識別、文字識別、物體檢測、視頻分析、三維重建、智能傳感與控制等機器學習技術。
  • 曠視天元深度學習框架全球首發!3個實習生寫下一行代碼,27項全球AI...
    6年前3名實習生從第一行代碼寫起,艱難創業中在全球AI競賽斬獲27項冠軍,今日天元開源,敢與TensorFlow等全球主流深度學習框架爭雄。這個絕密武器又解決了開發者哪些痛點?「新智元急聘主筆、高級主任編輯,添加HR微信(Dr-wly)或掃描文末二維碼了解詳情。」
  • 「停課不停學」 曠視《深度學習實踐》線上課程免費開放!
    人工智慧企業曠視也在積極響應國家政策,向全社會免費開放《深度學習實踐》全套課程!《深度學習實踐》課程是由曠視研究院聯合北京大學數學科學學院機器學習實驗室共同開設的系列深度學習精品課程之一,已連續開設3年。課程由曠視首席科學家兼研究院院長孫劍,以及身經百戰的研發總監、資深研究員親身授課,內容涵蓋深度學習基礎理論到計算機視覺實踐,真正將高水平深度學習課程帶給大家。
  • CVPR 2018 | 8篇論文、10+Demo、雙料挑戰賽冠軍,曠視科技掀起CVPR...
    曠視科技亮相CVPR 2018:融合基礎研究與產業落地的學術交流盛會第 31 屆計算機視覺和模式識別大會 CVPR 2018(Conference on Computer Vision and Pattern Recognition)在 6 月 18 日至 22 日於美國鹽湖城召開。
  • 35 萬行代碼,曠視重磅開源天元深度學習框架 ,四大特性實現簡單開發
    學界和業界的共同努力下,誕生了早期從學術界走出的Caffe、Torch和Theano,現如今引領著產業界的TensorFlow,Amazon押注的MXNet,Facebook傾力打造的PyTorch,Microsoft內部開源的CNTK,以及相對小眾的深度學習引擎DSSTNE等深度學習框架。
  • 曠視首席科學家孫劍:深度學習變革視覺計算丨CCF-GAIR 2019
    他首先回顧了深度學習發展歷史,深度學習發展到今天並不容易,過程中遇到了兩個主要障礙:第一,深度神經網絡能否很好地被訓練。孫劍認為,深度學習和傳統機器學習最大的差別是,隨著數據量越來越大,使用更大的神經網絡就有可能超越人類性能。而具體到計算平臺上,目前包括雲、端、芯上的很多硬體上都可以部署智能,技術發展趨勢是如何自適應地根據計算平臺做自動模型設計。在
  • 快報|曠視在ICCV 2019共斬獲三項第一,國家電網成立區塊鏈公司
    ICCV 2019,曠視研究院國際頂賽COCO實現三連冠,蟬聯霸主堪比我國桌球  當地時間10月27日,兩年一度的國際計算機視覺大會ICCV 2019(International Conference on Computer Vision)在韓國首爾開幕。
  • 破解AI全流程開發難題,曠視推出Brain++商業版,將算法落地時間縮短...
    曠視Brain++商業版提供的,即是這樣的AI生產力工具。Brain++是曠視在產業應用工作中自主研發的全流程AI生產能力合集,是曠視各種AI業務的底層基礎設施,由深度學習框架MegEngine(天元)、算力管理平臺MegCompute、數據管理平臺MegData共同構成。
  • 曠視科技 CSG 算法負責人姚聰:深度學習時代的文字檢測與識別技術...
    在國際重要期刊IEEE TPAMI, IEEE TIP以及頂級會議CVPR、ICCV和ECCV等上發表論文十餘篇。目前在曠視科技(Face++)擔任雲服務業務算法負責人,主持自然場景OCR、人臉活體檢測等技術的研發工作,為FaceID網際網路身份驗證服務、Face++開放平臺等提供算法支持。
  • 專訪曠視副總裁顧亮:刷臉算法準確率98%或99%無關緊要
    近年來,國內最早一批AI算法起家的獨角獸企業紛紛發力硬體市場。這無疑是AI商業化探索發展到一定階段企業的順勢選擇,也是當下新基建語境下企業面對新一波紅利的積極反應。如何看待和應對軟體算法行業發力硬體方案的趨勢?在新基建背景下,城市物聯網發展的新戰場、新機遇在哪裡?為了探討這些問題,智東西近日對曠視資深副總裁、企業業務事業部總經理顧亮進行了深度訪談。
  • 停課不停學|曠視×北大《深度學習實踐》課程全面開放!
    曠視研究院聯合北京大學數學科學學院機器學習實驗室開設的《深度學習實踐》全套課程(視頻+PPT,共計28課時)今日正式全面上線,讓你足不出戶也能享有高水平的教學資源。「與其疫情宅家玩遊戲,不如家裡蹲大學把課上。」
  • 呼和浩特市政府、和林格爾新區與北京曠視科技有限公司籤署三方...
    據介紹,曠視科技創立於2011年,是一家人工智慧產品和解決方案公司。以深度學習為核心競爭力,曠視融合算法、算力和數據,打造出 「三位一體」的新一代AI生產力平臺曠視Brain++,並開源其核心——深度學習框架「天元」。
  • 曠視入選機器之心人工智慧年度獎項全球三十大最佳AI創業公司
    正如全球三十大最佳AI創業公司2019發展總結所言,「曠視自研的人工智慧算法平臺 Brain++榮獲世界網際網路領先科技成果。基於Brain++,曠視不僅在學術頂會如CVPR、ICCV等共計斬獲10多項世界冠軍、發表30餘篇論文,在產品方面也發布了如業界首個AIoT作業系統——曠視河圖(HETU)、夜景超畫質攝影等一系列領先物聯網解決方案」,曠視基於自研的人工智慧算法平臺Brain++與強勁的技術實力,打造了包括算法、軟體和硬體產品在內的全棧式、一體化解決方案,以AI幫助各行業解決發展痛點,真正創造價值。
  • 曠視科技聯合創始人兼CTO唐文斌個人簡歷
    曠視不是技術公司,是產品公司 新智元:目前在人工智慧領域尤其是深度學習技術落地,你認為真正的壁壘在哪裡? 唐文斌:我認為深度學習技術的落地,核心的一個關鍵詞是「結合」。 Research負責尋找算法之外的東西。邊界裡面的全部通過工程實現自動化。 新智元:曠視的核心優勢是什麼?
  • 搞算法還要當「美學家」?曠視要用AI重新定義計算攝影
    今天,曠視要將AI的能力融入影像算法,在他們看來,AI才是計算攝影的未來方向。 二、跟「光「打交道,硬體需要AI來幫忙 那麼AI到底如何給手機影像系統賦能?這聽起來似乎有些抽象。通過與曠視工程師進行交流,我對他們基於深度學習神經網絡能力的「AI+CV」超畫質技術有了更深的理解。
  • 曠視科技研究院包攬 COCO、Places 三項世界冠軍
    與關注整體圖像的 ImageNet 圖像分類任務相比,COCO 中的物體檢測任務更關注的是圖像中出現的每個物體的個體(比如各種小物體,各種遮擋物體),因此要求算法對圖像細節有更好的理解。這個比賽也代表了繼 ImageNet 後的圖像識別的最高水平。  COCO 從2015年開始舉辦,至今已經三屆,前兩屆物體檢測冠軍分別是 MSRA 和 Google。
  • 深度學習實踐課|曠視研究院 X 北大聯合出品,正式上線,免費報名!
    疫情期間,我們每日聽到的最多的信息之一可能就是號召大家在線堅持學習。不過,在左有「名師授課」、右有「速成深度學習」,多重信息的圍攻之下,大部分人最終還是選擇了那條無數「英雄」選擇的道路——「收藏+下次一定」,重回電子虛擬世界,麻痺自己,蹉跎人生。   怎麼辦?曠視研究院為你支招!
  • 資源│機器學習、深度學習、算法工程師等 AI 相關崗位面試需要知識
    面試深度學習面試問題https://github.com/elviswf/DeepLearningBookQA_cn2020 年的算法實習崗位信息表,部分包括內推碼,和常見深度學習算法崗面試題及答案 https://github.com/HarleysZhang/2019_algorithm_intern_information