揭秘曠視COCO十冠背後的技術

2020-12-26 科技熱點推薦

MS COCO的全稱是通用物體圖像檢測(Microsoft Common Objects in Context),是微軟於2014年出資標註的Microsoft COCO數據集的同名競賽,與此前著名的ImageNet 競賽一樣,被視為是計算機視覺領域最受關注和最權威的比賽之一。

而在ImageNet競賽停辦後,MS COCO競賽就成為當前計算機視覺領域的一個最權威、最重要的標杆,也是目前該領域在國際上唯一能匯集Google、微軟、Facebook以及國內外眾多頂尖院校和優秀創新企業共同參與的大賽。

曠視是一家行業領先的人工智慧公司,在深度學習方面擁有核心競爭力,同時也是全球為數不多的擁有自主研發深度學習框架的公司之一,作為人工智慧技術商業化的先行者,通過提供多種高效的全棧式解決方案為不同垂直領域的客戶賦能。

從2017年至2019年,曠視連續三年參戰COCO,取得了三連冠的輝煌戰績,共計斬獲10項冠軍,成為這一挑戰賽的最大贏家,究其根本原因,與曠視自主研發的人工智慧算法平臺Brain++密不可分。

曠視Brain++始於2014年,可以端到端實現訓練與部署的一體化,不僅高效率賦能算法生產的規模化,還能把這種能力投射到AI產品之中,快速推進AI行業落地;同時又可以兼顧介於算法與產品之間的AI競賽,是曠視拿下COCO十冠的利器和法寶。正是這種卓絕的工程性努力,Brain++算法輸出能力有效而高效,助力曠視在COCO的舞臺交上一份滿意的答卷。

通過Brain++,曠視不僅可以快速驗證論文idea,而且試錯成本低,在大大提升算法創新效率的同時,還可以廣泛吸收業界最新科研成果,復現並作為算子整合進深度學習框架,為優秀的算法設計提供精良彈藥;而行業領先的AutoML技術再次錦上添花,助力曠視從算法生產的手工時代邁入自動化時代。值得一提的是,曠視Brain++還利用VM技術,搭建起高效完備的算力資源調度體系,可以實現多機多卡同步訓練,保證訓練穩定性,大幅減少訓練時間。

下面,本文就以COCO 2019最新拿下的三項冠軍,揭開獲勝背後的關鍵技術。據官方信息,ICCV 2019共有60場Workshops,COCO 2019是其中的重頭戲,堪稱人工智慧領域最具影響力的通用物體檢測挑戰賽。這次,曠視研究院拿下物體檢測(Detection)、人體關鍵點(Keypoint)和全景分割(Panoptic)三項第一,取得了COCO三連冠的驕人戰績;同時,由於深具原創性的算法,曠視研究院還獲得COCO首次設立的Best Paper Award這一全場最高榮譽。

COCO 2019 Detection

當前計算機視覺領域中,實例分割是物體檢測的代表性任務,它旨在檢測圖像物體的同時,分割出每個物體的前景。曠視研究院在本次COCO Detection任務中,通過重新設計RPN匹配策略和Proposal採樣策略,兩階段檢測器即可直接獲得很好的高IoU檢測結果,甚至超過使用更多階段的Cascade R-CNN。曠視研究院的單模型在test-dev上取得了59.7/51.9的檢測和分割精度,在進一步多模型融合下,精度達到61.0/53.1;最終,曠視研究院取得了test-challenge 52.5的冠軍成績。

COCO 2019 Keypoint

在Human Keypoint任務中,圖像人體關鍵點的視角和大小變化幅度很大,抽取合適的全局和局部特徵對於精度漲點至關重要。為此,在COCO Keypoint比賽中,曠視研究院提出一種新結構,稱之為殘差階梯網絡,在只有COCO訓練集,沒有額外數據,並採用小輸入尺寸(256x192)的情況下,可以大幅超過當前最優方法。該方法單模型結果為test-dev 78.0,多模型融合結果為test-dev 79.2,曠視最終以test-chanllenge 77.1的成績斬獲冠軍。

COCO 2019 Panoptic

全景分割的目標是同時解析一張圖像的前景(thing)和背景(stuff),並給每個像素點打上實例ID和類別ID。在COCO Panoptic任務中,曠視研究院的冠軍方法可有效提取上下文信息豐富的特徵,並通過thing類別輔助stuff類別訓練,提高Stuff類別預測準確度;同時改進模型集成方法,優化預測結果概率分布,有效提高stuff預測精度。藉助實例分割預測結果,並利用空間層級排序方法,曠視研究院解決了全景分割中的遮擋問題,最終以test-challenge 54.5的PQ精度奪魁。

相關焦點

  • 揭秘曠視C計劃
    彼時是曠視成立的第四個年頭,正處於公司探索AI技術場景化落地的時期。在個人物聯網和城市物聯網領域,曠視已經在向深處挖掘AI「用武之地」,此時思考的重點是:還有哪些可以待挖掘的巨大場景,AI還能為哪些場景解決問題,曠視的戰略邊界還要往什麼方向擴展。
  • 李開復「口誤」背後 曠視科技是家什麼公司?
    來源:成都商報原標題:李開復「口誤」背後 曠視科技是家什麼公司?2019年9月,曠視科技對外展示了其開發的「智慧教學」系統,可以在屏幕上準確的捕捉到學生的面部細節,不過在「課堂監控」實踐引發了巨大的爭議後,曠視科技稱該圖片只是概念演示。
  • 李開復「口誤」背後 曠視科技是家什麼公司?
    來源:成都商報原標題:李開復「口誤」背後 曠視科技是家什麼公司?2019年9月,曠視科技對外展示了其開發的「智慧教學」系統,可以在屏幕上準確的捕捉到學生的面部細節,不過在「課堂監控」實踐引發了巨大的爭議後,曠視科技稱該圖片只是概念演示。
  • face曠視科技上市了嗎_曠視科技股票代碼多少
    曠視科技 如果你關注人工智慧,那你一定不會不知道曠視科技這家靠「刷臉」成名的公司。曠視科技成立於2011年,是一家以機器視覺為核心的人工智慧企業,自主研發的視覺感知網絡、智能硬體、智能雲服務等產品技術居世界領先水平。主要做計算機視覺相關技術研發與應用落地,最早以「Face++」的名字為外界熟知。
  • 李開復致歉背後的曠視科技:引發人臉識別爭議的為何總是它?
    「口誤」與火速致歉曠視,中國「AI四小龍」之一,專注於人臉識別技術研發與落地。在曠視的發展歷程中,李開復和螞蟻集團扮演了重要角色。據南都·AI前哨站梳理,在2013年和2014年,曠視科技曾兩次獲得由李開復擔任董事長和CEO的創新工場融資。
  • 瀚邦:基於曠視頂尖技術賦能物聯網全領域 打造超級城市大腦
    其中,曠視不僅研發能力和技術水平屬於行業頂尖,還有一整套計算機視覺解決方案,給代理商提供想像空間。正是看中曠視的品牌價值與AI行業以後的市場容量,我們選擇加入了曠視的大家庭。」在近日舉行的曠視2020年「視」界無疆渠道合作夥伴交流會濟南站中,青島瀚邦信息技術有限公司銷售總監亓佔剛就公司在賦能物聯網方面的發展,以及與曠視合作以來的感悟進行了分享。
  • 曠視科技穿越「死亡之谷」了嗎?
    曠視創辦之後,印奇和唐文斌有了明確的分工,印奇任CEO,全面負責曠視的戰略和運營,而唐文斌負責技術價值落地與組織管理。事實上,理論上最佳的創業組合是「商業天才+技術大拿」,而印奇和唐文斌都更偏向技術,他們平時如何搭檔,也是外界好奇的問題。
  • 曠視科技徐雲程:曠視數位化建設歷程
    在本次的中小微企業智慧成長計劃發布會上,北京曠視科技有限公司營運長徐雲程女士應邀分享了曠視科技的數位化歷程,本期特將她的演講分享給您。 尊敬的徐少春董事長、尊敬的陳春花老師、線上和線下的各位朋友們,大家下午好。
  • AI技術有好壞?曠視COO徐雲程:善惡應放在具體場景討論
    人工智慧技術帶來高效和便利,也帶來了一系列治理問題。在7月10日召開的第三屆世界人工智慧大會(WAIC)「人工智慧治理論壇」上 ,眾多科學家、企業家就圍繞AI治理問題展開了討論。在本次論壇上,曠視聯合創始人兼CEO印奇在演講時提到,從企業發展的角度來看,負責任的AI就是可持續發展的AI。
  • 曠視印奇獲2019中國經濟年度人物「新銳獎」
    如今的人工智慧行業正進入加速落地時期,如何降低技術成本,讓人工智慧更加精準地實現商業落地成為行業亟需解決的痛點。作為人工智慧領域的創新企業,曠視始終堅持以技術不斷探索人工智慧落地。憑藉強大的研發能力,曠視正在成為人工智慧技術商業化的先行者。曠視快速發展的背後與印奇對行業的深層次洞察不無關係。
  • AI技術助力體質健康教育,詠威亞太攜手清華大學、曠視科技引領體質...
    清華大學電子工程系博士生導師、清華大學媒體大數據認知計算研究中心主任王生進曠視科技作為我國人工智慧領域的技術領頭兵,在我國AI技術領域一直處於領先地位,並對AI在各行各業的產業落地起到了積極的推動作用。
  • 曠視新一代AI生產力平臺Brain++獲評2019年度人工智慧技術解決方案
    其中,人工智慧企業曠視自主研發的新一代AI生產力平臺Brain++獲選「2019年度人工智慧技術解決方案」。圖:曠視Brain++獲評2019年度人工智慧技術解決方案「從數據到算力,再到框架,致力解決行業最關注的成本問題,規模化問題
  • 人工智慧成2018MWC看點,曠視科技攜vivo推出TOF 3D超感應技術
    世界移動通信大會(MWC)是一年一度的行業大會,每年的大會中都會有通信行業的發展趨勢在此次大會上顯現出來,今年也不例外,在2018 MWC上海站上,人工智慧技術就成為了本次活動的焦點,曠視科技攜手vivo推出的TOF 3D超感應技術在上海站活動中正式發布
  • 曠視推出FaceStyle解決方案 用AI激發美業增量市場
    "當前,一些超人氣主播雖然能夠通過自己的影響力,動輒帶來成百萬乃至上千萬的帶貨量,但這些銷售額暴漲的背後,也為直播帶貨行業帶來一絲隱患。"虛擬試妝也可以栩栩如生FaceStyle的核心是曠視人臉稠密關鍵點檢測技術,通過用點定位眉毛、眼睛、嘴巴等關鍵區域,再結合深度學習,讓智能終端有效提取人臉特徵,理解你的"長相"。這也是AI技術在美業相關領域最為重要的應用之一。
  • 曠視科技衝刺國內AI第一股 能否撐起40億美元估值?
    值得一提的是,「CV四小龍」之中三家背後都有阿里巴巴的身影。除了曠視科技,阿里巴巴也投資了商湯科技,而依圖科技的股東之一雲鋒基金背後,其中一個股東正是馬雲。不過,得益於「同股不同權」的架構,在投票權方面,曠視暫不受制於阿里的大股東地位。
  • 曠視IPO之後,AI公司投資應該怎麼看?
    前幾年人工智慧掀起大風口,眾多企業紛紛將自己冠以AI公司的名頭,實際做的,卻和AI人工智慧相隔甚遠。曠視上市為AI行業提供了珍貴的資料,讓我們得以一窺AI公司的世界。於是筆者借曠視科技為例,探討如何評估AI公司的投資價值。
  • 曠視要用AI重新定義計算攝影
    曾經廠商們給手機拍照增加各種各樣的功能,但最後發現,一拍即得,反而是用戶最需要的,而實現這種體驗的背後,需要算法提前做大量工作。 其實在計算攝影領域,曠視已經深耕多年,只不過略顯低調。前幾年手機刷臉解鎖和刷臉支付成為熱門,這背後曠視的算法就多有應用。
  • 曠視發布「河圖」機器人戰略
    近日,2019曠視發布智慧機器人協同網絡大腦——河圖,將底層技術開放給更多合作夥伴,同時,宣布將投入20億元,與生態夥伴一起加速機器人場景落地。  河圖(HETU) 是一套由曠視推出的,致力於機器人與物流、製造業務快速集成,一站式解決規劃、仿真、實施、運營全流程的作業系統。
  • AQUOS夏普曠視S60評測
    在與AQUOS夏普曠視S60相處的一段時間裡不禁由衷感嘆道。全球3C代工領域規模最大的國際集團與「液晶界的鼻祖」終於擦出了耀眼的火花,在富士康戰略注資9個多月後,夏普攜匠心力作來襲。AQUOS夏普曠視系列電視是富士康賦能加碼夏普後,雙方共同開拓、努力創新,歷經了一年時間磨合的結晶。
  • AQUOS夏普曠視S60評測
    不久前,富士康賦能夏普,強大的工業生產能力結合夏普技術,「愛情結晶」曠視系列就此誕生。今天有幸給大家帶來曠視系列中的一款——AQUOS 夏普曠視S60電視評測,這款聚集了富士康的工業能力與夏普液晶顯示技術的電視會帶來怎麼的表現?