網易AI Lab問鼎ACCV 2020細粒度網絡圖像識別賽

2021-01-10 TechWeb

近日,第十五屆亞洲計算機視覺學術會議ACCV 2020(Asian Conference on Computer Vision)國際細粒度網絡圖像識別賽公布最終成績,網易AI Lab以71.4%的準確率擊敗了來自全球的569個頂尖計算機視覺團隊,從超過1000份方案中脫穎而出,一舉斬獲大賽冠軍。這是網易AI Lab繼語音、自然語言處理(NLP)等領域大賽奪冠之後,在計算機視覺領域的又一突破,彰顯了網易AI Lab在人工智慧領域的綜合技術實力。

(網易AI Lab榮獲ACCV 2020國際細粒度網絡圖像識別賽第一名的獎狀)

ACCV是國際計算機視覺領域的重要學術會議之一,每兩年舉辦一次,吸引來自全球的一流學者、研究者和開發者參與,共同探討計算機視覺領域的前瞻學術研究與應用。本次ACCV 2020國際細粒度網絡圖像識別賽,主要目的在於使用網絡數據訓練細粒度識別模型,減輕細粒度識別任務對大規模有標籤訓練數據的依賴,以增強模型算法的實用性和擴展性。

此次競賽的數據集規模巨大,訓練數據集包含557169張圖片,測試數據集包含100000張圖片,涵蓋各類動植物,共計5000個類別。所有數據來自網絡,未經人工標註,因此包含大量噪聲和錯誤數據,且數據存在長尾分布現象,導致不同類別樣本可能同時存在欠擬合和過擬合等問題,對參賽選手提出了巨大挑戰。而網易AI Lab提出了一種基於類別平衡的去噪方法,配合基於BBN的原創模型訓練方案,無需過度依賴高質量的標註數據,能夠直接從網絡數據中獲得更好的模型表達能力。比賽採用準確率(accuracy)作為評測指標,網易AI Lab解決方案的accuracy達到71.4%,遠超過比賽方所提供的基線模型(accuracy=41.905%)。

細粒度圖像識別不同於通用圖像分析任務,需要對屬於同一基礎類別的圖像進行更加細緻的子類劃分,因此對模型的要求更高、難度更大。而現有深度學習方法通常需要依賴大規模高質量標註數據,其獲取難度較高且成本高昂,一定程度上限制了現實場景下的應用。網易AI Lab在此次競賽中使用的原創模型,能夠在面對大量低質量樣本的情況下,快速找到適用於特定場景的解決方案,降低了圖像識別對於人工標註的依賴,為通用物品識別、圖像或視頻標籤等應用場景落地帶來了更多可能性。

成立於2017年的網易AI Lab,目前在計算機視覺研究領域有著豐富的技術累積,在落地應用上也擁有著諸多的實踐經驗。此前,網易AI Lab圖像識別技術已成功應用於敏感內容審核、遊戲反外掛、人臉屬性識別、手勢識別等場景。

相關焦點

  • 超全深度學習細粒度圖像分析:項目、綜述、教程一網打盡
    圖 5:帶有 CUB200-2011 監督信息的示例圖像細粒度圖像識別這些細粒度識別方法可以總結為三個範式:(1)用定位分類子網絡進行細粒度識別;(2)用端到端的特徵編碼進行細粒度識別;(3)用外部信息進行細粒度識別。其中,第一個範式和第二個範式只用和細粒度圖像相關的監督(比如圖像標籤、邊界框以及部分注釋等)進行了限制。
  • 騰訊AI Lab 2020 年度回顧
    2020 年騰訊 AI Lab 在多模態方向上的研究主要集中於音頻/視頻/圖像與文本的多模態學習。除了前文已經介紹過的虛擬人成果,騰訊 AI Lab 還提出了一種針對視頻中時序句子定位和事件描述學習模態間交互的新方法,該方法能學習成對的模態交互,從而改善兩項任務的性能。
  • CVPR 2020 | 看圖說話之隨心所欲:細粒度可控的圖像描述自動生成
    動機圖像描述生成(Image Captioning)是一個複雜的問題,需要機器掌握多種計算機視覺語義識別技術,例如物體識別、場景識別、屬性和關係檢測等等,同時還需要將所有檢測的結果總結為一個自然語言表述的句子。隨著深度學習技術的迅速發展,近期圖像描述生成模型取得了相當大的進展,甚至在某些準確度相關指標上超過了人類撰寫的文本描述。
  • 今日Paper|社交媒體謠言檢測;連續手語識別;細粒度服裝相似性學習...
    目錄基於雙向圖卷積神經網絡的社交媒體上謠言檢測 用於連續手語識別的時空多線索網絡基於屬性特定嵌入網絡的細粒度服裝相似性學習混合圖神經網絡在人群計數中的應用使用衛星圖像中的目標檢測生成可解釋的貧困地圖 基於雙向圖卷積神經網絡的社交媒體上謠言檢測 論文名稱:Rumor Detection>作者:Bian Tian /Xiao Xi
  • IJCAI 2020:網易AI Lab獲得雙料冠軍
    近日,網易AI Lab在全球人工智慧頂級會議IJCAI 2020的3D AI挑戰賽中脫穎而出,以大幅領先第二名的成績,獲得3D物體重建和基於圖像的3D物體檢索兩個賽道的雙料冠軍,體現了網易在3D視覺領域領先的技術實力。
  • ...CVPR 2020 論文推薦:元轉移學習;ABCNet;動態圖像檢索;點雲分類...
    2020 | Sketch Less for More:基於細粒度草圖的動態圖像檢索CVPR 2020 | PointAugment:一種自動增強的點雲分類框架12-in-1: 多任務視覺和語言表示學習論文名稱:12-in-1: Multi-Task Vision and Language Representation Learning
  • 應用豐富的「卷積神經網絡」技術,怎樣實現了圖像識別?
    本文將使用卷積神經網絡來介紹「圖像識別」的概念、應用和技術方法。什麼是「圖像識別」?它的作用是什麼?從「機器視覺」的角度來說,「圖像識別」就是軟體識別圖像中出現的人物、地理位置、物體、動作和文字的能力。計算機可以使用「機器視覺技術」,並結合人工智慧軟體和一個攝像頭,完成圖像識別。
  • ACCV 2020最佳論文等三項大獎出爐!華為諾亞獲最佳學生論文獎
    ACCV 2020 共錄用論文 255 篇,官方提供所有論文開放下載。官網連結:http://accv2020.kyoto/截止目前,大會已經公布了最佳論文獎、最佳學生論文獎、最佳應用論文獎等三項大獎,其中帝國理工和華為諾亞方舟合作獲得了最佳學生論文獎。以下AI科技評論就帶大家讓我們一起來看看這三項大獎吧 !
  • 吳博:目標檢測集成框架在醫學圖像 AI 輔助分析中的應用 | AI 研習...
    醫學圖像分析任務類型和研究對象 醫學圖像分析的任務類型主要有:分類與識別:這是最簡單最直接的任務類型。左邊的圖是吳恩達教授之前做的一個 X 光模型,這個模型中主要做分類,判斷是否有肺炎等病症。圖像分類與識別是常見的圖像分析(MIA: Medical Image Analysis) 任務,是圖像檢索的基本單元。
  • CVPR 2020滿分論文 | FineGym:面向細粒度動作分析的層級化高質量...
    機器之心機器之心發布作者:邵典等本文介紹了一個大規模、高質量、層級化標註的細粒度人體動作數據集「FineGym」,研究者來自香港中文大學,目前這項研究已被 CVPR 2020 接收為 oral 論文。
  • 深度學習與圖像識別 圖像檢測
    CNN等為什麼對圖像領域更加有效,因為其不但關注了全局特徵,更是利用了圖像識別領域非常重要的局部特徵,應該是將局部特徵抽取的算法融入到了神經網絡中。圖像本身的局部數據存在關聯性,而這種局部關聯性的特徵是其他算法無法提取的。深度學習很重要的是對全局和局部特徵的綜合把握(2)深度學習不是一個黑箱系統。
  • 【新智元乾貨】計算機視覺必讀:目標跟蹤、圖像分類、人臉識別等
    本文以計算機視覺的重要概念為線索,介紹深度學習在計算機視覺任務中的應用,包括網絡壓縮、細粒度圖像分類、看圖說話、視覺問答、圖像理解、紋理生成和風格遷移、人臉識別、圖像檢索、目標跟蹤等。網絡壓縮(network compression)儘管深度神經網絡取得了優異的性能,但巨大的計算和存儲開銷成為其部署在實際應用中的挑戰。
  • 圖像識別與人工智慧圖像識別和機器視覺有什麼區別
    人工智慧領域發展到現在,ai與人工智慧、圖像識別領域、計算機視覺領域等近年來越來越多的整合和融合。首先,人工智慧在生活工作中將普遍應用;其次,人工智慧在不同的工作場景都有其應用,從金融到醫療,從服務到工廠,應用無處不在;最後,人工智慧正在與自動駕駛技術等聯繫在一起。
  • CVPR 2019 商品識別大賽結果發布,京東AI研究院摘得桂冠
    今年,碼隆科技在 CVPR 2019 與 Google Research 參與合辦了The 6th Fine-Grained Visual Categorization Workshop,並主辦了其中細粒度商品識別圖像分類競賽 iMaterialist Challenge on Product Recognition。
  • 馬維英:AI Lab是公司最能冒險的部門,五大AI戰略資源是鑰匙
    字節跳動AI lab特別喜歡自己有想法、能夠自驅、願意不斷去學習且更加無所畏懼的研究人員;而不是害怕失敗,著重於眼前利益的人。區別於數據與場景:微軟研究院專注於技術轉移,字節跳動AI Lab鼓勵研究員直接參與到產品研發,利用豐富的應用場景、大量的數據和用戶反饋推進科研和技術創新除了基礎研究這方面,微軟做的更多的是技術轉移。與微軟不同的是,字節跳動擁有豐富的應用場景。
  • 人臉識別主要依靠了基於圖像的空間邊緣檢測技術
    ai換臉技術引起很多人的擔憂,怕外貌損害。這次任性哥帶你回歸本源,用人臉識別,再現青澀年華,你也可以擁有金融界鼻祖級的辨識力。最近我們也在研究人臉識別這個方向,今天就針對這個做個簡單的介紹。什麼是人臉識別?
  • 貝斯派成功晉級2017病理切片識別AI挑戰賽決賽
    而採用人工智慧對病理切片進行識別,能夠快速的對感興趣的區域進行識別、分割、定量檢測,快速的進行生物標記物的檢測,也減輕臨床醫生的負擔。   2017病理切片識別AI挑戰賽是由上海大數據聯盟、大數據產業基地、中國信息通信研究院主辦,華院數翼聯合主辦,以胃癌為靶心,圍繞胃癌病理切片智能識別、診斷進行的國際性比賽。
  • 如何通過人工神經網絡實現圖像識別?
    模式識別、智能控制及系統建模等領域得到越來越廣泛的應用。目標識別是模式識別領域的一項傳統的課題,這是因為目標識別不是一個孤立的問題,而是模式識別領域中大多數課題都會遇到的基本問題,並且在不同的課題中,由於具體的條件不同,解決的方法也不盡相同,因而目標識別的研究仍具有理論和實踐意義。
  • 網易有道AI作文批改入選2020機器之心
    原標題:網易有道AI作文批改入選2020機器之心【金煉獎】   6月19日,機器之心2020人工智慧金煉獎評選結果發布,網易有道的「AI作文批改」入選了助力產業復甦的最佳賦能
  • 谷歌AI:推進實例級別識別 (ILR)研究
    實例級識別(ILR)是識別一個物體的特定實例而不是簡單識別出所屬類別的計算機視覺任務。例如,我們不會把一張圖像標註為「後印象派繪畫」,我們真正感興趣的就是實例級別的標籤,例如「文森特梵谷的羅納河上的星空」或者「法國巴黎的凱旋門」而不是簡單的拱門。