碼隆科技CurriculumNet:提高噪聲數據價值方法

2020-12-11 環球網

專注於人工智慧技術創新的科技周報Import AI,長期關注並報導科技領域的重要事件。在最近一期周報中,碼隆科技自研的CurriculumNet算法在計算機視覺技術創新領域的應用獲得了Import AI的關注。

作為數萬名業內專家的重要讀物,Import AI一直專注於人工智慧技術創新領域。其作者Jack Clark為OpenAI現任戰略及傳播總監,曾任Bloomberg唯一一位專注於神經網絡學習領域的記者。OpenAI是眾多矽谷大亨聯合建立的人工智慧非盈利組織,在技術界有廣泛影響力。

如下是報導的中文譯文:

中國計算機視覺創業公司碼隆科技於近期開源了基於弱監督學習的CurriculumNet代碼和模型。CurriculumNet是一種可通過從網際網路上收集大量帶有噪聲標籤的數據來訓練出一個魯棒性很強的深度神經網絡模型技術,這一方法對那些缺少大型已標註數據集的研究人員十分有幫助。但是,這種從網際網路上按照標籤語義收集來的數據往往帶有大量噪聲。因此,若要在這些數據上訓練出高性能的深度神經網絡模型,研究人員需要面臨著從噪聲中提取足夠多有用信息的挑戰。

CurriculumNet:研究人員在WebVision資料庫上訓練他們的模型結構,該資料庫包含了超過2,400,000張帶有噪聲標籤的圖像。他們的方法是在整個數據集上訓練一個Inception_v2模型,之後研究所有圖像映射到的特徵空間;此後,CurriculumNet將這些圖像分組,根據特徵空間中所有圖像的相似程度將每個類聚成三個子集。接著,他們開始使用具有相似圖像特徵的子集用於模型訓練,再混合到噪聲較大的子集中訓練。通過高質量的標註數據迭代學習分類器,隨後添加具有噪聲的數據來加強分類器,研究人員表示這種增加噪聲數據訓練的方式不僅能提高模型的性能還能增強其泛化能力。

測試效果:研究員用CurriculumNet測試了四個基準:WebVision、ImageNet、Clothing1M和Food101。他們發現,使用最大量的噪聲數據訓練的系統比那些沒有噪聲數據訓練的系統甚至有著更高的準確度。這一方法使WebVision上的錯誤率減少了多個百分點(「這些進步對於如此大規模的挑戰是至關重要的,」研究人員表示)。更進一步,CurriculumNet在WebVision上的準確度最高,而且訓練數據越多(例如結合ImageNet和WebVision的數據集進行訓練時),性能越好。

碼隆科技在四個公開數據集中的實驗結果

訓練模型在WebVision和ImageNet上合集的效果

技術意義:類似於CurriculumNet的系統很好地展示了研究人員可以如何利用標註不佳的數據,結合前沿訓練理念來,提高低質量標註數據的價值。這樣的方法就類似於在自然資源中提取有用物質時所採取的「萃取」手法,很有現實意義。

相關焦點

  • 埃森哲入股碼隆科技並達成AI戰略合作,碼隆海外零售商業化輪廓已成
    埃森哲大中華區主席朱偉表示:「與碼隆科技達成戰略合作關係,將為埃森哲中國的應用智能服務組合提供顯著的價值,並支持我們成為亞洲乃至全球人工智慧商業創新的賦能者。」而對於碼隆科技而言,此次和埃森哲的合作,將有利碼隆科技走向全球。碼隆科技 CEO黃鼎隆對雷鋒網透露:「埃森哲成為我們的投資者與合作夥伴,使得我們能夠聯合將這些服務推向全球頂級企業。」
  • 碼隆科技攜論文亮相 ECCV 2018,科研成果受學術頂會肯定
    本次 ECCV 會議共接收論文 779 篇,錄取率約為 24%,基於對計算機視覺領域商品識別問題的聚焦研究,碼隆科技算法團隊於本次 ECCV 公布了最新的科研成果。其中一篇論文《CurriculumNet:基於大批量網絡圖像的弱監督學習算法(CurriculumNet: Weakly Supervised Learning from Large-Scale Web Images)》分享了碼隆科技最新的弱監督學習算法 CurriculumNet。
  • 獲得軟銀中國2.2億人民幣B輪投資的碼隆科技,是怎樣的公司?獨家
    此前,碼隆科技曾在 2015 年 3 月獲得 1200 萬天輪投資,於 2016 年 10 月完成 6200 萬人民幣 A 輪融資。為改善有監督學習效果,碼隆科技開發了一套弱監督式學習方法,能夠有效利用含有「噪音」——也就是不規整的數據,並且基於此訓練出一個能夠與人類媲美的 AI 模型。
  • 對話CTO | 聽碼隆科技 CTO 碼特講計算機視覺技術賦能全球零售行業
    成立於 2014 年的碼隆科技是一家提供計算機視覺技術服務的人工智慧公司。區別於市面上做安防、金融等人臉識別的人工智慧公司,碼隆科技將核心技術圍繞著商品識別展開。2016 年碼隆科技發布了 ProductAI 人工智慧商品識別平臺,目前技術已經在零售、紡織服裝、質檢等多個領域落地。
  • 對話碼隆科技 CTO 碼特:應對商品識別獨有挑戰,技術研發實力是根本
    作為一家在商品識別領域深耕四年多的創業公司,碼隆科技憑藉其在行業內深厚的技術積累以及豐富的產品商業化經驗,業已成為該細分領域的領先者。本次,雷鋒網 AI 科技評論聚焦 AI 商品識別技術這一主題,與該公司的 CTO 碼特(Matt Scott)進行了一次對話,碼特也從碼隆科技在技術研發、產品化方面積澱下來的經驗出發,為大家分享了在商品識別這一細分領域中的一些思路。
  • 碼隆科技成功入駐東京都新科技加速營,積極開拓日本市場
    東京政府通過從企業市場潛力、產品研發實力、商業模式創新以及團隊組成等方面進行嚴格的調研與篩選,最終選出來自人工智慧、IoT、大數據領域的8家外國創新企業入駐加速器,碼隆科技是唯一一家成功入駐NTBCT加速器的中國企業。
  • 中國人工智慧有多牛 碼隆科技重磅亮相Discovery探索頻道
    Discovery記錄了數家深圳的中國創業企業代表,在眾多企業中,中國首個提出人工智慧商品識別概念的AI公司——碼隆科技佔據了最長的篇幅,與比亞迪、大疆無人機等共同作為重點案例,向觀眾展現了中國科技創新高速發展的原動力。
  • 碼隆科技完成2.2億B輪融資,探索AI商業化落地的路徑
    至於為什麼選擇投資碼隆科技,宋安瀾博士說:「碼隆科技作為傑出的人工智慧技術商業化推動者,擁有巨大的發展潛力。」1成立三年,碼隆科技一直在探索圖像識別應用落地的場景,圍繞這商業化落地大命題,希望和傳統行業進行緊密結合。面料市場是碼隆科技摸索出的技術和商業結合的第一個點。
  • 碼隆科技升級亮相CVPR 2018——贊學術·新提升·超會玩
    根據會議官方數據,CVPR 今年共收到3309 篇有效投稿,共接收了979 篇論文,比2017 年多出了25%。同時,今年與會人數也再創新高,共有6512 人註冊了今年的CVPR 2018,並迎來了149家贊助商與參展商。作為碼隆科技參與CVPR的第二個年頭,新提升·超會玩·贊學術,可以說是此行的關鍵詞。
  • 碼隆科技視覺識別智能貨櫃解決方案:改變消費形態 解決消費痛點
    碼隆科技優先布局,以RetailAI智能貨櫃解決方案改變消費形態、解決消費痛點,通過有效的用戶觸達、場景融合和信息反饋等手段,從根本上改變了零售服務方式,打造出一套全新的零售模式。基於全球領先的人工智慧計算機視覺商品識別技術,RetailAI碼隆科技智能貨櫃解決方案是一套完整的智能終端售貨櫃及後臺大數據商戶運營系統解決方案。
  • 碼隆科技榮登畢馬威中國領先消費科技50企業榜單
    會議第二天,畢馬威(KPMG)中國正式發布了《中國領先消費科技50企業報告》,旨在發掘中國消費科技領域裡致力於推進數位化、智能化、一體化的高成長企業。憑藉突出的技術研發優勢及落地成果,碼隆科技榮耀登榜。
  • 碼隆科技亮相矽谷英偉達GTC,發布ProductAI國際版平臺丨GTC2017
    作為全球最權威的 GPU 開發者大會,本次會議將聚焦人工智慧、自動駕駛、VR等前沿科技領域。碼隆科技作為Inception Program精英創業計劃的一員,受邀參加此次技術盛會,並亮相Start-Up Pavilion展區。此次活動起,碼隆科技將正式開始提供ProductAI人工智慧視覺應用平臺海外版服務,正式走向國際市場。
  • 碼隆科技CEO黃鼎隆:人工智慧時代的產品經理修煉之道
    碼隆科技聯合創始人&CEO,清華大學人機互動博士@黃鼎隆 主要探討人工智慧的產品經理在未來的創新方法。從自身的產品經驗出發,分享了「三學」:豬跑學(沒吃過豬肉還沒見過豬跑?),殺雞學(殺雞就要用牛刀)和溜驢學(是驢是馬拉出來溜溜)。
  • CVPR 2020丨碼隆科技提出 SiamAttn,將孿生網絡跟蹤器的性能提至最...
    本文介紹的是 CVPR 2020 論文《Deformable Siamese Attention Networks for Visual Object Tracking》,作者來自碼隆科技。本篇論文解讀首發於「碼隆播報」公眾號。
  • 世界網際網路大會人工智慧分論壇,碼隆科技展望 AI 打造智能 「龍骨」
    在論壇最後的「願景展望」環節,碼隆科技聯合創始人兼CEO黃鼎隆,ArcSoft虹軟創始人兼CEO鄧暉、蘇寧科技集團COO荊偉,飛利浦中國CTO、副總裁王熙,第四範式聯合創始人、首席架構師胡時偉,加拿大工程院院士凌曉峰,柏睿數據董事長劉睿民
  • 風力發電機組噪聲測量方法探討
    大型整機廠已不局限於1.5MW機型機組,為符合風場環境已研發出2MW、3MW、5MW、7MW級風力發電機組,關鍵部件性能也日益提高,主控控制系統的智能控制也加速提高了風電機組的可靠性和壽命。無論在機械結構和電氣控制方面都有所完善,為今後的快速發展奠定了穩固的基礎。不僅能滿足國內市場的需求,而且已經向國際市場供貨。在風力發電機組的改進完善過程中,眾多難題需要攻克,以使風機運行更穩固,更有優勢。
  • 為損失函數定個框架,碼隆CVPR 2019提出圖像檢索新範式
    作為今年大會的黃金贊助商,碼隆科技在 CVPR 2019 上不僅發表了優秀的研究工作,同時還與 Google Research 等合辦了 FGVC6 Workshop,主辦了細粒度商品識別挑戰賽。本文將對碼隆科技的 CVPR 2019 論文進行解讀,介紹碼隆是如何為圖像搜索任務提出一個通用的損失函數框架,並將該領域近十年的損失函數都統一在該框架下。
  • 相位噪聲基礎及相位噪聲測試原理和方法
    隨著電子技術的發展,器件的噪聲係數越來越低,放大器的動態範圍也越來越大,增益也大有提高,使得電路系統的靈敏度和選擇性以及線性度等主要技術指標都得到較好的解決。同時,隨著技術的不斷提高,對電路系統又提出了更高的要求,這就要求電路系統必須具有較低的相位噪聲,在現代技術中,相位噪聲已成為限制電路系統的主要因素。
  • 噪聲地圖在環境噪聲監測中的應用
    因此,本文以以青島理工大學新校區為例,採用變網格劃分法,研究了基於 GIS 方法的噪聲地圖在區域環境噪聲評價方面的應用。1.試驗 1.1研究方法對國內外主要的噪聲預測模型作對比和分析,選取最優的噪聲預測模型。
  • 一鍵聚焦 | 自主研發噪聲仿真軟體ProNas如何解決中高頻噪聲難題
    在當前解決中高頻噪聲的幾種主要理論方法中,ProNas能量有限元方法作為一種全新的可行有效的中高頻噪聲控制理論,具有較強的理論和應用價值。安世亞太基於ProNas能量有限元方法,聯合國際最先進的中高頻專家資源共同開發了擁有國內自主軟體著作權的中高頻噪聲仿真分析軟體ProNas,助力解決中高頻噪聲控制難題。