從AutoML到AutoNLP,深蘭自研系統再發力奪冠NeurIPS 2019

2021-01-17 環球網

加拿大當地時間12月8日-14日,全球最受矚目的人工智慧和機器學習領域的頂級盛會之一,第33屆神經信息處理系統大會(NeurIPS 2019)在溫哥華召開。深蘭科技DeepBlueAI團隊分別在D-City & BDD100K 目標檢測挑戰賽和AutoDL挑戰賽(AutoNLP)中獲得冠軍,從技術層面助推了自動駕駛領域的發展和自然語言處理在多應用場景的落地。

NeurIPS每年都會吸引大量專家、學者和AI領域從業人員的參與,目的是促進神經信息處理系統在生物、技術、數學和理論方面的研究交流。據大會官方統計,今年參會總人數突破了13000人。

目標檢測的競賽幾乎出現在所有人工智慧相關的國際頂級會議上,本屆NeurIPS也不例外。D-City & BDD100K 目標檢測挑戰賽中的D-City是一個大型的駕駛視頻數據集,提供超過10000個以720p高清或1080p FHD格式錄製的DashCam視頻。大約1000個視頻在所有道路物體的每一幀中都帶有檢測和跟蹤注釋,涵蓋了共12類行車和道路相關的目標類別。與現有數據集相比,D-City顯示出更大的多樣性,因為數據來自中國多個城市,具有不同的天氣、道路和交通條件。挑戰賽希望通過該數據

集鼓勵和幫助自動駕駛相關領域研究取得新進展

任務針對目標檢測提出了一種遷移學習挑戰。根據美國收集的BDD(Berkeley Deep Drive)100K數據集的標註數據訓練,要求參與者提供中國收集的D-City數據集的目標檢測結果,數據可能涵蓋各種情況,甚至嚴重或罕見的情況(如昏暗的光線、雨霧和交通擁擠)。數據集受限、數據分布差異等使得競賽難度變大。DeepBlueAI團隊提取深層特徵,利用級聯式模型預測出圖像中的目標,準確率(mAP)達到36.9。最終團隊經過不斷嘗試和調整,獲得該競賽的冠軍。

本年度,自然語言處理NLP(Natural Language Processing)在深度學習浪潮下取得了顯著成就,也成為大會重要議題之一。NLP是人工智慧的一個子領域,也是最為困難的問題之一。而AutoNLP則是近來比較前沿的領域,目標就是在沒有人類幹預的情況下,對自然語言處理任務進行訓練和預測。其應用場景也較為豐富,比如對線上客服系統,AutoNLP可以根據用戶提交諮詢、客戶投訴反饋的各類留言信息,做自動化分類訓練,幫助業務快速準確地區分投訴問題。

競賽組織方公布了5個離線公共數據集、5個線上公共數據集(用於盲測,選手無法獲得數據集任何信息)。選手下載離線公共數據集,開發全自動的文本分類系統,實現接收原始未經預處理的文本訓練數據、全自動地完成文本預處理、模型結構設計和參數調優等過程。隨後將設計的自動文本分類系統上傳至比賽平臺上,通過5個線上公共數據集評估其AutoNLP方案的實時性能反饋,期間不會有任何人工幹預,也據此得出預賽階段的排名。

據DeepBlueAI團隊介紹,冠軍方案實現的AutoNLP框架,包括文本數據的自動清洗與序列化、自動特徵工程、自動超參調優、自動模型融合以及自動模型選擇等模塊,同時針對性地分別處理中文和英文,從不同角度觀察文本,最後綜合所有信息進行分類,這裡「綜合」的過程就是集成學習。此外,團隊在運行時間和顯存上也採取了一些控制策略,防止系統超時和顯存溢出。這是繼深蘭AutoML在KDD2019奪冠後,又一自研系統獲得國際頂會的冠軍。

2019年,深蘭科技在多個國際頂級賽事上取得了不俗的成績,包括KDD、IEEE ISI、CVPR、ICCV、SIGIR等,已經累計獲得13項世界冠軍,涉及領域涵蓋目標跟蹤、動作識別、自動駕駛、圖像分類等,希望推進前沿技術從研究到實際應用的落地,為用戶帶來價值,為民生帶來改變。此次NeurIPS 2019又得雙冠,再次證明了深蘭在基礎研究方面的實力,為2019畫上了圓滿的句點。

相關焦點

  • 深蘭科技:我們是如何拿下今年 KDD CUP AutoML 賽道冠軍的?
    作為 AutoML 賽道的冠軍隊伍,深蘭科技在儀式結束後接受了 AI 開發者專訪,不嗇分享其在賽事中奪魁的點滴。因此,我們認為這次AutoML競賽對推動AutoML的發展具有重要意義。深蘭科技在自身產品的開發中也已使用了自研AutoML系統,以深蘭科技應用於建青實驗學校的AI教育「一手通」為例,通過這款系統設備採集的數據,再經過AutoML系統自動建模可以分析出學生的興趣愛好,隨後進行個性化教學。
  • 深蘭科技斬獲IEEE ISI冠軍,其Auto ML 技術加速企業AI升級新進程
    1、力克英美德等七國「勁敵」中國自研AutoML技術斬獲IEEE ISI冠軍近日,來自中國上海的AI獨角獸——深蘭科技DeepBlueAI團隊,在IEEE ISI 2019國際大數據分析競賽上分別取得了一項冠軍和一項季軍。
  • 深蘭:貓頭鷹多功能體溫行為追蹤監控系統
    疫情爆發後,深蘭科技科研團隊積極研發新產品,快速落地一款新型多功能體溫行為追蹤監控系統。該系統由深蘭科技山東自動駕駛研究院100%自主研發,取名為「貓頭鷹多功能體溫行為追蹤監控系統」,寓意其具備如貓頭鷹一般的視覺識別能力。 據深蘭科技相關負責人介紹,該系統採用紅外熱成像技術和自主研發的機器視覺算法,深度融合紅外和可見光圖像,實現360°自動巡視、瞄準、定位及跟蹤等功能,可同時識別跟蹤10人以上的人體目標,體溫靈敏度達到0.1℃。
  • 深蘭奪冠ACM MM 2020,方案有效提升自動駕駛、安防監控領域安全性
    2020年10月12-16日,多媒體領域的國際頂級會議ACM MM 2020在美國西雅圖舉行,深蘭科技再傳捷報,獲得了Video Relation Understanding競賽/視頻目標檢測任務的第一名,以及異常事件檢測挑戰賽/常規異常事件檢測任務的第三名。
  • 「重慶交大-深蘭AI科創大賽」在南岸區舉行
    日前,2020線上智博會專項賽「重慶交大-深蘭AI科創大賽」在重慶交通大學智能交通大數據中心舉行。此次比賽旨在推動重慶地區人工智慧相關企業的發展以及高校人工智慧學科建設和人才培養,促進人工智慧技術及行業的長足進步。  大賽共吸引全國高校200多人次報名,經歷專家團隊初審和決賽答辯環節,評選出了10強獲獎團隊。
  • 目標檢測挑戰真實複雜場景 深蘭科技摘CVPR2020四冠
    這些獲獎方案不僅彰顯了深蘭科技的技術硬實力,更在應用落地上體現了很大的空間,涉及自動駕駛、城市管理、環境感知、服裝輔助設計、農業等諸多領域,用AI賦能行業發展、推動新基建進程。夜間行人檢測是許多系統,如安全可靠的自動駕駛汽車的關鍵組成部分,但使用計算機視覺方法解決夜間場景的檢測問題並未受到太多關注,因此 CVPR開展了相應的比賽,以期引起更多關注。該挑戰賽總共設有3個賽題,深蘭科技DeepBlueAI團隊便拿下兩冠一亞。
  • NeurIPS 2019 程序委員會主席發聲明:19 篇論文因一稿多投被拒收!
    以下為 NeurIPS 2019 程序委員會主席的聲明全文。論文作者們可以在 7 月 25 日(星期四)到7 月 31 日(星期三)的時間內撰寫並提交自己的反駁意見(rebuttal),他們可以在這份 rebuttal 中回應審稿人關注的問題,並澄清審稿意見中可能存在的誤解和真實存在的錯誤。之後,審稿人和領域主席(AC)將針對作者的反饋進行討論,從而給出最後的接收/拒收建議。
  • AutoML在IEEE-ISI World Cup 2019競賽中的應用:冠軍團隊DeepBlue...
    雷鋒網 AI 科技評論按,近日,IEEE ISI 2019 國際大數據分析競賽結果出爐,今年的競賽包括企業投資價值評估和法律訴訟類型預測兩個賽題,來自深蘭科技北京 AI 研發中心的 DeepBlueAI 團隊分別取得了一項冠軍和一項季軍的優異成績,本文作者羅志鵬(深蘭科技北京 AI 研發中心),他為雷鋒網 AI 科技評論獨家撰寫了該團隊在企業投資價值評估賽題中的算法思路與技術細節分享
  • 17篇論文,詳解圖的機器學習趨勢 | NeurIPS 2019
    這個工作怎麼說呢?簡直是不能再棒了!論文的重點是,用一個馬爾科夫邏輯網絡定義知識圖中的三元組上的聯合分布(當然了,這種做法要對未觀察到的三元組做一些限制,因為枚舉出所有實體和關係上的所有三元組是做不到的),並給邏輯規則設定一個權重;你可以再自己選擇一個預訓練知識圖嵌入(可以選TransE或者ComplEx,實際上隨便選一個都行)。
  • 為何量子計算機遭遇「難產」-深蘭科技
    DeepTalk深言堂 8月12日,在深蘭科學院的 作為深蘭科技下屬深蘭科學院打造的重要的學術陣地、學習平臺,DeepTalk由內外部專家、博士組成的講師團隊,定期分享業界動態、 前沿技術、科研成果,行業趨勢等,為科研技術人員不斷注入學習激情和能量。 量子計算再解讀 儘管學術和工業界在共同努力,但實用量子計算仍然是難以實現的目標,一個重要的原因是難以對量子比特(qubit)執行糾錯。
  • 深蘭科技與桐樹生物達成戰略合作 攜手開啟醫療智能化新篇章
    收購位於上海靜安的醫檢所是深蘭科技既定戰略實施的重要一環:醫檢所將作為深蘭科技開展腫瘤精準診斷業務,基因測序業務的臨床診斷實驗平臺,為後續業務發展提供專業臨床醫學技術支撐。強強聯手 人工智慧助力實現精準醫療除了併購籤約,深蘭科技與桐樹生物還籤署了戰略合作協議。此次合作將依託雙方在各自領域的領先地位和資源,優勢互補,在病理診斷、腫瘤分析、基因研究等方面進行合作,將人工智慧與病理、基因等大數據研究進行銜接,實現多模態精準輔助診斷系統的研發和落地。
  • 恐龍題材手遊口袋侏羅紀 網易大作再發力
    《口袋侏羅紀》是由網易操刀自研首款恐龍題材手遊,繼網易自研旗艦手遊《迷你西遊》、《亂鬥西遊》等上線以來取得優異表現,網易精品手遊戰略穩步推進,再度發力手遊市場,《口袋侏羅紀》重磅來襲,即將在國內上線中文版。
  • 嚴禁一稿多投:NeurIPS 2019剛剛斃掉了19篇論文
    改一改再投也不行?NeurIPS 的程序主席們表示他們還在審查一些疑似與其他 AI 學術會議投稿雷同的論文,未來拒稿的數字可能還會增加。「隨著 NeurIPS 2019 大會的審稿工作完成,作者回應階段開始,我們現在要宣布有關程序主席(PC)審稿策略的更新了,」Hugo Larochelle 說道。
  • 改造升級後的江漢路步行街都有哪些深蘭元素
    深蘭科技以技術創新為驅動,利用自主研發的計算機視覺,生物智能技術,為江漢區智慧街區量身打造了智慧街區綜合管理平臺,提供了一系列智能化便民服務設施,推動步行街成為「場景智能,服務智能」的標杆街區。深蘭智慧街區綜合管理平臺點亮步行街為全國性示範級智慧街區,深蘭科技利用物聯網、AI視頻分析、5G、人工智慧等技術,為江漢路步行街「智慧街區」建設了物聯網管理系統並打造了智慧街區綜合管理平臺。
  • 深蘭獲ACM MM 2020冠軍,視頻目標檢測挑戰劇烈抖動、消失重現等難點
    2020年10月12-16日,多媒體領域的國際頂級會議ACM MM 2020在美國西雅圖舉行,深蘭科技再傳捷報深蘭科技深蘭科技的明星產品「熊貓智能公交車」 就有多個功能獲益於這些獲獎方案,除了領先的自動駕駛技術,車內還打造了「智能客艙」,其中的「異常行為識別系統」就包括了車廂內摔倒、偷盜等行為報警等功能。
  • 提高效率降低人工,深蘭科技用人工智慧機器視覺賦能工業監測
    作為人工智慧領域領先企業,深蘭科技充分把握工業檢測領域的客戶核心需求,從行業痛點入手研發了系列解決產業痛點的技術和產品,以先進的AI工業視覺技術正在賦能工業領域。深蘭科技工業質檢項目負責人表示,基於人工智慧深度學習算法,深蘭智能質檢設備是由數據驅動的、自發的機器學習,擁有推理機制,自適應的完成最優特徵提取以及判決條件最優化,訓練完成後可以隨數據完備進一步進化,通過圖像處理算法自動生成訓練樣本,避免重複搜集相似圖片,可有效解決數據量問題,兼具易用性和成長性,能夠通過敏捷開發,並快速響應客戶定製化需求。
  • 深蘭國開基因科技(山東)有限公司暨章丘核酸檢測一體機工廠正式啟用
    12月9日上午,深蘭國開基因科技(山東)有限公司及章丘核酸檢測一體機工廠在章丘區龍山人工智慧谷正式啟用,深蘭AI健康監測智能魔鏡及AI病毒核酸PCR檢測一體機兩款產品舉行批量採購合作籤約儀式。深蘭的智能魔鏡產品運用深蘭科技自主研發的AI複雜建模算法,基於人臉的成像和皮下光學信息,實現了對個體的面容年齡、性別、BMI指數、血壓、血糖、血脂等生理指標的預測模型構建。
  • 深蘭科技方林博士:結伴學習讓機器懂審美
    而在這一大時代下,今天我們有幸請到了AI獨角獸企業深蘭科技集團深度學習科學家方林博士,為我們揭秘人工智慧領域的領先科技及研究成果,解讀行業趨勢和發展方向。方林:目前,我在深蘭科技進行一項稱作「結伴學習」的研究。原理是將樣本成對地輸入到模型中進行訓練。學習過程中,兩個樣本之間互相促進、互相提高。記者:能否結合實例解讀結伴學習研究?研究能夠產生什麼實際作用?方林:近期,我們團隊正在研發一個人工智慧時裝設計系統。在這個系統中,結伴學習能夠準確地抓取時裝的特徵。
  • 世界第一再衝地表12強冠軍,2019奪冠+100萬,2020即將起航
    世界第一再衝地表12強冠軍,2019奪冠+100萬,2020即將起航柳號桌球觀察北京時間1月1日,中國桌球隊「地表最強12人」正式開打。女子單打方面,世界第一「大夢」陳夢是奪冠最大熱門,她在第一輪的對手是削球美女劉斐。陳夢在這場比賽中優勢明顯,但必須謹防年度總決賽的開局慢熱!陳夢目前世界排名第一位,是去年「地表最強12人」冠軍並獲得100萬獎金。她在近期狀態非常火爆,是2017年、2018年、2019年連續三年的年度總決賽女子單打冠軍。
  • 蘋果11月11日再開發布會 首款自研電腦晶片或亮相
    蘋果11月11日再開發布會 首款自研電腦晶片或亮相 相關閱讀:蘋果11日將發三款蘋果晶片Mac:13寸和16寸MBP 還有13寸MBA    北京時間11月3日凌晨消息,剛剛蘋果發布邀請函,確認將於當地時間11月10日(北京時間2020年11月11日凌晨2點)在Apple