CVPR 2020商湯斬獲3冠!62篇論文入選,算法工廠憑什麼領跑行業?

2021-01-10 量子位

魚羊 發自 凹非寺量子位 報導 | 公眾號 QbitAI

「視覺實力秀」,CVPR 2020 正在線上舉辦中。

本屆 CVPR 號稱十年來最難的一屆,共接收 6656 篇論文,中選 1470 篇,錄用率僅為 22%,為十年來最低的一次。

不過,中國軍團依然表現亮眼。學術界清華領銜,商湯則以62 篇論文入選的成績,領跑產業界。

成績亮眼,卻有些見怪不怪。畢竟,這已經不是商湯第一次在頂會上「一騎絕塵」。

此前的 ICCV 2019 上,商湯及其聯合實驗室就曾以入選 57 篇論文的成績引來矚目。

而這一次的 CVPR,在入選論文數上,商湯持續超越微軟、Facebook 等科技巨頭。

並且,又拿下了 CVPR 2020 ActivityNet 時空動作定位賽道、動作分類賽道,以及 CVPR 2020 NTIRE 競賽等3 項世界冠軍。

至此,成立 6 年以來,商湯已經在各種重要賽事中,斬獲了 60+ 個世界第一。

那麼,問題來了,商湯憑什麼?

62篇論文 + 3項世界冠軍,實現多領域技術突破

先來看看,商湯的 CVPR 2020 成績單背後,是怎樣的技術進展。

三項比賽中,ActivityNet 是視頻動作識別領域的重要實力檢驗競賽。

該項競賽歷年由 Google、Facebook、UC Berkeley 等頂尖院校與研究機構主辦,相關技術在視頻分析、活體檢測等多項實際應用中具有重要價值。

在 AVA-Kinetics 時空動作定位比賽中,依託自研技術對象-場景-對象推理網絡(ACAR-Net)和自有的深度學習超算平臺,商湯研究院和 X-Lab 及香港中文大學-商湯聯合實驗室團隊以絕對優勢奪得第一。

39.62mAP的成績,大幅領先今年的第二名 6.71 mAP。

在動作分類競賽中,商湯研究院和 X-Lab 及聯合實驗室團隊依託自有的深度學習超算平臺,在短時間內訓練了多個具有超深網絡的視頻分類模型。在多模型融合階段,商湯自研的時空交錯網路(TIN)同樣發揮重要作用。

由此,與 Google Cloud AI 拿下該項競賽的並列第一。

而 NTIRE(New Trends in Image Restoration and Enhancement)作為全球最全面的 low-level 視覺大賽之一,能夠直觀地反映出low-level 視覺這一熱門領域中研究進展和突破。

商湯研究團隊在 CVPR 2020 NTIRE 的真實圖像(Real World RGB Images)光譜重建(HS Reconsturction)賽道中,憑藉一種新的 4 級網絡結構,在增大感受野的同時,在不同級子網中做特徵提取,從而成功衛冕冠軍。

論文方面,商湯今年入選的 62 篇論文,同樣分布多個領域,包括:對抗式生成模型、三維點雲理解與分析、訓練加速與模型量化、視頻理解與分析、網絡結構搜索等。

例如,商湯入選 CVPR 2020 的論文《用於加速卷積神經網絡訓練過程INT8訓練技術》,就針對如何提升深度學習訓練速度的問題,提出了用於加速卷積神經網絡訓練過程的 INT8 訓練技術,採用 8 比特數值訓練模型,可以極大地提升訓練速度,減少計算損耗,而且訓練精度幾乎無損。

所以,商湯的秘訣是什麼?

答案還要從商湯自身的定位中尋找。

AI時代的「算法工廠」

據悉,目前商湯一共有約 4000 名員工,其中有 2500 多人都是算法和產品研發人員,超過總員工數的一半。

而商湯的路線,是依託這樣的技術力量,以「算法工廠」的模式,完成科研到產品的轉化。

什麼叫「算法工廠」?

商湯科技聯合創始人徐冰在公開演講中談到,現在,如何批量地生產針對不同物體和場景的模型,已經成為驅動 AI 增長、下一代技術演進的關鍵問題。

而成熟的深度學習訓練平臺,是能夠推動大規模新模型生成的。這也就促成了「算法工廠」概念的形成。

「算法工廠」具體如何體現?

最直接的改變,當然就是降本增效。

徐冰提到,在 15 年的時候,完成一個億分之一級別精度的行人識別模型,需要 10 個研究員,6 個月的時間。

而現在,同樣的模型,1 個研究員用 3 天時間就可以達到同樣的效果,而且使用的 GPU 資源只是原來的一半。

如此一來,訓練出的模型數量,就能遠遠超過研究人員的數量。當一個人平均能帶來 4-5 個,甚至幾十個工業級別模型,就能夠把人工智慧算法作為一種集中的服務,通過框架平臺直通終端客戶,更快地擴展應用範圍。

徐冰表示,有了算法工廠,有了更多的前端的感知能力,在商業上,可以看到的就是數位化進程的進一步加快,AI 在各個場景滲透率會迅速提高、功能數迅速增加,工業生產、城市治理、工作學習的各個方面都會受到顛覆性的影響。

簡而言之,打造「算法工廠」的目的很簡單——

實現 AI 大規模落地,進一步激發商業價值。

技術落地進行時

「算法工廠」帶來的能量,在疫情期間也得到了體現。

疫情期間,商湯和青島西海岸新區人民醫院合作,在一周時間內,按要求研發出來了針對新冠肺炎的 CT 影像篩查系統,並部署抗疫一線,幫助醫生提高診斷的準確率和效率。

這樣的速度,正是基於商湯打造的 SenseCare 智慧診療平臺。

實際上,除了影像科室,AI 醫療在心外科等臨床科室,也能積極發揮輔助作用。

比如心臟支架手術前,需要進行大量數據研判。在這個過程中,AI 可以在術前識別好血管曲率、 長度、直徑等核心指標,再進行支架放置手術模擬。這對於降低手術風險、提高手術效率而言很有幫助。

基於這樣的背景,商湯的 SenseCare 智慧診療平臺,提供了 AI 識別、輔助診療、手術規劃等服務,覆蓋消化內科、骨科、呼吸科、神經內科、放療、放射科、口腔科、心血管科等眾多科室。

並且,2019年,SenseCare 已經獲得了兩項國家藥監局認證,開始商業化進程。

另一個引人矚目的落地案例,是智慧城市。

近期,商湯在上海長寧區江蘇路街道率先試點 AI+ 一網統管,開發了「智能巡屏」等功能。

它基於商湯 SenseFoundry 方舟城市級開放視覺平臺,構建多場景、一站式 AI 城市治理解決方案,實現了 AI 研判處置全閉環管理,依次為自動發現、立案、智能派單、處置、自動核查、結案六大環節。

這樣的 AI 閉環管理,能有效解決暴露垃圾識別、共享單車亂堆放等城市痛點問題,大大提升城市管理效能。

此外,AI 技術落地的另一個趨勢,就是算法與硬體的結合。

比如大家熟悉的手機拍照。受到硬體極限的限制,億級別像素手機的出現,實際上就是軟體 + 算法 + 多鏡頭拍照的結合。

而商湯作為「AI工廠」輸出算法,已經幫助手機廠商實現了 60 倍變焦、暗光拍攝這樣廣為人知的功能。

如今,AI 早已滲透到生活的方方面面,尤其是今年以來,新冠疫情下,數位化成為驅動創新、帶動經濟增長的新動力,而AI正是推動這一進程的重要底層技術。

在這樣的背景之下,人工智慧已經邁向落地為王的時代。

而 5G 技術的普及、新基建大幕的拉開,更是 AI 企業化前沿技術為實際生產力的一陣東風。

對於商湯這樣的科技創業公司而言,這或許就是歷史賦予的最好機遇。

且拭目以待。

— 完 —

相關焦點

  • 商湯科技44篇論文入選CVPR 2018
    據CVPR官網顯示,今年有超過3300篇的大會論文投稿,錄取的979篇論文,比去年增長了25%(2016年論文錄取783篇)。這些錄取的最新科研成果,涵蓋了計算機視覺領域各項前沿工作。  商湯科技、香港中文大學-商湯科技聯合實驗室以及其他商湯科技聯合實驗室共有44篇論文被本屆CVPR大會接收,其中包括口頭報告論文3篇(錄取率僅62/3300= 1.88%),亮點報告論文13篇,論文錄取數量相較於CVPR 2017的23篇又有大幅度提高,成績斐然。
  • 商湯科技入選 CVPR 2018 的 44 篇論文,都研究什麼?
    雷鋒網(公眾號:雷鋒網) AI 科技評論按:本文由商湯科技獨家投稿,AI 科技評論獲其授權轉載。
  • 一騎絕塵 商湯科技 44 篇論文入選 CVPR 2018
    CVPR 作為計算機視覺領域級別最高的研究會議,其錄取論文代表了計算機視覺領域在 2018 年最新和最高的科技水平以及未來發展潮流。CVPR 官網顯示,今年有超過 3300 篇的大會論文投稿,錄取的 979 篇論文,比去年增長了 25%(2016 年論文錄取 783 篇)。這些錄取的最新科研成果,涵蓋了計算機視覺領域各項前沿工作。
  • 一騎絕塵 商湯科技44篇論文入選CVPR 2018
    CVPR作為計算機視覺領域級別最高的研究會議,其錄取論文代表了計算機視覺領域在2018年最新和最高的科技水平以及未來發展潮流。CVPR官網顯示,今年有超過3300篇的大會論文投稿,錄取的979篇論文,比去年增長了25%(2016年論文錄取783篇)。這些錄取的最新科研成果,涵蓋了計算機視覺領域各項前沿工作。
  • CVPR,華人包攬!斬獲全部獎項,近四成中國作者,清華最多
    接下來有請(此處可有掌聲),本屆獲得如此殊榮的「選手」:本屆 CVPR 最佳論文獎,由來自牛津大學的團隊斬獲。商湯科技及聯合實驗室,本次共有62篇論文入選,並且拿下了CVPR 2020 ActivityNet動作分類比賽、時空動作定位比賽,以及CVPR 2020 NTIRE真實圖像(Real World RGB Images)光譜重建(HS Reconstruction)賽道冠軍。
  • 百度多篇論文入選NeurIPS 2020,機器學習領先算法、理論「強輸出」
    此次大會中,百度研究院參會並發表了多篇高質量論文,論文聚焦大規模稀疏學習的加速求解、新發現物種數量預測、隨機非凸優化、高維數據判別分析等問題,分別提出了創新算法及理論,突破原有算法在實際應用中泛化效果差、優化效率低等限制,有效提升AI技術在自然生態學、統計學習理論等領域中的應用價值,同時也彰顯出百度在人工智慧與機器學習領域的持續技術創新力。
  • 回顧魔幻的2020,「史上最難ECCV」,3篇論文入選,獲得2項冠軍,ONEMEE科學家再攀高峰
    與今年六月舉辦的CVPR 2020類似,本屆ECCV 2020也堪稱「史上最難ECCV」——有效投稿5025篇,比ECCV 2018的兩倍還多,最終被接受發表論文1361篇,錄取率為27%,較上屆下降約5%。
  • CVPR 2017國內外亮點論文匯集:史上最盛大會議,華人佔據半壁江山
    阿里巴巴 據機器之心了解,阿里巴巴共有四篇論文被 CVPR 2017 接收,其中阿里 AI Lab 3 篇,阿里 iDST 1 篇;阿里 iDST 視覺計算負責人華先勝華先勝也將在 ReID & MTMCT Workshop 上發表題為《Practices of Large-Scale Target Re-Identification
  • CVPR 2018 | 商湯科技Oral論文詳解:BlockQNN自動網絡設計方法
    上周,商湯科技宣布以44篇論文入選CVPR 2018,吸引了諸多朋友點讚。接下來幾周,我們將陸續發布商湯科技入選CVPR 2018的重點論文解讀報導,歡迎大家關注。以下是在大規模分布式訓練領域,商湯科技發表的一篇重磅大會口頭報告(Oral)論文,提出基於分布式訓練的深度增強學習BlockQNN算法,自動設計神經網絡結構。本文由商湯科技實習研究員鍾釗在商湯科技研究院副院長閆俊傑和研究經理武偉指導下完成。
  • 百度的CVPR2020高光時刻——22篇論文 8項冠軍 2場Workshop
    近日,全球計算機視覺頂會CVPR 2020首次召開線上大會,百度不僅入選22篇接收論文,一舉拿下8項挑戰賽冠軍,涵蓋視頻動作分析、動作識別、圖像增強、智慧城市等多個領域,還主辦了2場重量級學術Workshop,在國際舞臺盡顯中國AI硬實力。這不僅從側面反映了百度傾斜AI「新基建」的策略已有成效,也再次讓中國自有的深度學習平臺飛槳閃耀全球。
  • 22篇入選CVPR 2020,百度 15 篇精選論文詳解
    今年,在6656篇有效投稿中,共有1470篇論文被接收,接收率為22%左右,相較去年25%的入選率,同比下降3%。本屆大會中,百度共有22篇論文入選,涉及主題涵蓋人臉檢測&識別、視頻理解&分析、圖像超分辨、及自動駕駛中的車輛檢測、場景實例級分割等領域。
  • CVPR 2020論文收錄揭曉:百度22篇論文入選 涵蓋全視覺領域
    近日,計算機視覺領域「奧斯卡」CVPR 2020官方公布論文收錄結果,伴隨投稿數量激增,接收率開始經歷了一個持續下降的過程。今年,在6656篇有效投稿中,共有1470篇論文被接收,接收率為22%左右,相較去年25%的入選率,同比下降3%。在論文接收率下降的同時,中國科技企業被錄取論文數量卻不降反增,百度作為AI代表企業今年中選22篇,比去年的17篇增加了5篇。
  • 優必選斬獲 IJCAI 2017最佳學生論文獎,13篇論文入選
    該會議聚集了人工智慧領域最頂尖的研究者和優秀從業者,關注研討領域涵蓋機器學習、計算可持續性、圖像識別、語音技術、視頻技術等,對全球人工智慧行業具有巨大影響力。隨著近年來人工智慧領域的研究和應用持續升溫,越來越多的國內企業和學者也在積極參與 IJCAI 並發表論文。今年,IJCAI共收到2540篇論文投稿,再創歷史新高,最終錄用660篇,錄用率為26%。
  • CVPR2020即將舉行 優必選科技12篇入選論文搶先看
    6月14-19 日,大家期待已久的國際計算機視覺與模式識別頂級會議 CVPR 2020 將舉行。  本屆CVPR共收到6656篇投稿,有1470篇論文被接收,錄用率約22%,創下十年以來的最低記錄。
  • 年度最精彩研究,CVPR 2017六篇最佳論文介紹(附打包下載)| CVPR...
    ,共有6篇論文獲得四項榮譽。為了保留標註信息、避免圖像瑕疵、穩定訓練過程,論文中對標準 GAN 算法進行了幾個關鍵的修改,分別對應「自我正則化」項、局部對抗性失真損失、用過往的美化後圖像更新鑑別器。對於車輛圖像,標註速度可以提升至7.3倍,重合度達到82.2%。論文中也研究了這種方法對於從未見過的數據集的泛化能力。
  • 十年來最難的一屆CVPR 酷家樂兩篇論文成功入選
    作為十年來論文接受率最低的一屆CVPR,足見CVPR2020沉甸甸的含金量。而在入選的中國企業名單中,除了百度、騰訊、華為、曠視,家居SaaS獨角獸酷家樂也赫然在列。資料顯示,本屆CVPR共收到6656篇有效投稿,比去年增加了近29%,其中有1470篇論文被接收,接收率約22%,是近十年接受率最低的一屆。被錄取的論文主要涵蓋計算機視覺領域的最新科研成果。值得注意的是,深根於家居行業,酷家樂前沿技術實驗室KooLab遞交的兩篇論文皆被錄用,躋身中國論文發布成功的少數科技公司之一。
  • 阿里平頭哥三篇論文入選ISCA2020;官方公布華為P40圓角曲率輪廓…
    打開APP 阿里平頭哥三篇論文入選ISCA2020;官方公布華為P40圓角曲率輪廓… Norris 發表於 2020-03-26 09:07:14
  • 優必選獲IJCAI 2017最佳學生論文獎 13篇論文入選國際頂級人工智慧...
    該會議聚集了人工智慧領域最頂尖的研究者和優秀從業者,關注研討領域涵蓋機器學習、計算可持續性、圖像識別、語音技術、視頻技術等,對全球人工智慧行業具有巨大影響力。隨著近年來人工智慧領域的研究和應用持續升溫,越來越多的國內企業和學者也在積極參與 IJCAI並發表論文。今年,IJCAI共收到2540篇論文投稿,再創歷史新高,最終錄用660篇,錄用率為26%。
  • 全球計算機視覺頂會CVPR 2020論文出爐:騰訊優圖17篇論文入選
    全球計算機視覺頂級會議CVPR2020 (IEEE Conference on Computer Vision and Pattern Recognition,即IEEE國際計算機視覺與模式識別會議) 即將於2020年6月14日-19日在美國西雅圖召開。本屆大會總共錄取來自全球論文1470篇,騰訊優圖實驗室入選17篇。
  • 阿里巴巴18篇論文入選機器學習頂會KDD 2020
    5月25日,國際機器學習頂會KDD 2020公布了論文入選結果,阿里巴巴18篇論文入選,是近幾年KDD會議論文入選數量最多的科技公司之一。據介紹,18篇論文中,涵蓋阿里巴巴在認知智能、曝光偏差、圖表示學習等前沿AI領域的研究突破。