魚羊 發自 凹非寺量子位 報導 | 公眾號 QbitAI
「視覺實力秀」,CVPR 2020 正在線上舉辦中。
本屆 CVPR 號稱十年來最難的一屆,共接收 6656 篇論文,中選 1470 篇,錄用率僅為 22%,為十年來最低的一次。
不過,中國軍團依然表現亮眼。學術界清華領銜,商湯則以62 篇論文入選的成績,領跑產業界。
成績亮眼,卻有些見怪不怪。畢竟,這已經不是商湯第一次在頂會上「一騎絕塵」。
此前的 ICCV 2019 上,商湯及其聯合實驗室就曾以入選 57 篇論文的成績引來矚目。
而這一次的 CVPR,在入選論文數上,商湯持續超越微軟、Facebook 等科技巨頭。
並且,又拿下了 CVPR 2020 ActivityNet 時空動作定位賽道、動作分類賽道,以及 CVPR 2020 NTIRE 競賽等3 項世界冠軍。
至此,成立 6 年以來,商湯已經在各種重要賽事中,斬獲了 60+ 個世界第一。
那麼,問題來了,商湯憑什麼?
62篇論文 + 3項世界冠軍,實現多領域技術突破
先來看看,商湯的 CVPR 2020 成績單背後,是怎樣的技術進展。
三項比賽中,ActivityNet 是視頻動作識別領域的重要實力檢驗競賽。
該項競賽歷年由 Google、Facebook、UC Berkeley 等頂尖院校與研究機構主辦,相關技術在視頻分析、活體檢測等多項實際應用中具有重要價值。
在 AVA-Kinetics 時空動作定位比賽中,依託自研技術對象-場景-對象推理網絡(ACAR-Net)和自有的深度學習超算平臺,商湯研究院和 X-Lab 及香港中文大學-商湯聯合實驗室團隊以絕對優勢奪得第一。
39.62mAP的成績,大幅領先今年的第二名 6.71 mAP。
在動作分類競賽中,商湯研究院和 X-Lab 及聯合實驗室團隊依託自有的深度學習超算平臺,在短時間內訓練了多個具有超深網絡的視頻分類模型。在多模型融合階段,商湯自研的時空交錯網路(TIN)同樣發揮重要作用。
由此,與 Google Cloud AI 拿下該項競賽的並列第一。
而 NTIRE(New Trends in Image Restoration and Enhancement)作為全球最全面的 low-level 視覺大賽之一,能夠直觀地反映出low-level 視覺這一熱門領域中研究進展和突破。
商湯研究團隊在 CVPR 2020 NTIRE 的真實圖像(Real World RGB Images)光譜重建(HS Reconsturction)賽道中,憑藉一種新的 4 級網絡結構,在增大感受野的同時,在不同級子網中做特徵提取,從而成功衛冕冠軍。
論文方面,商湯今年入選的 62 篇論文,同樣分布多個領域,包括:對抗式生成模型、三維點雲理解與分析、訓練加速與模型量化、視頻理解與分析、網絡結構搜索等。
例如,商湯入選 CVPR 2020 的論文《用於加速卷積神經網絡訓練過程INT8訓練技術》,就針對如何提升深度學習訓練速度的問題,提出了用於加速卷積神經網絡訓練過程的 INT8 訓練技術,採用 8 比特數值訓練模型,可以極大地提升訓練速度,減少計算損耗,而且訓練精度幾乎無損。
所以,商湯的秘訣是什麼?
答案還要從商湯自身的定位中尋找。
AI時代的「算法工廠」
據悉,目前商湯一共有約 4000 名員工,其中有 2500 多人都是算法和產品研發人員,超過總員工數的一半。
而商湯的路線,是依託這樣的技術力量,以「算法工廠」的模式,完成科研到產品的轉化。
什麼叫「算法工廠」?
商湯科技聯合創始人徐冰在公開演講中談到,現在,如何批量地生產針對不同物體和場景的模型,已經成為驅動 AI 增長、下一代技術演進的關鍵問題。
而成熟的深度學習訓練平臺,是能夠推動大規模新模型生成的。這也就促成了「算法工廠」概念的形成。
「算法工廠」具體如何體現?
最直接的改變,當然就是降本增效。
徐冰提到,在 15 年的時候,完成一個億分之一級別精度的行人識別模型,需要 10 個研究員,6 個月的時間。
而現在,同樣的模型,1 個研究員用 3 天時間就可以達到同樣的效果,而且使用的 GPU 資源只是原來的一半。
如此一來,訓練出的模型數量,就能遠遠超過研究人員的數量。當一個人平均能帶來 4-5 個,甚至幾十個工業級別模型,就能夠把人工智慧算法作為一種集中的服務,通過框架平臺直通終端客戶,更快地擴展應用範圍。
徐冰表示,有了算法工廠,有了更多的前端的感知能力,在商業上,可以看到的就是數位化進程的進一步加快,AI 在各個場景滲透率會迅速提高、功能數迅速增加,工業生產、城市治理、工作學習的各個方面都會受到顛覆性的影響。
簡而言之,打造「算法工廠」的目的很簡單——
實現 AI 大規模落地,進一步激發商業價值。
技術落地進行時
「算法工廠」帶來的能量,在疫情期間也得到了體現。
疫情期間,商湯和青島西海岸新區人民醫院合作,在一周時間內,按要求研發出來了針對新冠肺炎的 CT 影像篩查系統,並部署抗疫一線,幫助醫生提高診斷的準確率和效率。
這樣的速度,正是基於商湯打造的 SenseCare 智慧診療平臺。
實際上,除了影像科室,AI 醫療在心外科等臨床科室,也能積極發揮輔助作用。
比如心臟支架手術前,需要進行大量數據研判。在這個過程中,AI 可以在術前識別好血管曲率、 長度、直徑等核心指標,再進行支架放置手術模擬。這對於降低手術風險、提高手術效率而言很有幫助。
基於這樣的背景,商湯的 SenseCare 智慧診療平臺,提供了 AI 識別、輔助診療、手術規劃等服務,覆蓋消化內科、骨科、呼吸科、神經內科、放療、放射科、口腔科、心血管科等眾多科室。
並且,2019年,SenseCare 已經獲得了兩項國家藥監局認證,開始商業化進程。
另一個引人矚目的落地案例,是智慧城市。
近期,商湯在上海長寧區江蘇路街道率先試點 AI+ 一網統管,開發了「智能巡屏」等功能。
它基於商湯 SenseFoundry 方舟城市級開放視覺平臺,構建多場景、一站式 AI 城市治理解決方案,實現了 AI 研判處置全閉環管理,依次為自動發現、立案、智能派單、處置、自動核查、結案六大環節。
這樣的 AI 閉環管理,能有效解決暴露垃圾識別、共享單車亂堆放等城市痛點問題,大大提升城市管理效能。
此外,AI 技術落地的另一個趨勢,就是算法與硬體的結合。
比如大家熟悉的手機拍照。受到硬體極限的限制,億級別像素手機的出現,實際上就是軟體 + 算法 + 多鏡頭拍照的結合。
而商湯作為「AI工廠」輸出算法,已經幫助手機廠商實現了 60 倍變焦、暗光拍攝這樣廣為人知的功能。
如今,AI 早已滲透到生活的方方面面,尤其是今年以來,新冠疫情下,數位化成為驅動創新、帶動經濟增長的新動力,而AI正是推動這一進程的重要底層技術。
在這樣的背景之下,人工智慧已經邁向落地為王的時代。
而 5G 技術的普及、新基建大幕的拉開,更是 AI 企業化前沿技術為實際生產力的一陣東風。
對於商湯這樣的科技創業公司而言,這或許就是歷史賦予的最好機遇。
且拭目以待。
— 完 —