對於研究人工智慧的團隊來說,一年一度的CVPR是最佳的展示舞臺,也是檢驗自家技術水平的最佳場地。
在今年的CVPR上,來自上海的一家人工智慧公司——深蘭科技DeepBlue,在Cassava Disease Classification挑戰賽中,從全球88個團隊提交的超過1300份方案中脫穎而出,拿下冠軍。
國際計算機視覺與模式識別會議(CVPR)是IEEE一年一度的學術性會議,會議的主要內容是計算機視覺與模式識別技術,是世界頂級的計算機視覺會議之一。每年被收錄的論文均來自計算機視覺領域頂級團隊,代表著國際最前沿的科研技術,並指引著計算機視覺領域未來的研究方向。Cassava Disease Classification挑戰賽由FGVC舉辦,作為計算機視覺頂會CVPR的Workshop,其全稱為Fine-Grained Visual Categorization(細粒度圖像分類),是機器視覺社區剛剛開始解決的最有趣和最有用的開放問題之一。
CVPR挑戰賽冠軍
據了解,深蘭科技DeepBlueAI團隊參賽的是FGVC6中的Cassava Disease Classification挑戰賽,是一個根據木薯的葉子區分不同種類的木薯疾病的任務。本次參與者需要使用主辦方提供的9436張標記和12595張未標記圖片進行訓練數據。目標是學習一個模型,使用訓練數據中的圖像將給定的圖像分類為這4個疾病類別或健康葉子的類別。
關於細粒度圖像分類及用途,簡單來說,普通的分類問題只專注於區別出目標的大類,比如貓和狗,花和樹等。但是細粒度分類需要識別並區分非常精細的子類別。例如深蘭的商品識別模型中,不僅需要像一般識別問題那樣檢測出例如蘋果,菠蘿的大分類,同時還需要檢測出具體屬於哪一類蘋果,如富士,煙臺等。而通常屬於不同子類別的識別是非常相似的,例如富士,秦冠,富寒等等,我們不僅需要整體信息來識別它是「蘋果」,同時還需要局部信息來確定「蘋果」的品種。
據深蘭科技介紹,針對本次參賽訓練樣本較少問題,深蘭科技AI團隊除了利用交叉驗證和傳統的數據增強方式,還使用了RandomErasing和Cutout的方式,降低過擬合的風險並提高了模型魯棒性,使用了Mixup和label smoothing的訓練策略,將Top1準確率提高近一個百分點,使得計算損失函數時有效抑制過擬合現象。同時團隊還利用SE_ResNeXt50、SE_ResNeXt101、SENet154以及DenseNet201按照歸一化後權重的融合,最終以0.95的閾值篩選出一半的數據作為添加到訓練集的偽標籤數據,通過實驗證明了在訓練集中添加偽標籤後模型的泛化能力有顯著提升。
綜合以上種種策略,深蘭科技AI團隊最終成功完成Cassava病變細微差別區分任務,並以0.9386的分數獲得冠軍,領先第二名0.00309。
細粒度圖像分類技術大量落地應用
雖然這樣的差距看起來不大,在工業領域卻可能是可用與否之別,放到醫療領域,甚至可能把「救命」AI向前推進一大步。
以深蘭AI工業監測應用為例,細粒度圖像分裂技術已經實現了零件表面粗糙度超標識別,機加毛刺識別,機加接刀痕識別,線切割過切識別,以及零件碰傷,摺疊,機加後殘餘黑皮,開裂,機加工崩刀痕等等複雜環境下的監測識別。
另外,細粒度圖像分類研究方法還可以應用在高速公路上識別不同車輛的型號、在城市管理中識別不同車輛違規停放、在野外識別不同物種、在商店購物時識別不同的商品,細粒度圖像分類在這些任務裡面都扮演著極為重要的角色。
深蘭科技於2014年誕生在上海,設立以來,該公司一直強調自己「致力於人工智慧基礎研究和應用開發」。此外,深蘭科技還把自己定位為一家「平臺型的AI MAKER」。官方資料顯示,深蘭科技在人工智慧領域的布局極為廣泛,公司的核心技術包括:計算機視覺、自動駕駛、生物智能、語義智能,所覆蓋的應用領域有:智能駕駛、智慧機器人、生物智能、智能零售、智能語音、安防、晶片、教育和智能城市。