來源 | Object Instance Mining for WeaklySupervised Object Detection編輯 | Carol
出品 | AI科技大本營(ID:rgznai100)
商湯科技視頻大數據團隊發表論文《Object Instance Mining forWeakly Supervised Object Detection》,該論文被AAAI 2020錄用。
該團隊提出了一種端到端的物體實例挖掘弱監督目標檢測框架,引入了基於空間圖及外觀圖的信息傳播機制,在網絡迭代學習過程中,嘗試挖掘每張圖像中全部的物體實例。
除此之外,還引入了物體實例權重調整損失函數(reweighted loss),使網絡可以同時學習到更完整的物體實例,從而讓弱監督目標檢測方法得到更加準確的檢測框。
詳細解讀
目標檢測,是計算機視覺領域長期關注的問題,在自動駕駛、圖像理解、視頻監控等領域都有著廣泛的應用。然而基於深度學習技術的目標檢測器在網絡訓練中需要大量精確標註的物體邊界框,這些耗時耗力的標註工作阻礙了該技術在實際產品中的快速和廣泛應用,同時大量的人工標註也大大提高了產品成本。
為了解決這個局限性,僅使用圖片級別標註(既標註僅包含圖片中物體的類別)的弱監督目標檢測技術在近幾年受到了廣泛的關注和研究,具有重要的意義。
現有的弱監督目標檢測方法大多數是基於多實例學習框架的,對於每個物體類別,基於多實例學習框架的方法傾向於學習圖像中該類中特徵最明顯的物體,並對於每張圖片選取得分最大的一個物體框進行訓練,其他被忽略的物體實例容易使學習網絡陷入局部最優,進而影響弱監督目標檢測的性能。
本論文提出了一種端到端的物體實例挖掘(Object Instance Mining,OIM)弱監督目標檢測框架。該框架引入了基於空間圖(Spatial Graph)及外觀圖(Appearance Graph)的信息傳播機制,在網絡迭代學習過程中,嘗試挖掘每張圖像中全部的物體實例。
這樣使得在基於多實例學習方法的網絡學習過程中,特徵不夠顯著的物體實例可以被檢測到並加入訓練,進而提升特徵的表達能力和魯棒性。除此之外,商湯科技視頻大數據團隊還引入了物體實例權重調整損失函數(reweighted loss),使網絡可以同時學習到更完整的物體實例,從而讓弱監督目標檢測方法得到更加準確的檢測框。
基於物體實例挖掘(OIM)弱監督目標檢測框架結構如下圖所示:
物體實例挖掘(OIM)弱監督目標檢測框架
該框架主要由多實例檢測(Multiple Instance Detection)及目標實例挖掘(Object Instance Mining)兩個部分構成。在網絡訓練迭代過程中,論文先使用多實例檢測預測每個候選區域的類別,之後基於檢測的輸出及候選區域的特徵,通過建立空間圖及外觀圖儘可能挖掘圖像中的全部物體實例,並將它們加入訓練。其中物體實例挖掘過程如下圖所示:
物體實例挖掘過程示例。
在網絡訓練迭代過程中,在一幅圖中,首先學習/檢測到最具辨識力的物體實例,基於此實例通過位置關係,既其他候選框與此實例的重疊關係,建立空間圖(Spatial Graph),如圖(a)。
之後基於此實例,通過計算它與其他候選框之間的外觀相似度,挖掘圖片中可能屬於同一類別的物體實例,建立外觀圖(Appearance Graph),針對每一個新挖掘到實例同樣建立空間圖,如圖(b),(c)。以此步驟進行迭代訓練,直到挖掘出圖像中全部可能的物體實例加入訓練如圖(d)。
除此之外,由於在網絡迭代學習過程中,尤其是對於非剛性物體實例,基於CNN的分類器學習到的最具辨識力的是物體實例的某個局部而不是整個物體的整體,因此本論文設計了物體實例權重調整損失函數(reweighted loss), 以學習到更準確的物體檢測框。團隊提出對於不同的候選框應分配不同的權重,對於分類器置信度得分高的候選框分配較低的權重,反之對最高分候選框周圍的候選框分配較高的權重,從而學習更完整的物體實例檢測框。
團隊在PASCAL VOC 2007訓練集上進行了弱監督物體實例挖掘的過程的可視化,如下圖所示(從左到右),隨著網絡的迭代學習,更多更準確的物體實例可以被檢測出來並加入訓練中。
團隊使用 PASCAL VOC 2007及VOC 2012數據進行了測試,比較了物體實例挖掘(OIM)方法與其他相關弱監督檢測方法效果。結果表明,弱監督物體實例挖掘方法在定位精確率以及檢測準確率均達到或超過目前最先進的方法。
OIM與其他目前最先進的方法在PASCALVOC 2007 測試集上檢測精確度的比較(AP) (%)
OIM與其他目前最先進的方法在PASCALVOC 2007訓練驗證集上定位精確度的比較(CorLoc) (%)
OIM與其他目前最先進的方法在PASCALVOC 2012 驗證集/測試集上檢測精確度的比較(AP)(%)
OIM與其他目前最先進的方法在PASCALVOC 2012訓練驗證集上定位精確度的比較(CorLoc) (%)
論文:Object Instance Mining for WeaklySupervised Object Detection
論文作者:Chenhao Lin, Siwen Wang, Dongqi Xu, YuLu, Wayne Zhang
論文地址:https://arxiv.org/pdf/2002.01087.pdf
(*本文為投稿文章,投稿請微信聯繫1092722531)
為了助力對抗疫情,減少線下人員流動和聚集,CSDN與 PyCon 官方授權的 PyCon中國社區合作,舉行「Python開發者日」在線系列峰會。通過精彩的技術乾貨內容、有趣多元化的在線互動活動等,讓您足不出戶便可與大咖學習交流,共同渡過抗疫攻堅期。掃碼入群諮詢詳情!
2020年AI如何走?Jeff Dean和其他四位「大神」已做預測!AAAI 2020論文解讀:商湯科技發布新視頻語義分割和光流聯合學習算法微服務架構何去何從?微軟高管談微軟遠程辦公思考與實踐,值得每個企業看看網際網路人集體的遠程辦公終將是曇花一現?兩億人開啟在家辦公模式,看看程式設計師們怎麼說