曉查 發自 凹非寺量子位 報導 | 公眾號 QbitAI
來自官方的Mask R-CNN實現終於「又」來了!PyTorch官方Twitter今天公布了一個名為Mask R-CNN Benchmark的項目。
10個月前Facebook曾發布過名叫Detecron的項目,也是一款圖像分割與識別平臺,其中也包含Mask R-CNN。不過它是基於Caffe 2深度學習框架編寫的。這一次,在Caffe2項目併入PyTorch半年之後,Facebook換上了更受歡迎的PyTorch框架。
除了更改框架,Mask R-CNN Benchmark相比它的「前輩」Detectron,訓練速度提高了一倍。
Mask R-CNN Benchmark是一個完全由PyTorch 1.0寫成,快速、模塊化的Faster R-CNN和Mask R-CNN組件。該項目旨在讓用戶更容易地創建一種模塊,實現對圖片中物品的識別與分割。
負責這一項目的Facebook AI工程師Francisco Massa還在個人Twitter發了張自拍照,並使用新工具對圖片中的物品進行了識別,尷尬的是好像有些對象被識別錯誤:
第三方項目
在Facebook官方推出Mask R-CNN Benchmark之前,程式設計師們一直希望能用更流行的PyTorch取代Caffe 2實現Mask R-CNN,今年7月GitHub上有一名印度小哥完成任務。
另外,商湯和香港中文大學的多媒體實驗室也開源了一個類似項目:mmdetection。它支持Faster R-CNN、Mask R-CNN、RetinaNet等等,相比Facebook的Detecron有5%到20%的性能提升。這個模型還在2018年的COCO Detection競賽中拿下了冠軍。
那麼今天Facebook發布的Mask R-CNN Benchmark相比前兩者有哪些優點呢?
亮點
PyTorch 1.0編寫:RPN、Faster R-CNN和Mask R-CNN均可實現,達到甚至超出Detectron的準確度快速:訓練速度是Detectron的2倍,比mmdetection高30%。顯存效率更高:大約比mmdetection少使用500MB顯存支持多GPU訓練與推斷支持以CPU進行推斷支持圖像批處理:可分批分GPU對多圖進行推斷提供預訓練模型:針對幾乎所有引用Faster RCNN和Mask RCNN的架構PyTorch官方Twitter轉發了該項目,並希望mmdetection等項目都能使用一下。
安裝小貼士
使用Mask R-CNN Benchmark需要安裝以下組件:
PyTorch 1.0orchvisioncocoapiyacsmatplotlibOpenCV(可選)R-CNN發展歷史
R-CNN是卷積神經網絡(CNN)在圖像識別領域的應用,Facebook AI研究團隊在這條到道路上做出了頗多貢獻,其中不得不提一位大神:Ross Girshick。他發明了RCNN,又提出速度更快的Fast R-CNN。2016年,微軟研究院提出了Faster R-CNN,降低了在邊框搜索上的運算量,進一步提高了算法的速度。2017年,Facebook AI研究團隊又再次提出了Mask R-CNN:通過添加與現有分支並行的對象掩碼(object mask)分支,以增強Faster RCNN在邊框識別上的性能。
傳送門
Mask R-CNN Benchmark項目地址:https://github.com/facebookresearch/maskrcnn-benchmark
印度小哥的Mask R-CNN項目地址:https://github.com/wannabeOG/Mask-RCNN
Detecron項目地址:https://github.com/facebookresearch/Detectron
mmdetection項目地址:https://github.com/open-mmlab/mmdetection