導讀:飛槳(PaddlePaddle)致力於讓深度學習技術的創新與應用更簡單。為了讓更多的開發者了解飛槳的最近技術進展,特別組織了系列技術稿件,視頻來源於2019 WaveSummit秋季深度學習開發者峰會上的技術公開課。
本期是由百度飛槳資深研發工程師為大家帶來圖像分割庫PaddleSeg深度解析與應用,敬請觀看。
視頻關鍵知識點Notes:
PaddleSeg四個特點:一是豐富的數據增強;二是模塊化的設計;三是在高性能優化;四是工業級部署。
01 豐富的數據增強
PaddleSeg提供10餘種數據增強的策略,有效的訓練數據,大幅度提升模型的魯棒性,開發者可以根據實際的場景進行靈活組合,根據實際場景進行選用,讓整個分割模型應用泛化能力更強。
02 模塊化的設計
整個PaddleSeg開發套件都是模塊化設計的,無論是數據增強模塊裡面的多種增強算法,主幹網絡的多種Backbone模塊選擇,都可以讓開發者更好的根據實際業務場景需求使用。分割網絡包含了目前的4種主流網絡:醫療領域常見的U-Net,經典的DeepLabV3,面向實時場景的分割模型ICNet等。同時對於損失函數的模塊化設計,也可以更好的提升各個分類場景下的分割精度,例如小目標分割的效果。
03 高性能
PaddleSeg在性能優化方面開展了很多工作。包括訓練速度提升、GPU利用率提升以及顯存性能優化。同時支持較新的FP16混合精度的訓練。特別的,對於動態的Loss Scaling,在不損失精度的情況下,性能可以有30%的提升。PaddleSeg在英偉達特斯拉V100卡上,單卡訓練速度是對標產品的2.3倍,多卡上是對標產品的3.1倍。
04 工業級部署
根據產業的需求,PaddleSeg開發了高性能的C++預測庫。在多線程計算優化、算子硬體加速方面,而且依託於真實的項目實踐驗證做了大量優化工作,真正滿足工業級部署需求。
05 應用場景和案例介紹
5.1電池隔膜產品質檢任務
此任務的挑戰是,分割目標非常小、類別不均勻、預測性能要求高,不能拖慢流水線的速度。通過PaddleSeg實現方案最終IoU做到了0.82。預測速度在200×200的圖上小於2.5毫秒,保證生產效率不會受影響。
5.2工業精密零件質檢智能分揀
選用了ICNet,在800×800、1000×1000的大圖分割速度約25毫秒,誤收率小於0.1%,對比其他框架速度快20%左右。
5.3人像分割
PaddleSeg開放了人像分割的預訓練模型,mIoU可以做到0.93,適用於證件照片、人像特效、替換照片視頻背景等分割任務。
06 後續規劃
PaddleSeg後續開放方向:一是視頻級別分割,做到如人體特效、天空分割、實時的語義分割等;二是圖像分割解決方案。三是高性能的端側部署,與PaddleSlim打通,支持模型壓縮,並與Paddle Lite整合,讓開發者能夠更方便的部署到端上。