點擊上方「小白學視覺」,選擇加"星標"或「置頂」
重磅乾貨,第一時間送達
論文是學術研究的精華和未來發展的明燈。小白決心每天為大家帶來經典或者最新論文的解讀和分享,旨在幫助各位讀者快速了解論文內容。個人能力有限,理解難免出現偏差,建議對文章內容感興趣的讀者,一定要下載原文,了解具體內容。
鋼表面缺陷的目視檢測是鋼板製造過程中必不可少的環節。近年來研究了幾種基於機器學習的自動視覺檢測(AVI)方法。然而,由於訓練時間和AVI方法的不準確性,大多數鋼鐵製造行業仍然使用人工目視檢查。自動鋼缺陷檢測方法在成本更低和更快的質量控制和反饋方面是有用的。但是,為分割和分類準備帶注釋的訓練數據可能是一個昂貴的過程。在這項工作中,我們建議使用基於遷移學習的U-Net (tu - net)框架來檢測鋼表面缺陷。我們以U-Net架構為基礎,探討了兩種編碼器:ResNet和DenseNet。我們使用隨機初始化和使用ImageNet數據集訓練的預訓練網絡的性能進行了比較。實驗使用Severstal數據進行。結果表明,遷移學習的缺陷分類性能比隨機初始化的缺陷分類性能好5%(絕對)。我們發現遷移學習在缺陷分割中的表現比隨機初始化好26%(相對)。遷移學習的增益隨著訓練數據的減少而增加,且遷移學習的收斂速度優於隨機初始化。
在本研究中,我們系統地研究了遷移學習在鋼材缺陷分類與定位(SDCL)中的有效性。遷移學習或領域適應的目的是重用在一個領域學習到的特徵,以提高在另一個領域的學習。在帶注釋的數據有限的情況下,這是一種流行的方法。遷移學習在各種任務中都有很好的應用,如對象檢測、語義分割等。已經表明,從一個任意領域到另一個領域的遷移學習可能是沒有用的。當兩個領域相似時,遷移學習最有效。因此,研究遷移學習在SDCL案例中的有效性就顯得尤為重要。我們考慮了一個用於鋼缺陷分割的u網基線架構。U-Net已經展示了在各種圖像分割任務的藝術表現狀態。它使用了帶有跳過連接的編碼器-解碼器架構。編碼器學習不同尺度的圖像特徵,解碼器使用這些特徵預測分割掩碼。
在這項工作中,我們探索了兩種預先訓練的編碼器網絡ResNet和DenseNet網絡。這兩種網絡在不同的計算機視覺任務中都表現得很好。網絡是在ImageNet數據集上預先訓練的。我們使用一個線性分類器使用瓶頸表示的U-Net分類缺陷。我們使用Severstal數據集對網絡的編碼器和解碼器進行微調。在Severstal數據上的實驗表明,與隨機初始化相比,預先訓練網絡的分割和分類性能都更好。研究發現,如果使用50%的數據進行訓練,使用預訓練網絡的性能提高甚至更高。我們還證明了遷移學習的收斂速度比隨機初始化快。
提出的用於節點鋼缺陷分類和分割的結構遷移學習方法。藍色的線表示跳躍連接,橙色虛線表示初始化。
編碼器層的結構為Resnet(左)和Densenet(右)。輸入的連接由(c)表示,+表示添加操作。BN+ReLU+Conv2D表示批處理歸一化、ReLU激活和核尺寸為3x3的卷積。
圖分割掩模預測。(a行)輸入圖像(b行)ground truth masks (c行)ResNet(Random)預測的掩碼(d行)ResNet(ImageNet)預測的掩碼。預測的相應骰子顯示在圖像的標題中。
在本研究中,我們建議使用遷移學習框架來進行鋼材缺陷的分類和分割。我們使用U-Net架構作為基礎架構,並探討兩種編碼器:ResNet和Dense Net。我們比較了使用隨機初始化的網絡和使用ImageNet數據集訓練的預訓練網絡的性能。我們發現,遷移學習的性能在缺陷分割和分類方面都優於ImageNet。我們還發現,隨著培訓數據的減少,績效差距增加。我們還發現,遷移學習的收斂速度比隨機初始化的收斂速度要快。我們發現,在罕見缺陷類型和複雜形狀缺陷中,遷移學習性能較差。作為未來工作的一部分,我們將致力於遷移學習,使用合成數據處理更複雜的形狀,以及使用生成模型進行罕見的缺陷類型泛化。我們希望探索半監督/弱監督學習方法來減少標註訓練數據的需求。
論文連結:https://arxiv.org/pdf/2101.06915.pdf
每日堅持論文分享不易,如果喜歡我們的內容,希望可以推薦或者轉發給周圍的同學。
- END -
下載1:OpenCV-Contrib擴展模塊中文版教程在「小白學視覺」公眾號後臺回覆:擴展模塊中文教程,即可下載全網第一份OpenCV擴展模塊教程中文版,涵蓋擴展模塊安裝、SFM算法、立體視覺、目標跟蹤、生物視覺、超解析度處理等二十多章內容。在「小白學視覺」公眾號後臺回覆:Python視覺實戰項目31講,即可下載包括圖像分割、口罩檢測、車道線檢測、車輛計數、添加眼線、車牌識別、字符識別、情緒檢測、文本內容提取、面部識別等31個視覺實戰項目,助力快速學校計算機視覺。在「小白學視覺」公眾號後臺回覆:OpenCV實戰項目20講,即可下載含有20個基於OpenCV實現20個實戰項目,實現OpenCV學習進階。在「小白學視覺」公眾號後臺回覆:leetcode,即可下載。每題都 runtime beats 100% 的開源好書,你值得擁有!交流群
歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動駕駛、計算攝影、檢測、分割、識別、醫學影像、GAN、算法競賽等微信群(以後會逐漸細分),請掃描下面微信號加群,備註:」暱稱+學校/公司+研究方向「,例如:」張三 + 上海交大 + 視覺SLAM「。請按照格式備註,否則不予通過。添加成功後會根據研究方向邀請進入相關微信群。請勿在群內發送廣告,否則會請出群,謝謝理解~