技術回顧 ▏深度學習在機器視覺中有哪些典型的應用?

2021-02-24 act視覺系統設計

深度學習是解決所有計算機視覺問題的最佳方案嗎?

首先,視覺世界是無限變化的,系統設計者有無數種方法使用視覺數據。其中有一些應用案例,如目標識別和定位,都可以通過深度學習技術得到很好的解決。因此,如果你的應用需要一種算法來識別家具,那麼你很幸運:你可以選擇一種深度神經網絡算法,並使用自己的數據集對其進行重新編譯。

 

訓練數據對有效的深度學習算法至關重要。訓練一個DNN 通常需要數千個帶標記的訓練圖像(即用所需輸出標 記的圖像),以及數千個帶標記的圖像來評估候選訓練算法。當然,這些數據的性質非常重要:訓練和驗證數據,必須能夠代表算法要處理的情況的多樣性。如果很難或者不可能獲得足夠多樣化的訓練數據,那麼最好還是使用傳統技術。當我們深入研究客戶的需求時,我們經常發現,最初看起來像單一視覺問題的任務,往往可以分解為幾個子任務。通常,在這些子任務中,自然有一些子任務是適合使用DNN 解 決的,而另一些子任務則不適合用 DNN 來解決。對於這些項目,結合DNN和傳統技術的解決方案,通常是更好的選擇,而不是試圖將整個問題都強制轉向DNN解決方案。

 

鑑於DNN 在研究和技術方面的巨大投資,很明顯,DNN 作為首選解決方案的適用範圍,將會繼續迅速擴大。然而,在可預見的未來,許多應用將通過傳統技術(包括其他形式的機器學習)或通過深度學習和傳統算法的組合,來獲得最好的解決方案。

接下來,我們就一起了解一下,深度學習在機器視覺中的典型應用。

1、圖像處理中的深度學習應用

與傳統圖像處理相比,深度學習應用需要在訓練方面投入較多時間,但是相較其帶來的可靠性和處理速度,這些投入是值得的。圖像採集卡和(嵌入式)視覺設備上所使用的 FPGA 技術,令神經網絡應用於工業級應用成為可能,這需要強大的實時處理能力、低延遲(實時在線檢測)、高數據吞吐量、高帶寬和低功耗低發熱(嵌入式視覺應用),以及高解析度。

 

在通常的圖像處理應用中,只需要對少數幾個特性進行分類,因此選擇小型或中型網絡通常就足以應對,AlexNet、SqueezeNet 或MobileNet都是這類網絡的典型代表。這幾種網絡類型在機器視覺領域,預測精度、網絡大小和計算速度以及帶寬這幾方面有著良好的平衡。這裡可以很明顯地看到,通過選擇合適的網絡,可以在犧牲小部分檢測精度的同時,獲得數據吞吐量方面的極大提高,同時也為優化資源和提高分類質量提供了可能性。

 

完美滿足工業生產的高速處理需求的解決方案:通常使用高性能圖像採集卡或者嵌入式視覺設備,例如使用大型 FPGA 和高解析度傳感器的智能相機。利用多種多樣的 FPGA 資源,可以處理更複雜的架構以及應用。有了更高的數據帶寬,能夠在FPGA 上對整幅圖像進行處理,或進行額外的圖像預處理以及後期處理,例如對 GigEVision 相機的最大數據輸出帶寬的深度學習運算也完全能夠滿足。

圖:FPGA 的性能大約是 GPU 性能的7.3倍。

2、利用深度學習推理檢測相機外殼上的缺陷

通常,使用傳統的機器視覺檢測方法來確定缺陷並不是一件容易的事,例如發現工業相機外殼上可能存在的缺陷。然而,深度學習技術卻為此類缺陷檢測應用提供了一種有效的方法。

 

為了測試這一點,FLIR Systems公司的工程師們使用頗具成效益的組件建立了一套演示裝置,用於測試該 系統的可行性和有效性。該演示包括檢查相機的外殼是否有劃痕、油漆是否均勻以及是否存在印刷缺陷。為了避免上述缺陷,工業相機製造商必須檢查相機外殼,以確保產品外觀完美。

 

為了測試如何應用深度學習技術來解決這個問題,FLIR 的工程師使用了一臺 160 萬像素的 Blackfly S USB3 工業相機以及一臺 AAEON Up Squared 單板計算機,單板機配備 Celeron 處理器和 4GB 內存,採用 Ubuntu 16.04 作業系統 ;此外還配備了Intel Movidius 的神經計算棒(NCS)(見圖 1)。據 Intel 報導,神經計算棒於 2017 年發布,是基於 USB 的「深 度學習推理工具和獨立的人工智慧加 速器,為廣泛的邊緣主機設備提供專用深度神經網絡處理功能」。

神經計算棒採用英特爾 Movidius Myriad 2 視覺處理單元(VPU)。這是一個片上系統(SoC),配備兩個傳統的32 位RISC 處理器內核和 12 個獨特的 SHAVE 矢量處理內核。這些矢量處理內核可用於加速深度神經網絡使用的高分支邏輯。流行的深度學習框架(包括 Caffe、TensorFlow、 Torch 和Theano)可用於為神經計算 棒構建和訓練神經網絡。

圖1:為了對系統進行測試,FLIR的工程師使用 了一臺工業相機、一個AAEON單板計算機和Intel Movidius的神經計算棒。

3、藉助深度學習實現光隔元件的外觀缺陷檢測

在晶片製造業中絕大部分生產線已實現自動化,但晶片中的光隔離元件因本身體積小、精密度高,對其外觀檢測一直是行業痛點,仍需大量人工檢測。針對上述問題,慧眼自動化開發了基於深度學習的光隔離元件外觀檢測解決方案。

 

慧眼科技開發的檢測系統,硬體部署上分為上料、檢測和下料三個工位(見下圖)。上料工位分為四個料倉,操作員用上遊設備取出裝載產品的載具,放入產品,每個載具可放入40顆產品。這個裝載數量可以減少操作員上料的次數。在上料工位,有一個視覺定位系統,用於檢測產品的尺寸,並獲取產品坐標位置並發送給機械手。

圖:慧眼科技的檢測設備結構示意圖。

該高精度檢測系統,能夠實現對微觀產品進行自動定位、吸取、上下料、外觀檢測,可以防止人工操作帶來的二次損傷。使用偏振相機取像,獲得四個角度的圖像,能夠檢測產品表面不同角度的劃痕情況,提高檢測覆蓋率。這也是針對晶片行業中表面鏡面產品的外觀檢測的創新應用。

 

在機器視覺應用中,外觀檢測一直是行業痛點。外觀缺陷中的劃痕、髒汙、形態不一、大小不同、深淺和各種姿態都不同,很難用傳統的視覺檢測算法穩定檢測。但是隨著深度學習技術的發展,採用深度學習模式的外觀檢測程式,成為了外觀檢測的新方法。在A公司的這個案例中,我們也遇到了傳統視覺算法難以解決的外觀檢測問題,我們的解決方案是採用 深度學習搭配傳統定位算法。

4、深度學習軟體實現強大的 PCB 檢測系統

自動光學檢測(AOI)是一種自動化的視覺檢測技術, 在印刷電路板(PCB)檢測中,其涉及掃描 PCB 的表面以獲取清晰圖像。AOI系統可以檢測多種類型的PCB缺陷,包括短路、銅過多或不足、開路、劃痕、毛刺、銅渣、組件缺失和變形等。

 

由於存在許多表面缺陷,因此與常規的電子元件檢測相比,PCB的檢測可能更加困難,並且還經常需要第二次手動篩選,以在PCB返回產品線之前區分真實缺陷和誤報的缺陷。

 

該AI缺陷檢查系統由中國臺灣碁仕科技股份有限公司(G4 Technology)設計,它利用機器視覺相機和深度學習軟體,來準確地對PCB 缺陷進行檢查、探測、標記和分類。與傳統的機器視覺技術相比,該系統可以分析復 雜的圖像,提高圖像分析能力和自動視覺檢測的準確性,並對缺陷進行自動分類。該視覺系統包括一臺Allied Vision公司的相機、一個富士膠片公司的高解析度鏡頭和 SUALAB公司的 SuaKIT 深度學習軟體。系統中的相機型號是Manta G-032C,其基於30萬像素的Sony ICX424 彩色CCD傳感器,像素尺寸為7.4µm,全解析度下的幀率可達80.7fps。

在深度學習軟體中,基於範例的算法使用可接受和不可接受產品的圖像進行訓練,這與基於規則的算法要求手動設置缺陷標準不同。SuaKIT 通過分析產品上的各種缺陷(分割),對圖像分類並按缺陷類型分類(分類),然後 按類別探測圖像中的每個目標對象(探測),來檢查缺陷區域。

 

為了實現缺陷檢測,SuaKIT的算法被訓練了大約 100張正常和有缺陷產品的圖像,能在大約15分鐘的時間內 建立神經網絡。此後,由於相機的高幀率,每秒可以在生 產線上收集和處理80張圖像,從而使該軟體能夠自動學習和分析缺陷標準,並區分正常產品和缺陷產品的圖像。在深度學習算法的初始階段,所需的圖像數據會隨圖 像的複雜性而變化。通常需要 50~100張圖像,才能使系統可以處理客戶特定的缺陷標準。在這種情況下,使用深度學習軟體能夠替代人工視覺檢查的需求,可以將人員轉移或部署到工廠的其他製造流程或任務中,從而提高整體生產率。

 

圖:Allied Vision公司的Manta相機和SUALAB公司的SuaKIT深度學習軟體相結合,用於檢查印刷電路板。

5、深度學習和高光譜成像相結合識別馬鈴薯病害

改進的卷積神經網絡使用高光譜線掃圖像,用於馬鈴薯病害的檢測。在深度學習中使用高光譜數據尚有諸多挑戰,包括數據的大小和特定波段的噪聲。

 

來自荷蘭瓦格寧根大學的一個研究小組,試圖利用深度學習技術和高光譜圖像數據來檢測植物疾病。圖1 顯示了NAK在荷蘭一個種植實驗場用無人機拍攝的圖像。在試驗過程中,涉及到正常的栽培實踐和不同的天氣條件,田間的所有作物都被一個有經驗的NAK檢查員目視監測了多次。

 

表1顯示了田間不同隴之間所種植的作物品種和染病情況。第1-3 隴包含感染細 菌性疾病的作物,而第 4-7 隴包含感染馬鈴薯Y 病毒的四種不同品種的作物。第1-3 隴的作物圖片(主要是細菌感染、一些自 然偶發的 Y 病毒感染和一些健康的作物)為訓練卷積神經網絡(CNN)提供了數據。第5隴作物(LadyClaire)100%為病株, 第4隴作物(Rosa Gold)95% 以上為病株。此外,第4隴中出現的馬鈴薯 X 病毒(PVX)症狀妨礙了作物專家的人工判斷,並且PVX 病毒的出現已被實驗室檢測(ELISA)證實。因此第4隴和第5隴作物被排除在高光譜分析之外。

表1:第1、2、3隴作物主要是細菌感染,也有一些自然偶發的Y病毒感染。這些作物以及前三隴的健康作物,被用來訓練卷積神經網絡(CNN)。

圖:無人機拍攝到的位於荷蘭託勒貝克附近的實驗場地的RGB圖像。1-3隴的長度為110m,4-7隴的長度為66m。

雖然CNN通常對整個圖像進行分類(標記每幅圖像)或提供 2D 分段(標記 每個像素),但該團隊的方法使用了「弱」1D 標記序列與一個改進 的完全卷積神經網絡(FCN)相結合的架構,以減少通常需要的大 量訓練數據。「弱」1D 標籤序列的優點是增加訓練 集中可用標籤的有效 數量,以降低過擬合 風險。該方法還大大降低了標記數據集的 負擔。研究人員不需要提供像素級的注釋,而是使用患病個體的 GNSS 位 置,在線的層面上生成地面實況——這是一個更為簡單的過程。

 

使用的網絡是帶有非標準解碼器的FCN。雖然FCN 的輸出通常是 2D分割,但是研究人員輸出了 1D 分割, 目的是為每行圖像分配一個標籤。由於訓練數據的不平衡(健康的案例比 患病的案例多得多),所以對數據進 行了重新抽樣,以突出患病的案例。由於深度學習需要大量的訓練數據,利用隨機鏡像、旋轉、圖像亮度隨機變化等數據增強技術,使現有數據得以豐富。

資料來源於VSDC雜誌

相關焦點

  • 在圖像處理中應用深度學習技術
    儘管圖像預處理、後期處理和信號處理仍採用現有方法進行,但在圖像分類應用中(缺陷、對象以及特徵分類),深度學習變得愈加重要。利用深度學習處理某些任務更簡單,效果更好,甚至某些任務只能用深度學習方法來解決。深度學習正在逐漸威脅傳統圖像處理方法的地位——特別是處理任務中包含有複雜變量時(如反射面、光照不佳的環境、光照變化或移動的對象)。
  • 工業檢測中的機器視覺應用情況
    中國機器視覺起步於80年代的技術引進,隨著98年半導體工廠的整線引進,也帶入機器視覺系統,06年以前國內機器視覺產品主要集中在外資製造企業,規模都較小,06年開始,工業機器視覺應用的客戶群開始擴大到印刷、食品等檢測領域,2011年市場開始高速增長,隨著人工成本的增加和製造業的升級需求,加上計算機視覺技術的快速發展,越來越多機器視覺方案滲透到各領域,到2016年我國機器視覺市場規模已達近
  • 【機器視覺】學習機器視覺需要哪些知識?
    要回答這個問題,我們可以分解一下機器視覺系統,來逐個分析。一套最簡單的機器視覺系統包括1.
  • 機器學習提升嵌入式視覺應用
    圖1:簡單的神經網絡在眾多機器學習應用中極為常用的神經網絡之一是「深度神經網路」(DNN)。這類神經網絡擁有多個隱藏層,能實現更複雜的機器學習任務。為了確定每一層使用的權重和偏差值,必須對神經網絡進行訓練。
  • 機器視覺檢測的分類和應用主要有哪些?
    我們大多數人都知道機器視覺檢測,它是目前應用在產品外觀缺陷檢測和質量檢測中的最為先進的檢測技術,隨著工業的不斷發展和科技的進步,機器視覺在智能製造和自動化領域中的作用越來越重要。機器視覺檢測技術的應用可以更大程度地把關,提高產品質量並降低生產成本,受到越來越多的企業青睞,應用範圍也在不斷擴大。那麼機器視覺檢測的分類和應用主要有哪些呢?下面瑞科智能為大家一一道來!一、機器視覺檢測的分類目前可從這三大類來分:安裝載體,功能作用和檢測技術。
  • 計算機視覺、機器視覺、圖像處理以及人工智慧技術
    而在這些應用場景中,視覺技術的地位可謂是非常重要。談到視覺技術,我們一般會想到攝像頭。然而,攝像頭只是視覺技術體系中的輸入端,採集圖像或視頻信息。而這些圖像或視頻信息需要利用專用的視覺技術處理之後,才能給用戶提供有用的信息。我們常聽說的視覺技術分為三類:計算機視覺、機器視覺、圖像處理。通過百度百科我們可以了解到,「計算機視覺是使用計算機及相關設備對生物視覺的一種模擬。
  • 圖像處理應用中深度學習的重要性分析
    工業應用中FPGA 上的神經元網絡(CNN) 深度學習應用憑藉其在識別應用中超高的預測準確率,在圖像處理領域獲得了極大關注,這勢必將提升現有圖像處理系統的性能並開創新的應用領域。儘管圖像預處理、後期處理和信號處理仍採用現有方法進行,但在圖像分類應用中(缺陷、對象以及特徵分類),深度學習變得愈加重要。 利用深度學習處理某些任務更簡單,效果更好,甚至某些任務只能用深度學習方法來解決。深度學習正在逐漸威脅傳統圖像處理方法的地位——特別是處理任務中包含有複雜變量時(如反射面、光照不佳的環境、光照變化或移動的對象)。
  • 深度學習—應用於機器視覺領域的卷積神經網絡(CNN)簡介
    深度學習通過模擬類似人腦的層次結構建立從低級信號到高層語義的映射,以實現數據的分級特徵表達,具有強大的視覺信息處理能力,因而, 在機器視覺領域,深度學習的代表--卷積神經網絡(Convolutional Neural Network, CNN)得以廣泛應用。
  • 科研進階 | 加州大學伯克利分校 | 人工智慧、計算機科學:數據科學與AI深度學習:應用計算機視覺(2021.4.24開課)
    千禧年後,大數據的蓬勃發展和算力的指數級增長賦予了深度學習新的生機。深度學習如破竹之勢將機器輔助功能變為可能,讓人工智慧在各個應用領域實現落地。其中,人工智慧一個重要的研究方面就是計算機視覺。「計算機視覺是一門研究如何使機器『看』的科學,更進一步的說,就是指用攝影機和計算機代替人眼對目標進行識別、跟蹤和測量,其本質是模擬人類的感知與觀察的一個過程。」
  • 【推薦】基於MATLAB編程、機器學習、深度學習在圖像處理中的實踐技術應用
    尤其是在計算機視覺和圖像處理領域,各種顛覆性的成果應運而生。因此,為了幫助廣大科研人員更加系統地學習圖像處理、機器學習和深度學習的基礎理論知識及對應的代碼實現方法,Ai尚研修特舉辦「MATLAB圖像處理與機器學習技術應用培訓班」 培訓班,旨在幫助學員掌握圖像處理的基礎知識,以及經典機器學習算法和最新的深度神經網絡、遷移學習、對抗生成網絡等算法的基本原理及其MATLAB編程實現方法。
  • 一文全覽深度學習在計算機視覺領域的應用
    已經是很熱的深度學習,大家都看到不少精彩的故事,我就不一一重複。簡單的回顧的話,2006年Geoffrey Hinton的論文點燃了「這把火」,現在已經有不少人開始潑「冷水」了,主要是AI泡沫太大,而且深度學習不是包治百病的藥方。計算機視覺不是深度學習最早看到突破的領域,真正讓大家大吃一驚的顛覆傳統方法的應用領域是語音識別,做出來的公司是微軟,而不是當時如日中天的谷歌。
  • 基於深度學習的商品檢索技術在服裝搭配中的應用
    本文對這些方法進行了總結,然後概括地提出了商品特徵學習框架以及垂類數據挖掘方式,最後介紹了商品檢索技術在服裝搭配中的應用。前言幾年前,當人們還在感嘆於網頁購物的快速便捷時,各大電商巨頭就「悄悄地」將它們的購物應用推廣到了用戶的手機裡。
  • 2D相機與3D相機的機器視覺
    機器視覺與計算機視覺並沒有一個明顯的定義去劃分。但在實際應用中,應用於工業檢測的時候更多地被稱為機器視覺而非計算機視覺。這時候,機器視覺更多地偏向或者專指以圖像傳感器為採集軟體,輔助以光源,PLC甚至機器人等外部設備,以實現特定的檢測或定位等特定目的。如果你從事的是機器視覺行業則避免不了PCL,機器人,編碼器,光柵尺,光源,鏡頭等這些圖像之外的硬體設備打交道。
  • 深度學習中的圖像分割:方法和應用
    基於人工智慧和深度學習方法的現代計算機視覺技術在過去10年裡取得了顯著進展。如今,它被用於圖像分類、人臉識別、圖像中物體的識別、視頻分析和分類以及機器人和自動駕駛車輛的圖像處理等應用上。許多計算機視覺任務需要對圖像進行智能分割,以理解圖像中的內容,並使每個部分的分析更加容易。
  • 《機器學習-原理、算法與應用》出版了
    SIGAI微信公眾號自去年4月份發布第一篇文章「機器學習-波瀾壯闊40年」起,到今天為止,已經累計發布文章164篇,在各個平臺的閱讀次數超過超過300萬次,深受人工智慧學習者和從業者的喜愛,其中不乏大量的精品文章。此公眾號創立之初的目的是為了幫助大家學習和掌握人工智慧技術,用於學術研究和產品研發,傳播人工智慧技術。
  • 【全面】人工智慧技術棧與學習路線:機器學習 深度學習 視覺 NLP 推薦系統
    這一節很重要,我詳細給大家說說要學哪些算法:強調一下,以下算法建議必會,就算自己沒有用於項目中,也建議跑一炮算法和簡單應用。的SVM實現車牌檢測與識別(二)4:基於深度學習與計算機視覺5:影像分類,目標檢測,語義分割,實例分割等6:基於深度學習與計算機視覺的項目由淺入深:視覺識別入門之人臉識別——基於FACENET的高精度人臉識別視覺識別入門之識別 ——口罩識別【項目實戰】基於PeLee的多目標實時檢測基於深度學習的醫學圖像分割
  • 一文探討可解釋深度學習技術在醫療圖像診斷中的應用
    原創 Synced 機器之心機器之心分析師網絡作者:仵冀穎編輯:Joni本文依託於綜述性文章,首先回顧了可解釋性方法的主要分類以及可解釋深度學習在醫療圖像診斷領域中應用的主要方法。
  • 光偏振技術再次迎來進步,光偏振在機器視覺中的應用來得
    偏振光技術是成像數十年來用於圖像增強的一種濾波技術,它也被廣泛用於商業攝影和機器視覺圖像採集中。自2018年以來,隨著偏振光相機和成像組件發布,機器視覺中偏振光的新應用和用途不斷湧現。要了解偏振光應用,需要了解最新的偏振相機和傳感器,並需要了解使用偏振技術的優勢和局限性。
  • 從AlexNet到BERT:深度學習中那些最重要的idea回顧
    作者會在這裡回顧深度學習領域經歷時間考驗被廣泛應用的一些想法,當然不能全面覆蓋。即使這樣,下面介紹到的深度學習技術,也已經涵蓋了理解現代深度學習研究所需的基本知識。如果你是該領域的萌新,那麼很好,這會是你一個非常好的起點。深度學習是個瞬息萬變的領域,海量的研究論文和想法可能會令人感覺有點跟不上。
  • 物聯網系列之機器視覺
    圖1 | 機器視覺和分類視覺的比較資料來源:華泰證券研究所機器視覺產業鏈的上遊包括光源、鏡頭、視覺傳感器、圖像處理軟體等軟硬體供應商。中遊環節主要是系統集成商,基於對垂直行業的深度理解將上述軟硬體和其他配套設施進行集成,形成一套切實有用的解決方案或整機設備。