機器視覺和智能圖像處理技術之間的關係

2020-12-06 電子發燒友

機器視覺和智能圖像處理技術之間的關係

工程師曾玲 發表於 2018-06-13 15:16:00

機器視覺(Machine Vision)是人工智慧領域中發展迅速的一個重要分支,目前正處於不斷突破、走向成熟的階段。一般認為機器視覺「是通過光學裝置和非接觸傳感器自動地接受和處理一個真實場景的圖像,通過分析圖像獲得所需信息或用於控制機器運動的裝置」,可以看出智能圖像處理技術在機器視覺中佔有舉足輕重的位置。

智能圖像處理是指一類基於計算機的自適應於各種應用場合的圖像處理和分析技術,本身是一個獨立的理論和技術領域,但同時又是機器視覺中的一項十分重要的技術支撐。人工智慧、機器視覺和智能圖像處理技術之間的關係如圖1所示。

圖1智能圖像處理的支撐作用

具有智能圖像處理功能的機器視覺,相當於人們在賦予機器智能的同時為機器按上了眼睛,使機器能夠「看得見」、「看得準」,可替代甚至勝過人眼做測量和判斷,使得機器視覺系統可以實現高解析度和高速度的控制。而且,機器視覺系統與被檢測對象無接觸,安全可靠。

1、機器視覺技術

機器視覺的起源可追溯到20世紀60年代美國學者L.R.羅伯茲對多面體積木世界的圖像處理研究,70年代麻省理工學院(MIT)人工智慧實驗室「機器視覺」課程的開設。到80年代,全球性機器視覺研究熱潮開始興起,出現了一些基於機器視覺的應用系統。90年代以後,隨著計算機和半導體技術的飛速發展,機器視覺的理論和應用得到進一步發展。

進入21世紀後,機器視覺技術的發展速度更快,已經大規模地應用於多個領域,如智能製造、智能交通、醫療衛生、安防監控等領域。目前,隨著人工智慧浪潮的興起,機器視覺技術正處於不斷突破、走向成熟的新階段。

在中國,機器視覺的研究和應用開始於20世紀90年代。從跟蹤國外品牌產品起步,經過二十多年的努力,國內的機器視覺從無到有,從弱到強,不僅理論研究進展迅速,而且已經出現一些頗具競爭力的公司和產品。估計隨著國內對機器視覺研究、開發和推廣的不斷深入,趕上和超越世界水平已不是遙不可及的事情了。

常見機器視覺系統主要可分為兩類,一類是基於計算機的,如工控機或PC,另一類是更加緊湊的嵌入式設備。典型的基於工控機的機器視覺系統主要包括:光學系統,攝像機和工控機(包含圖像採集、圖像處理和分析、控制/通信)等單元,如圖2所示。機器視覺系統對核心的圖像處理要求算法準確、快捷和穩定,同時還要求系統的實現成本低,升級換代方便。

圖2 機器視覺系統示例

2、智能圖像處理技術

機器視覺的圖像處理系統對現場的數字圖像信號按照具體的應用要求進行運算和分析,根據獲得的處理結果來控制現場設備的動作,其常見功能如下:

(1)圖像採集

圖像採集就是從工作現場獲取場景圖像的過程,是機器視覺的第一步,採集工具大多為CCD或CMOS照相機或攝像機。照相機採集的是單幅的圖像,攝像機可以採集連續的現場圖像。就一幅圖像而言,它實際上是三維場景在二維圖像平面上的投影,圖像中某一點的彩色(亮度和色度)是場景中對應點彩色的反映。這就是我們可以用採集圖像來替代真實場景的根本依據所在。

如果相機是模擬信號輸出,需要將模擬圖像信號數位化後送給計算機(包括嵌入式系統)處理。現在大部分相機都可直接輸出數字圖像信號,可以免除模數轉換這一步驟。不僅如此,現在相機的數字輸出接口也是標準化的,如USB、VGA、1394、HDMI、WiFi、Blue Tooth接口等,可以直接送入計算機進行處理,以免除在圖像輸出和計算機之間加接一塊圖像採集卡的麻煩。後續的圖像處理工作往往是由計算機或嵌入式系統以軟體的方式進行。

(2)圖像預處理

對於採集到的數位化的現場圖像,由於受到設備和環境因素的影響,往往會受到不同程度的幹擾,如噪聲、幾何形變、彩色失調等,都會妨礙接下來的處理環節。為此,必須對採集圖像進行預處理。常見的預處理包括噪聲消除、幾何校正、直方圖均衡等處理。

通常使用時域或頻域濾波的方法來去除圖像中的噪聲;採用幾何變換的辦法來校正圖像的幾何失真;採用直方圖均衡、同態濾波等方法來減輕圖像的彩色偏離。總之,通過這一系列的圖像預處理技術,對採集圖像進行「加工」,為體機器視覺應用提供「更好」、「更有用」的圖像。

(3)圖像分割

圖像分割就是按照應用要求,把圖像分成各具特徵的區域,從中提取出感興趣目標。在圖像中常見的特徵有灰度、彩色、紋理、邊緣、角點等。例如,對汽車裝配流水線圖像進行分割,分成背景區域和工件區域,提供給後續處理單元對工件安裝部分的處理。

圖像分割多年來一直是圖像處理中的難題,至今已有種類繁多的分割算法,但是效果往往並不理想。近來,人們利用基於神經網絡的深度學習方法進行圖像分割,其性能勝過傳統算法。

(4)目標識別和分類

在製造或安防等行業,機器視覺都離不開對輸入圖像的目標進行識別和分類處理,以便在此基礎上完成後續的判斷和操作。識別和分類技術有很多相同的地方,常常在目標識別完成後,目標的類別也就明確了。近來的圖像識別技術正在跨越傳統方法,形成以神經網絡為主流的智能化圖像識別方法,如卷積神經網絡(CNN)、回歸神經網絡(RNN)等一類性能優越的方法。

(5)目標定位和測量

在智能製造中,最常見的工作就是對目標工件進行安裝,但是在安裝前往往需要先對目標進行定位,安裝後還需對目標進行測量。安裝和測量都需要保持較高的精度和速度,如毫米級精度(甚至更小),毫秒級速度。這種高精度、高速度的定位和測量,倚靠通常的機械或人工的方法是難以辦到的。在機器視覺中,採用圖像處理的辦法,對安裝現場圖像進行處理,按照目標和圖像之間的複雜映射關係進行處理,從而快速精準地完成定位和測量任務。

(6)目標檢測和跟蹤

圖像處理中的運動目標檢測和跟蹤,就是實時檢測攝像機捕獲的場景圖像中是否有運動目標,並預測它下一步的運動方向和趨勢,即跟蹤。並及時將這些運動數據提交給後續的分析和控制處理,形成相應的控制動作。圖像採集一般使用單個攝像機,如果需要也可以使用兩個攝像機,模仿人的雙目視覺而獲得場景的立體信息,這樣更加有利於目標檢測和跟蹤處理。

3、機器視覺的應用

如圖3所示,機器視覺應用廣泛,如安防、製造、教育、出版、醫療、交通、軍事領域等。在這些機器數額的應用中,智能圖像處理都是不可或缺的,這裡僅簡要介紹其中幾個方面的應用。

圖3 常見機器視覺應用場合

(1)智能製造

為了實現中國智能製造2025這一宏偉目標,離不開機器視覺。例如,在智能圖像處理一直處於領先地位的廣東迅通科技股份有限公司(以下簡稱「迅通科技」)針對這一需求開發出了機器視覺分析儀平臺,見圖4。其中,迅通科技為某知名汽車廠商裝配流水線開發的車門限位器自動定位、檢測和識別的系統,見圖5。該系統通過智能圖像識別方式,自動檢測型號是否正確,定位是否準確,完全代替了人工操作,檢測準確率達到100%。此前,每個工位需要4個工人用眼睛來檢查、定位16種型號限位器,員工不僅很容易疲勞,還時常出現差錯。

圖4 迅通機器視覺分析儀平臺

圖5 工件識別/定位檢測系統(現場)

(2)教育考試

考試試卷時常發現因排版或印刷錯誤影響學生考試,利用智能圖像處理技術,機器自動對印刷後的試卷和原版試卷進行比對,發現不一致之處,會自動提示並報警,完全替代之前只能通過人工對試卷進行校驗。

(3)出版印刷

和教育考試類似,專業出版印刷廠由於印刷的圖書、報紙雜誌,以及承接來自企業產品包裝和宣傳資料的種類多,數量大,排版和印刷中經常出錯。為此,需安排不少專業人員進行校對,耗費大量的資金和時間。通過利用智能圖像處理技術進行自動校對,既提高了校對準確度,又縮短了校對時間,降低了印刷成本,縮短了出版物的交付周期。

(4)安防監控

這是當前備受機器視覺關注的一個領域。機器視覺打破了傳統視頻監控系統的限制,增加了系統的智能,使得智能視頻分析得以逐步實現。以公共場所的視頻監控為例,通過運用機器視覺技術,可以實現對可疑人物的自動檢測、人臉識別、實時跟蹤,必要時還可以實現多攝像機接連跟蹤,同時發出告警,存儲現場信息。

(5)智能交通

機器視覺在交通領域有著廣泛的應用。例如,在高速公路上及卡口處,對來往車輛進行車型、牌照等識別,甚至對行駛車輛的違規行為進行識別。在汽車上對駕駛員面部圖像進行分析,判斷駕駛員是否處於疲勞駕駛狀態。再如,無人駕駛汽車藉助於機器視覺技術,使用攝像頭、雷射/毫米波/超聲波雷達、GPS等感知道路環境信息,自動規劃和控制車輛的安全行駛。

有數據顯示,2016年全球機器視覺系統的市場規模約46億美元, 2017年約50億美元,預計2018年達到55億美元,年增長率為10%左右。中國機器視覺市場的增長是從2010年開始的,2017年市場規模約68億元,預計到2020年或達780億元,市場增長率將超過100%。

4、技術瓶頸及今後的發展

在機器視覺的智能圖像處理技術的發展中,還存在不少技術瓶頸,如:

(1)穩定性:某種處理方法往往在研究和開發中表現良好,但在複雜多變的應用環境中,卻不時地出現問題。例如人臉識別系統,在目標配合時識別率可高達95%以上,但在實際監控環境下,識別率就會大大下降。

(2)實時性:如果圖像的採集速度、處理速度較慢,再加上新近引入的深度學習類算法,加大了系統實時處理的難度,跟不上機器運行和控制的節奏。

(3)準確性:機器視覺系統要求圖像識別和測量的準確性接近100%,任何微小的誤差都有可能帶來不可預測的後果。例如目標定位的誤差會使裝配出來的設備不符合要求。

(4)系統能力:目前的嵌入式圖像處理系統,存在晶片的計算能力不足,存儲空間有限等問題,常常不能滿足運算量較大的圖像處理運算,如神經網絡的迭代運算,大規模矩陣運算等。

今後機器視覺中智能圖像處理的發展主要體現在以下幾個方面:

(1)算法:傳統算法繼續不斷有所突破,新一波人工智慧浪潮帶來不少新的性能優良的圖像處理算法,如深度學習(DL),卷積神經網絡(CNN),生成對抗網絡(GAN),等等。

(2)實時性:出現更多結構新穎、資源充足、運算快速的硬體平臺支撐,例如基於多CPU、多GPU的並行處理結構的計算機,海量存儲單元等。

(3)嵌入式:新的高速的信號處理器陣列,超大規模FPGA晶片。

(4)融合處理:從單圖像傳感器發展到多傳感器(多視點)的融合處理,可更加充分地獲取現場信息。還可融合多類傳感器,如圖像傳感器、聲音傳感器、溫度傳感器等共同完對現場目標定位、識別和測量。

總之,無論是「中國製造2025」還是「工業4.0」都離不開人工智慧,離不開計算機視覺,而智能圖像處理是機器視覺的核心技術,隨著圖像處理水平的不斷提高,一定會有力地推動機器視覺的迅速發展。

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 智能圖像處理 讓機器視覺及其應用更智能高效
    一般認為機器視覺「是通過光學裝置和非接觸傳感器自動地接受和處理一個真實場景的圖像,通過分析圖像獲得所需信息或用於控制機器運動的裝置」,可以看出智能圖像處理技術在機器視覺中佔有舉足輕重的位置。本文引用地址:http://www.eepw.com.cn/article/201806/381668.htm  智能圖像處理是指一類基於計算機的自適應於各種應用場合的圖像處理和分析技術,本身是一個獨立的理論和技術領域,但同時又是機器視覺中的一項十分重要的技術支撐。
  • 計算機視覺和圖像處理之間有什麼區別?
    整個過程是一個非常複雜的現象,並且使機器在人類層面上解釋這一點一直是一個挑戰。現代機器視覺系統背後的的核心動機在於模擬人類視覺,用於識別圖案,面部以及將將2D圖像轉化為3D模型等。在概念層面,圖像處理和計算機視覺之間存在很多重疊,並且經常被誤解的術語可以互換使用。
  • 基於機器視覺的汽車智能駕駛系統
    2.2 機器視覺技術在智能駕駛中應用  在智能駕駛中應用機器視覺技術,機器視覺技術必須具備實時性、魯棒性、實用性這三個特點。與其它傳感器相比,機器視覺具有檢測信息量豐富、無接觸測量和能實現道路環境三維建模等優點,但數據處理量極大,存在系統實時性和穩定性問題,要靠開發高性能的計算機硬體,研究新算法來解決。隨著計算機技術和圖像處理技術的飛速發展,三維重建道路環境為車輛高速智能駕駛提供強大的信息,在不遠的將來具有現實可行性。
  • CMOS圖像傳感器推動機器視覺技術系統軟體的發展
    答案是要有機器視覺技術的技術支持。根據機器視覺技術的技術性,無人機不僅可以識別障礙物,還可以知道自身與障礙物的距離,從而準確避開障礙物,避開障礙物。機器視覺技術的定義源於智慧機器人行業,美國機器人行業協會將其定義為:「根據光電設備和非接觸式傳感器,自動接收並求解真實物體的圖像,從而獲得 所需的信息內容或用於控制智慧機器人健身運動的設備。」
  • 深度學習技術和卷積神經網絡(CNN)讓機器視覺識別更智能
    隨著人工智慧技術的進步,深度學習技術(DL)和卷積神經網絡技術(CNN)領域的人工智慧(AI)被引入到機器視覺圖像處理系統的應用中來,從而幫助機器學習和機器檢測缺陷更加高效,使機器視覺識別的過程更加精確。也讓使用這些技術的企業可以從智能化中獲得更高的生產經營效益。
  • Xilinx與Silicon開啟硬體圖像處理機器視覺應用大門
    All Programmable技術和器件的全球領先企業賽靈思公司Xilinx,Inc.日前宣布,在與2014慕尼黑電子展同期舉行中國(上海)國際機器視覺展,將聯手德國Silicon
  • 圖像處理技術是什麼_圖像處理技術現狀和發展前景
    圖像是指物體的描述信息,數字圖像是一個物體的數字表示,圖像處理則是對圖像信息進行加工以滿足人的視覺心理和應用需求的行為。數字圖像處理是指利用計算機或其他數字設備對圖像信息進行各種加工和處理, 它是一門新興的應用學科,其發展速度異常迅速,應用領域極為廣泛。
  • 機器視覺系統設計的關鍵技術
    機器視覺系統是綜合現代計算機、光學、電子技術的高科技系統。機器視覺技術通過計算機對系統攝取的圖像進行處理,分析其中的信息,並做出相應的判斷,進而發出對設備的控制指令。機器視覺系統的具體應用需求千差萬別,視覺系統本身也可能有多種不同的形式,但都包括以下過程: 圖像採集 利用光源照射被觀察的物體或環境,通過光學成像系統採集圖像,通過相機和圖像採集卡將光學圖像轉換為數字圖像,這是機器視覺系統的前端和信息來源。 圖像處理和分析 計算機通過圖像處理軟體對圖像進行處理,分析獲取其中的有用信息。
  • 機器視覺人臉識別技術在智能商業中的應用
    人工智慧領域主要分布在機器學習(通用)、機器學習(應用)、計算機視覺(通用)、智慧機器人、虛擬個人助理、自然語言處理(語音識別)、自然語言處理(通用)、實時語音翻譯、情境感知計算、手勢控制、推薦引擎及協同過濾、視頻內容自動識別等。
  • 機器視覺的定義!機器視覺的優勢究竟有哪些?
    發表於 2019-05-08 13:43:50 隨著工業4.0時代的到來,機器視覺在智能製造業領域的作用越來越重要,機器視覺技術是如何工作的、它為什麼是實現流程自動化和質量改進的正確選擇等。
  • 預告| CSIG圖像圖形學科前沿講習班:智能駕駛與機器視覺
    安全、有序的智能駕駛,需要高效、深度集成的人工智慧與機器人技術來保障。中國圖象圖形學學會將圍繞「智能駕駛與機器視覺」這一主題,於2017年7月15日-17日在清華大學舉辦第二期「CSIG圖像圖形學科前沿講習班」(Advanced Lectures on Image and Graphics,簡稱IGAL)。
  • 計算機視覺(圖像)技術:視覺圖像搜索綜述
    比如從簡單的以圖搜圖、車牌識別,到人臉識別、植物或寵物的識別,人體或車輛的跟蹤,無人機、無人汽車的自動駕駛,智慧機器人等領域,都離不開計算機視覺搜索技術,這也是此次谷歌開源基於 TensorFlow 的物體檢測代碼的意義所在。
  • 計算機視覺 vs 機器視覺
    計算機視覺和機器視覺通常被認為是同一個行業,其實它們是重疊技術的不同術語。計算機視覺廣義上是指圖像分析的捕獲和自動化,並著重於在廣泛的理論和實際應用中的圖像分析功能。傳統上,機器視覺是借鑑參考了計算機視覺技術,在某些工業或實際應用中根據視覺系統完成圖像分析的某些功能或結果。視覺系統使用軟體來識別預編程的功能,該系統可根據發現結果觸發各種設定的「動作」。例如,在食品和飲料行業的裝瓶廠中,視覺系統可用於識別多個物體。它可以驗證空瓶本身沒有損壞和異物。
  • 科普:機器視覺技術原理解析及應用領域
    機器視覺系統是指通過機器視覺產品(即圖像攝取裝置,分 CMOS 和CCD兩種)將被攝取目標轉換成圖像信號,傳送給專用的圖像處理系統,根據像素分布和亮度、顏色等信息,轉變成數位化信號;圖像系統對這些信號進行各種運算來抽取目標的特徵,進而根據判別的結果來控制現場的設備動作。
  • 工業機器人對機器視覺技術的依賴有多大
    很多時候,我們將需要機器人能夠具備識別、分析、處理等更高級的功能,也就是說需要為工業機器安裝一雙「火眼金睛」來替代人眼做測量和判斷,機器視覺相當於為工業機器人裝上了「眼睛」,讓他們能夠清晰地不知疲倦的看到物體,發揮人眼檢查檢測的功能,這在高度自動化的大規模生產中非常重要。
  • 圖像識別與人工智慧圖像識別和機器視覺有什麼區別
    人工智慧領域發展到現在,ai與人工智慧、圖像識別領域、計算機視覺領域等近年來越來越多的整合和融合。首先,人工智慧在生活工作中將普遍應用;其次,人工智慧在不同的工作場景都有其應用,從金融到醫療,從服務到工廠,應用無處不在;最後,人工智慧正在與自動駕駛技術等聯繫在一起。
  • 機器視覺系統包含哪些組成部分
    一個典型的機器視覺系統涉及多個領域的技術交叉與融合,包括光源照明技術、光學成像技術、傳感器技術、數字圖像處理技術、模擬與數字視頻技術、機械工程技術、控制技術、計算機軟硬體技術、人機接口技術等。基於PC的機器視覺系統是傳統的結構類型,硬體包括CCD相機、視覺採集卡和PC等。嵌入式機器視覺系統將所需要的大部分硬體如CCD、內存、處理器以及通信接口等壓縮在一個「黑箱」式的模塊裡,又稱之為智能相機,其優點是結構緊湊、性價比高、使用方便、對環境的適應性強,是機器視覺系統的發展趨勢。
  • 讓機器理解三維世界,「商湯科技」暢想人工智慧3D視覺技術的未來
    賦予機器感知三維世界的「眼睛」人類擁有與生俱來的3D環境感知和理解能力,這是因為我們用兩隻眼睛來捕捉圖像,通過大腦處理形成立體視覺,從而辨認物體的形狀方位、他人的動作,輕鬆自然地跟這個三維世界交互。能否讓機器也能感知三維世界呢?或許很多人會想到給機器添加一顆攝像頭。
  • 常見的機器視覺軟體哪個比較好
    機器視覺產業鏈可以分為底層開發商(核心零部件和軟體提供商)、集成和軟體服務商(二次開發),核心零部件及軟體又可以再細分為光源、鏡頭、工業相機、圖像採集卡、圖像處理軟體等。在目前的整個機器視覺系統成本構成中,零部件及軟體開發佔據了80%的比例,是產業鏈中絕對的核心環節和價值獲取者。
  • 計算機視覺領域的人工智慧——記人工智慧技術應用專家陳秀新
    人工智慧是研究、開發用於模擬、延伸和擴展人智能的理論、方法、技術及應用系統的一門新的技術科學,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等,它由不同的領域組成,如機器學習,計算機視覺等等。其中,計算機視覺是使用計算機及相關設備對生物視覺的一種模擬。