淺談計算機視覺中的圖像標註

2020-12-20 程式設計師世界

什麼是計算機視覺?

計算機視覺被認為是機器學習和人工智慧發展的重要領域之一。簡而言之,計算機視覺是人工智慧研究領域,致力於賦予計算機看世界和視覺解釋世界的能力。

更進一步的說,計算機視覺是一門研究如何使機器「看」的科學,就是是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。

計算機視覺的應用非常廣泛,從自動駕駛汽車和無人機到醫療診斷技術和面部識別軟體,計算機視覺的應用是巨大的和革命性的。

圖像標註

圖像標註是計算機視覺的一個子集,是計算機視覺的重要任務之一。圖像標註就是將標籤附加到圖像上的過程。這可以是整個圖像的一個標籤,也可以是圖像中每一組像素的多個標籤。這些標籤是由人工智慧工程師預先確定的,並被選中為計算機視覺模型提供圖像中所顯示的信息。

一個簡單的例子就是為人類標註者提供動物的圖像,並讓他們用正確的動物名稱為每個圖像進行標記。當然,標記的方法依賴於項目所使用的圖像標註類型。這些帶標籤的圖像有時被稱為真實數據,然後將被輸入計算機視覺算法。通過訓練,最後該模型將能夠從未注釋的圖像中區分不同種類的動物。雖然上面的例子非常簡單,但進一步深入到計算機視覺更複雜的領域(如自動駕駛汽車),則就會需要更複雜的圖像標註。

由於計算機視覺研究的是模仿或超越人類視覺能力的機器開發,訓練這樣的模型需要大量的帶標註的圖像。

你用來訓練、驗證和測試你的計算機視覺算法的圖像將對你的人工智慧項目的成功產生重大影響。數據集中的每張圖像都必須經過深思熟慮和準確的標記,以訓練人工智慧系統像人類一樣識別物體。圖像標註的質量越高,機器學習模型的性能就可能越好。

如果沒有圖像標註,那些令人驚嘆的計算機視覺技術都不可能實現。根據項目的不同,每個圖像上的標籤數量可能會有所不同。一些項目將只需要一個標籤來表示整個圖像的內容(圖像分類)。其他項目可能需要在單個圖像中標記多個對象,每個對象帶有不同的標籤。這些標籤通常由計算機視覺科學家或機器學習工程師預先確定。

如何進行圖像標註?

要創建帶標籤的圖像,需要三件事:

1)、圖片

2)、有人給圖片加注釋

3)、一個給圖片做標註的平臺

大多數圖像標註項目都是從尋找和培訓注釋人員來執行標註任務開始的。人工智慧是一個非常專業的領域,但人工智慧訓練數據標註並不總是必需的。雖然你需要機器學習方面的高等教育才能創造一輛自動駕駛汽車,但你不需要碩士學位就可以在圖像中畫汽車周圍的方框(邊界框注釋)。因此,大多數標註者不需要機器學習方面的學位。

但是,這些標註人員應該對每個標註項目的規範和指導方針進行全面的培訓,因為每個公司都有不同的需求。一旦標註人員接受了如何標註數據的培訓,他們就可以在專門用於標註圖像的平臺上標註成百上千的圖像。這個平臺是一個軟體,它應該具有執行特定類型標註所需的所有工具。

常用圖像標註類型

1)、 2D和3D包圍框

使用2D邊框,標註者必須在他們想要在圖像中注釋的對象周圍繪製一個框。有時這些目標對象將是相同的,即「請在圖中的每輛自行車周圍畫框。」

其他時候,可能會有多個目標對象,「請在圖中每輛車、行人和自行車周圍畫框。」在這種情況下,在畫出框後,標註者將不得不從標籤列表中選擇屬性給框中的對象。

3D包圍盒也被稱為長方體,除了它們還可以顯示被標註的目標對象的大致深度之外,它們幾乎與2D包圍盒一樣。與2D邊界框標註類似,標註器在目標對象周圍繪製框,確保在對象的邊緣放置錨點。有時目標對象的一部分可能被阻擋。在這種情況下,標註器會估計目標對象阻塞邊緣的位置。

2)、圖像分類

邊界框處理在一個圖像中標註多個對象,而圖像分類是將整個圖像與一個標籤關聯的過程。一個簡單的圖像分類的例子是標記動物的類型。注釋者會得到動物的圖片,並要求他們根據動物種類對每張圖片進行分類。

把這些帶注釋的圖像數據輸入計算機視覺模型,可以讓模型了解每種動物特有的視覺特徵。理論上,該模型將能夠將新的未注釋的動物圖像歸類到適當的物種類別中。

3)、線條和樣條

線條和樣條注釋,顧名思義,就是對圖像上直線或曲線的標註。注釋人員的任務是注釋車道、人行道、電力線和其他邊界指示器。用線條和樣條標註的圖像主要用於車道和邊界識別。此外,它們也經常被用於無人機的軌跡規劃。

從自動駕駛汽車、無人機到倉庫中的機器人等等,線條和樣條標註在各種用例中都很有用。

4)、多邊形

有時,不規則形狀的目標對象不容易用邊界框或長方體來標註。多邊形注釋允許注釋器在目標對象的每個頂點上繪製點。這個注釋方法允許對對象的所有精確邊進行注釋,而不管它的形狀如何。

與邊界框一樣,帶注釋的邊緣內的像素也將被標記為描述目標對象的標籤。

5)、 語義分割

邊界盒、長方體和多邊形都處理在圖像中標註單個對象的任務。而語義分割則是對圖像中每一個像素的進行標註。不需要給標註者一個要標註的對象列表,而是給他們一個分段標籤列表,以便將圖像分成幾個部分。比如,自動駕駛汽車的交通圖像語義分割就是一個很好的例子,一個典型的語義分割任務可能會要求標註者通過區別「汽車」、「自行車」、「行人」、「障礙物」、「人行道」、「機動車道」和「建築物」來分割圖像。

圖像標註的實際應用領域

1)、人臉識別

圖像標註的一個常見應用是面部識別。它包括從人臉圖像中提取相關特徵,以區分圖像中的人和物體。

利用關鍵點和地標等圖像標註技術,通過軌跡指向對人臉不同部位的不同點進行跟蹤,增強了人臉識別算法的有效性。

2)、農業技術

圖像標註技術已被應用於農業技術行業的各種任務中。通過識別病害和健康作物的圖像來檢測植物病害,可以通過使用邊界框或語義分割類型來實現。這是圖像標註在農業技術中最基本的應用之一。

3)、安全系統

圖像標註可以在安全系統中使用安全攝像頭標記物品,比如某些特定區域中的可疑包裹。通過語義分割將視頻區域劃分為受限區域和非受限區域,可以實現這一目的。圖像標註也可用於檢測某些可疑的活動。

4)、電子商務

圖像標註用於改進產品列表,還有助於確保客戶找到他們正在尋找的正確產品。這可以通過在搜索查詢和產品標題中標記各種組件的語義分割實現。

5)、機器人

圖像標註的主要應用之一是機器人技術,它幫助機器人區分周圍環境中的各種物體。

相關焦點

  • 計算機怎樣看「世界」?最常見的五種圖像標註工具
    作為機器學習的一個主要領域——圖像數據需要在計算機視覺中獲取大量已經標註的圖像。想知道有關不同圖像標註類型的信息嗎?繼續看下去吧!計算機視覺是機器學習和人工智慧開發的重要領域之一。簡單來說,計算機視覺旨在使計算機「看到」並以視覺的方式解釋所處世界。從自動駕駛汽車和無人機到醫療診斷技術和面部識別軟體,計算機視覺的應用相當廣泛,而且發揮著變革性作用。由於計算機視覺是為了開發機器模仿或超越人類視覺的功能,訓練這樣的模型需要大量標註圖像。
  • 圖像標註的基礎內容介紹
    說到圖像,計算機需要看到人類眼睛看到的東西。 例如,人類有識別和分類物體的能力。同樣,我們可以使用計算機視覺來解釋它接收到的視覺數據。這就是圖像標註的作用。 圖像標註在計算機視覺中起著至關重要的作用。圖像標註的目標是為和任務相關的、特定於任務的標籤。
  • 還在糾結深度學習算法 計算機視覺CV的關鍵在於數據採集和標註!
    2012年,AlexNet網絡橫空出世,帶來了前所未有的深度學習革命,這也讓多年來進展緩慢的計算機視覺CV研究,一下被按下了「快進鍵」。人們突然發現,這種模擬人腦抽象和迭代過程的深度學習算法,讓計算機開始「看見」。從物體的邊緣、輪廓到物體的部分,再向更高級層層抽象,深度學習讓計算機終於能夠在一張日常照片中,檢測並識別出圖上有一隻貓,而不是一條狗。
  • 計算機視覺圖像處理怎麼學習
    計算機視覺圖像處理怎麼學習學習人工智慧的計算機視覺方向,有二維視覺和三維視覺。相對於二維視覺而言,三維視覺目前的應用場景要少一些,而且項目落地的難度要大一些。二維計算機視覺的更多的應用在面向生產企業的視覺檢測方面。
  • 計算機視覺系列8:什麼是計算機視覺
    引言本教程分為四個部分,分別是:計算機視覺的初衷什麼是計算機視覺計算機視覺的挑戰計算機視覺的常見任務計算機視覺的初衷在我們的日常生活中,有很多現象與視覺相關。智慧型手機的攝像頭,使得拍攝照片或視頻變得如此簡單,從而導致現代社交網絡中圖集文章的驚人增長。
  • 圖像標註:揭秘自動駕駛、面部識別背後的「眼睛」
    這些不同領域技術創新的成功問世促進了人們對計算機可視化和解釋圖像的深入研究。通過使用不同的軟體,計算機視覺努力激活機器的雙眼去觀察和解釋圖像。 技術已經證明,計算機視覺可為人類和科學家提供自動駕駛汽車、無人機、面部識別和更多其他的應用。隨著技術領域引入圖像標註技術,人們開始享受到這一非同尋常的發展。
  • 計算機視覺:你必須了解的圖像數據底層技術
    計算機視覺其實是一個複雜多元的交叉領域,包含了很多來自數位訊號處理、神經科學、圖像處理、模式識別、機器學習(ML)、機器人、人工智慧(AI)等領域的概念。什麼是機器人視覺計算機視覺是讓計算機理解並標記圖像內容的技術領域舉個例子,請看下圖對於人類來說,你很難向從沒穿過衣服的原始人解釋什麼是連衣裙或者什麼是鞋。
  • MIT開放圖像標註工具LabelMe原始碼:助力機器視覺的發展
    計算機視覺需要大量的標註圖像來執行各類任務,ImageNet 的成功就在於其巨量的標註圖像。近日,MIT 的計算機科學和人工智慧實驗室(CSAIL)開放了圖像標註工具 LabelMe 的原始碼,我們可以使用該工具創建定製化標註任務或執行圖像標註。同時,CSAIL 開放此工具的源碼有助於進一步開發出更高效的標註方式和工具,有助於機器視覺的進一步發展。
  • 該工具有助於消除計算機視覺中的偏見
    儘管AI系統中偏見的來源多種多樣,但一個主要的原因是從在線資源收集的大量圖像中包含的定型圖像,工程師使用這些圖像來開發計算機視覺,這是AI的一個分支,允許計算機識別人,物體和動作。由於計算機視覺的基礎是建立在這些數據集上的,因此反映社會刻板印象和偏見的圖像可能會無意間影響計算機視覺模型。
  • 計算機視覺與圖像處理、模式識別、機器學習,它們的關係竟然是
    眾所周知,要實現計算機視覺必須有圖像處理的幫助,那麼除了圖像處理是必要的還有哪些呢?今天我們就來學習一下計算機視覺及其相關。首先,圖像處理至關重要,而圖像處理倚仗與模式識別的有效運用,而模式識別是人工智慧領域的一個重要分支,人工智慧與機器學習密不可分。
  • 機器學習和計算機視覺的前20個圖像數據集
    計算機視覺使計算機能夠理解圖像和視頻的內容。計算機視覺的目標是使人類視覺系統可以實現任務自動化。計算機視覺任務包括圖像採集、圖像處理和圖像分析。圖像數據可以採用不同的形式,例如視頻序列,從多個角度的不同的攝像機查看圖像或來自醫療掃描儀的多維數據。
  • 最全開放數據標註工具淺析 (計算機視覺類)
    伴隨著人工智慧行業的強勢崛起,數據標註這個在人工智慧行業鏈條中有著舉足輕重地位的環節,也漸漸的成為了一個新興的服務型行業。Labelme 開源的圖像標記工具,有廣泛的使用人員和知曉率,軟體自身也在不斷迭代,開發者也在不斷的優化使用功能。 優點 ♦ 開源工具,使用者可以根據自身需求對其功能進行添加和修改,軟體基礎功能穩定。 ♦ 在以點坐標的方式定位被標註元素輪廓的同時,還可以以像素點的方式定位被標註元素輪廓。
  • 計算機視覺的研究是推動經濟社會信息化的一場熱潮
    計算機視覺的研究是推動經濟社會信息化的一場熱潮,不少研究人員在挑戰計算機視覺普及和大規模商業應用中取得了突破性進展。在最近的一篇經典論文中,nasa的研究人員研究了在人工智慧與機器人視覺領域,通過單人重複視覺分割,打造各種複雜ai的能力。
  • 最適合初學者的18個經典開源計算機視覺項目
    不需要花一分錢就可以練習計算機視覺技術——你可以坐在現在的位置上完成這些工作。所以在這篇文章中, 我結合併創建了一個基於計算機視覺各種應用的開源計算機視覺項目列表。有很多事情要做,這是一個相當全面的清單,所以讓我們深入研究!
  • 【重磅】Facebook 開源計算機視覺系統,從像素水平理解圖像
    【編者按】:本文轉載自新智元,來源:Facebook 等,譯者:張冬君昨天谷歌開源了TensorFlow自動文本摘要生成模型,今天 Facebook 宣布開源計算機視覺系統,稱該系統能「從像素水平理解物體」,Facebook 希望開源能加速計算機視覺的發展。
  • 計算機視覺:你必須了解的圖像數據底層技術|人臉識別|算法|神經...
    目前主流的計算機視覺工具有OpenCV、Tensorflow、Gpu、YOLO、Keras等。計算機視覺其實是一個複雜多元的交叉領域,包含了很多來自數位訊號處理、神經科學、圖像處理、模式識別、機器學習(ML)、機器人、人工智慧(AI)等領域的概念。本文將具體介紹一下計算機視覺的工作流程。
  • 計算機視覺注釋:工具,類型和資源
    這些工具是獲取原始圖像數據並將其轉化為機器學習模型的訓練數據的關鍵。注釋工具可幫助自動駕駛車輛識別交通狀況,幫助倉庫機器人區分存貨,並幫助無人駕駛飛機導航到地址。在計算機視覺中,注釋工具用於各種不同的應用程式。
  • 天氣情況圖像分類訓練營材料第二期:傳統計算機視覺
    第二期 傳統計算機視覺案例導言傳統計算機視覺方法使用成熟的 CV 技術處理目標檢測問題,如特徵描述子(SIFT、SUR、BRIEF 等)。在深度學習興起前,圖像分類等任務需要用到特徵提取步驟,特徵即圖像中描述性或信息性的小圖像塊。
  • 計算機視覺泰鬥朱松純加入清華
    大眾對朱松純的名字可能不是很熟悉,但在人工智慧領域,他是一流學者和專家,專長於計算機視覺、統計與應用數據。而隸屬於清華信息科學技術學院的自動化系,在人工智慧方面也是以計算機視覺為主,原有教師隊伍裡有中國工程院院士戴瓊海、DenseNet(CVPR 2017 最佳論文)第一作者黃高和國家優秀青年基金獲得者魯繼文等。朱松純教授在計算機視覺領域造詣頗深。
  • 計算機視覺系列11:圖像預處理之像素歸一化
    圖像是由像素組成的。黑白圖像是單個像素矩陣,而彩色圖像中每個顏色通道都有單獨的像素矩陣,例如紅色、綠色和藍色等顏色通道。像素取值為0到255範圍內的整數。本系列教程將分為上、中、下三篇文章進行介紹,本文主要講解第一部分:像素歸一化。像素歸一化像素中心化像素標準化像素歸一化像素的歸一化需要用到前面介紹的Pillow庫,具體見計算機視覺系列9:圖像預處理之Pillow庫使用(上)。計算機視覺系列10:圖像預處理之Pillow庫使用(下)首先,需要知道的是,對於大多數圖像數據,像素值是介於0和255之間的整數。