MIT開放圖像標註工具LabelMe原始碼:助力機器視覺的發展

2021-01-07 機器之心Pro

本文由機器之心編輯，「機器之心」專注生產人工智慧專業性內容，適合開發者和從業者閱讀參考。點擊右上角即刻關注。

計算機視覺需要大量的標註圖像來執行各類任務，ImageNet 的成功就在於其巨量的標註圖像。近日，MIT 的計算機科學和人工智慧實驗室（CSAIL）開放了圖像標註工具 LabelMe 的原始碼，我們可以使用該工具創建定製化標註任務或執行圖像標註。同時，CSAIL 開放此工具的源碼有助於進一步開發出更高效的標註方式和工具，有助於機器視覺的進一步發展。

項目開源地址：https://github.com/CSAILVision/LabelMeAnnotationTool

LabelMe 地址：http://labelme.csail.mit.edu/Release3.0/

在該網址我們可以找到可在伺服器上安裝的 LabelMe 圖像標註工具源碼。LabelMe 是一個用於在線圖像標註的 Javascript 標註工具。與傳統圖像標註工具相比，其優勢在於我們可以在任意地方使用該工具。此外，它也可以幫助我們標註圖像，不需要在電腦中安裝或複製大型數據集。

下載

我們可以在該網址直接下載源碼壓縮文件：https://github.com/CSAILVision/LabelMeAnnotationTool/archive/master.zip

或者，使用以下命令直接複製該 GitHub 項目：

$ git clone https://github.com/CSAILVision/LabelMeAnnotationTool.git

Images：圖像所在文件夾。

Annotations：標註所在文件夾。

Masks：分割掩碼所在文件夾（scribble mode）。

Scribbles：scribble 所在文件夾（scribble mode）。

tool.html：LabelMe 標註工具的主網頁。

annotationTools：源碼目錄。

annotationCache：臨時文件地址。

Icons：網頁所用圖標。

快速操作指南

1. 將 LabelMe 標註工具代碼放在網頁伺服器上（網頁伺服器配置要求見下文）。

2. 在命令行上運行：

$ make

這將設置 perl 腳本需要的全局變量。注意：如果我們移動代碼位置，那麼我們必須重新運行「make」來刷新全局變量。

1. 在「Images」文件夾內創建一個子文件夾，將我們的圖像放在該文件夾內。如：「Images/example_folder/img1.jpg」。確保所有的圖像的擴展名為「.jpg」，文件夾/文件名由字母和數字構成（即不包含空格和其他字符）。

2. 使用網頁瀏覽器前往以下 URL 地址：http://www.yourserver.edu/path/to/LabelMe/tool.html?collection=LabelMe&mode=f&folder=example_folder&image=img1.jpg

3. 標註圖像。點擊「show me another image」前往下一個圖像。

4. 現在，你所作出的標註將出現在「Annotations」文件夾內。

網頁伺服器要求

在網頁伺服器上設置 LabelMe 工具，需要執行以下操作：

運行 Apache 伺服器（Ubuntu 配置說明：https://github.com/CSAILVision/LabelMeAnnotationTool/blob/master/UBUNTU.md，Windows 配置說明：https://github.com/CSAILVision/LabelMeAnnotationTool/blob/master/WINDOWS.md）

在 Apache 內啟用 authconfig，使伺服器側（包括 SSI）能夠運行。這使得 SVG 能夠發揮作用。這一步最常出現錯誤，所以務必確保這一步正常運行。

運行 perl/CGI 腳本，這是第二大容易出現錯誤的地方。

確保 php5 和 libapache2-mod-php5 庫已安裝。我們可以運行以下代碼在 Linux 上運行它們：

$ sudo apt-get install php5 libapache2-mod-php5

Ubuntu 配置說明：https://github.com/CSAILVision/LabelMeAnnotationTool/blob/master/UBUNTU.md

Windows 配置說明：https://github.com/CSAILVision/LabelMeAnnotationTool/blob/master/WINDOWS.md

如果無法繪製多邊形（polygons），那麼檢查該網頁是否為「application/xhtml+xml」網頁（火狐瀏覽器可以通過 Tools->Page Info 查看）。如果不是，確保 SSI 已啟用（查看上文「在 Apache 內啟用 authconfig」）。

確保我們的圖像擁有對網頁伺服器的讀取權限，「Annotations」文件夾中的多個文件夾擁有寫入權限。此外，「annotationCache/TmpAnnotations」也需要寫入權限。

該標註工具的特點

下面是我們能在整個標註工具內使用的統一資源定位符變量：

mode=im：僅展示圖像和畫布（不展示除圖像外的其他東西）。

mode=mt：Mechanical Turk 模式。

mode=f：點擊「next image」按鈕，進入該文件夾下的下一張圖像

mode=i：點擊「next image」按鈕，在 LabelMe 默認集合中隨機打開下一張圖像

mode=c：進入集合中的下一張圖像（集合通過 dirlist 設置）。

username=johndoe：為標註會話設定用戶名。

collection=LabelMe：使用默認 LabelMe 集合列表，設置一個新的集合列表請查看下文。

folder=MyLabelMeFolder：LabelMe 中圖像儲存的文件夾。

image=image.jpg：需要標註的 LabelMe 圖像

objects=car,person,building：當彈窗詢問用戶對象的名稱，用戶可以從下拉式菜單中（例 car、person、building）選擇一個對象。

scribble=false：關閉 scribble 模式。

objlist=visible：該命令控制右側的對象列表可見或不可見，不可見應該設置為「objlist=hidden」。

actions=n：控制用戶可以執行的操作，如果需要設置任何我們希望執行的操作，需要使用下列的屬性組合。例如，我們可以設置「actions=rmd」來允許執行重命名、修改控制點和刪除操作。默認情況下，「actions=n」。下面展示了所有可執行的操作：

n：創建和編輯新的多邊形（polygons）

r：重命名已存在的對象

m：在已存在的對象上修改控制點

d：刪除已存在的對象

a：允許所有的操作

v：僅查看多邊形，不允許編輯

viewobj=e：控制用戶可查看的對象，可以使用以下命令選項設定。默認為「viewobj=e」，並且請注意刪除了的對象將會顯示為灰色，並且對象列表中的對象名將會採用斜體。

e：允許查看新的和之前標註過的對象

n：僅允許查看新的對象

d：允許查看新的和已刪除的對象

a：允許查看所有的對象（新的、已存在的和已刪除的）

以下為 Mechanical Turk 模式下的設置：

mt_sandbox=true：使用 Mechanical Turk 沙盒模式。該模式可以在 Mechanical Turk 上進行調試，我們可以設置該變量以確保每一部分都能運行。

N=5：標註者至少需要標註 5 個多邊形。使用 N=inf 設置，標註者可任意多地標註樣本。

mt_intro=http://yourpage.com (http://yourpage.com/)：我們可以使用該變量定製化地設定標註者所能看到的指令。默認情況下將為標註者提供以下指令：http://labelme2.csail.mit.edu/Release3.0/annotationTools/html/mt_instructions.html

mt_instructions=Place your instructions here：我們可以定製化標註者在標註任務上方看到的一行指令。默認情況下，指令為：請儘可能多的使用對象標註該圖像。

我們可以使用以下命令行創建需要標註的圖片集：

$ cd ./annotationTools/sh/$ ./populate_dirlist.sh

這將在「./Images」文件夾內創建一個所有圖像的列表，列表在「./annotationCache/DirLists/labelme.txt」文件內。

之後，我們可以使用以下 URL 地址（http://www.yourserver.edu/path/to/LabelMe/tool.html?collection=labelme&mode=i）標註集合內的圖像。我們可以通過在命令行中運行下列命令，創建一個包含特定文件夾的集合：

$ cd ./annotationTools/sh/$ ./populate_dirlist.sh my_collection.txt example_folder

該列表出現在「./annotationCache/DirLists/my_collection.txt」內部。我們可以使用以下 URL 地址標註集合內的圖像：http://www.yourserver.edu/path/to/LabelMe/tool.html?collection=my_collection&mode=i。

我們可以將集合內的 XML 文件模板修改為「./annotationCache/XMLTemplates/your_collection.xml」，以改變集合內標註文件的布局。默認模板是「./annotationCache/XMLTemplates/labelme.xml」。

該標註工具行為的日誌文件記錄在「./annotationCache/Logs/logfile.txt」中。確保該文件擁有寫入權限。

CODE API

以下是原始碼概覽。更多細節詳見 https://cdn.rawgit.com/CSAILVision/LabelMeAnnotationTool/master/annotationTools/js/api/index.htm

tool.html：該標註工具的入口點。主要功能是添加所有 javascript 代碼，放置畫面

annotationTools/js/：包含實現該標註工具功能所需的所有 javascript 代碼。我們還提供了 code API，利用 code API 可獲取從原始碼注釋中自動提取出來的 Javascript 原始碼。

annotationTools/perl/：包含用於與伺服器後端交流的所有 Perl 腳本。

annotationTools/css/：包含所有 CSS 樣式定義。

annotationTools/html/：包含 HTML 輔助文件（如適用於 Mechanical Turk 平臺的說明文件）

MIT開放圖像標註工具LabelMe原始碼:助力機器視覺的發展

相關焦點

淺談計算機視覺中的圖像標註_易車網

圖像描述開原始碼整理

計算機視覺的圖像標註類型及應用

CMOS圖像傳感器推動機器視覺技術系統軟體的發展

LabVIEW 圖像處理與機器視覺

Python十大工具,讓圖像簡潔直觀有魅力!

10個Python圖像處理工具,非常全了!

計算機視覺、機器視覺、圖像處理以及人工智慧技術

10個不得不知的Python圖像處理工具,非常全了!

FLIR機器視覺相機:搭配CMOS傳感器,助力工業自動化!

計算機視覺基於圖像的三維重建入門介紹

...Star 7.2K,超級好用的OCR數據合成與半自動標註工具,強烈推薦!

華為機器視覺:打開智能世界視覺產業新格局

2020年中國機器視覺行業發展現狀分析人工智慧發展加速機器視覺進步

【重磅】Facebook 如何為計算機視覺技術尋求出路

CPU,GPU,FPGA:如何為您的機器視覺應用選擇最佳方法

機器雲視覺提供商「矩視智能」獲數千萬元Pre-A輪融資|騰股小夥伴...

11.5 機器視覺篇--LabVIEW圖像處理技術

機器視覺涉及廣泛淺談其前世今生

物聯網系列之機器視覺

MIT開放圖像標註工具LabelMe原始碼:助力機器視覺的發展

相關焦點

淺談計算機視覺中的圖像標註_易車網

圖像描述開原始碼整理

計算機視覺的圖像標註類型及應用

CMOS圖像傳感器推動機器視覺技術系統軟體的發展

LabVIEW 圖像處理與機器視覺

Python十大工具,讓圖像簡潔直觀有魅力!

10個Python圖像處理工具,非常全了!

計算機視覺、機器視覺、圖像處理以及人工智慧技術

10個不得不知的Python圖像處理工具,非常全了!

FLIR機器視覺相機:搭配CMOS傳感器,助力工業自動化!

計算機視覺基於圖像的三維重建入門介紹

...Star 7.2K,超級好用的OCR數據合成與半自動標註工具,強烈推薦!

華為機器視覺:打開智能世界視覺產業新格局

2020年中國機器視覺行業發展現狀分析人工智慧發展加速機器視覺進步

【重磅】Facebook 如何為計算機視覺技術尋求出路

CPU,GPU,FPGA:如何為您的機器視覺應用選擇最佳方法

機器雲視覺提供商「矩視智能」獲數千萬元Pre-A輪融資|騰股小夥伴...

11.5 機器視覺篇--LabVIEW圖像處理技術

機器視覺涉及廣泛 淺談其前世今生

物聯網系列之機器視覺

機器視覺涉及廣泛淺談其前世今生