目前,自動駕駛主流算法模型主要以有監督的深度學習方式為主,是基於已知變量和因變量推導函數關係的算法模型,需要大量的結構化標註數據對模型進行訓練與調優。
自動駕駛領域常見的標註類型通常包括2D框、3D立方體、多邊形、圖像語義分割、視頻標註、3D雷射點雲標註等,其中圖像語義分割是應用較為廣泛的一種標註類型。
從概念上來看,圖像語義分割屬於人工智慧計算機視覺領域的一個重要分支,它結合了圖像分類、目標檢測和圖像分割等技術,主要針對圖像進行像素級的分類。
語義分割的結果是將圖像變成帶有一定語義信息的色塊。語義分割技術可以識別出每個色塊的語義類別,並給每個像素都標註上其對應的標籤,從而實現從底層到高層的語義推理過程,最終得到一張具有各個像素語義標註信息的分割圖像。
這些經過標註後的語義分割圖像,可以用於自動駕駛核心算法訓練。自動駕駛汽車在行駛的過程中,車載攝像頭,或者雷射雷達探查到圖像後輸入到神經網絡中,後臺經過訓練的算法模型就可以自動將圖像分割歸類,以實現避讓行人與車輛等障礙。
目前,自動駕駛圖像語義分割領域,常用的標註對象主要有以下種類(所有標註對象均經過標註處理,圖片來源:曼孚科技SEED數據服務平臺):
01.道路可行駛區域
說明:道路可行駛區域通常指汽車可行駛區域。當存在路緣石時,道路可行駛區域為路緣石之間部分;當不存在路緣石時,以柏油或其他路面覆蓋區域為準。
02.欄杆/隔離欄/石墩
說明:位於道路兩側,主要包括欄杆、隔離欄、石墩等隔離物,但不含因道路施工設置的臨時路障。
03.杆狀物(豎直部分)
說明:只需要標註杆狀物的豎直部分,杆狀物上的其他部分不予標註。通常包括:路牌杆、路燈杆、交通燈杆等。
04.路邊建築
說明:道路兩側建築物,包括高層建築與底層建築等各類人造建築物體。
路邊建築
05.綠化植被
說明:位於道路兩側或者道路隔離地帶的綠化植被。通常包括綠化帶、草地、樹木等。
06.轎車(小型車輛)
說明:行駛在道路中或者停在路邊的用於載送人員及其隨身物品,且座位布置在兩軸之間的汽車。
07.貨車(大型車輛)
說明:行駛在道路中或者停在路邊用於運送貨物的車輛,或者用於牽引其他車輛的汽車。
08.其他機動車
說明:轎車、貨車以外的其他機動車輛,包括公交車、無軌電車、摩託車、機動三輪車等,但不包含任何在軌道上運行的車輛。
09.行人
說明:主要為步行的人。位於汽車內部,比如轎車、公交車內的人以及騎摩託車、騎自行車的人無需標註。
行人
10.非機動車
說明:非機動車,包括自行車、畜力車等。駕駛非機動車的駕駛員與非機動車一起,算作一個標註對象。
11.白色實線
說明:車道分界線的一種,用於分隔同向車道,不可變更車道。通常施劃在交叉路口的交通燈前。
12.單黃實線
說明:車道分界線的一種,單黃實線禁止雙方向車輛越線或壓線行駛。單黃實線一般施劃於單方向只有一條車道或一條機動車道和一條非機動車道道路、有其他危險需要禁止超車的路段。
13.黃色虛線
說明:車道分界線的一種,由連續間隔黃色車道線構成,可以在適當的時候進行超車或者掉頭轉彎等動作。
14.黃色虛實線
說明:黃色虛實線通常施劃在橋梁前後及允許掉頭的路段。黃色實線一側禁止車輛越線或壓線行駛,虛線一側準許車輛暫時越線或轉彎。
15.白色虛線
說明:車道分界線的一種,用於劃分同向車道中的不同車道,可跨越超車。
16.黃色禁止停車線
說明:當單黃實線被施劃在道路一側邊上時,其身份便轉變為「禁止停車標線」,表示在該路段禁止任何車輛停放。
17.導流線
說明:通常出現在具有複雜行駛條件的路口、匝道、掉頭車道等位置,其作用是引導車輛按規定路線行駛。
導流線
18.禁停網格線
說明:施劃於易發生因臨時停車造成堵塞的交叉路口、重要單位出入口及其他需要設置的路口等。
19.人行道
說明:普通人行橫道,分割時以每根白線的邊界進行分割標註,不以人行橫道的整體邊界進行標註。
20.道路箭頭
說明:道路上用於指示前進方向的箭頭,通常包括直行、轉彎、掉頭箭頭等。
21.減速帶
說明:安裝在公路上使經過的車輛減速的交通設施。
22.路燈
說明:位於道路兩側或者道路隔離地帶的路燈,只需要標註路燈杆的路燈部分即可。
23.紅綠燈
說明:紅綠燈的交通燈部分。
24.天空
說明:天空部分。
以上內容即為自動駕駛圖像語義分割常見的標註類型。在具體的標註項目內,同時還需要注意以下幾點:
1.以上標註樣例僅供參考,自動駕駛標註場景下,具體標註方式需要依據標註需求來確定;
2.在全景圖像語義分割模式下,一張圖像內的所有標註對象均需要經過標註處理,不能存在空白未標註的區域。
具體可參考以下例子:
這是一張尚未經過標註處理的圖像:
這是經過全景語義分割處理後的圖像:
經過語義分割處理後的圖像即可用於自動駕駛領域相關算法模型的訓練,為自動駕駛早日實現落地應用增添新一份助力。