Fig. 6. Parameter of the sample area, resolution, and size
1.4 樣本的增強
要訓練具有22層結構的GoogLeNet深度神經網絡,數據量是基礎。即使本文將全國多個城市的OSM交通數據作為訓練複雜交叉路口樣本的採樣源,樣本量仍不夠充足。為此,本文通過對樣本進行處理和變換來擴充訓練數據容量。
1.4.1樣本簡化
充分發揮矢量數據模型精確可控、便於處理結構化、可線性描述的問題的優勢,對選取的樣本進行簡化處理。由圖7可以發現,對於採集的樣本,其周圍經常存在冗餘道路對樣本精度造成幹擾,為此,本文進行如下道路簡化處理:首先,刪除樣本內部的孤立弧段;其次,識別與道路及樣本邊界相連接的懸掛弧段,並設置長度剔除閾值,若該懸掛弧段的長度小於或等於長度閾值,則刪除這條懸掛弧段;反之,則保留該懸掛弧段。經過大量實驗,本文將長度閾值設置為樣本邊長長度的二分之一。圖7為某一樣本化簡示例,其中黑色實線為化簡剔除弧段。
圖7 樣本簡化
Fig. 7. Sample simplification
1.4.2樣本旋轉和鏡像
矢量數據旋轉處理:對複雜交叉路口矢量數據分別旋轉90°、180°、270°,增加3倍樣本容量;矢量數據鏡像處理:對複雜交叉路口矢量數據分別進行左右和上下鏡像處理,增加2倍樣本容量,如圖8所示。
圖8 樣本旋轉和鏡像
Fig. 8. Sample rotation and mirroring
最後對增強後的複雜交叉路口樣本進行標記和人工篩選,將增強後的樣本數據分為訓練集和測試集,訓練集和測試集中的複雜交叉路口打標籤為1,一般交叉路口打標籤為0,形成最終樣本數據集。
1.5 樣本訓練
本文以全國路網中的複雜交叉路口路網為樣本,該數據初始比例尺為1:1萬,共獲取用於訓練和測試的交叉路口數據樣本總量為23502個,其中典型複雜交叉路口為2556個,少幹擾的複雜交叉路口為4086個,喇叭型、苜蓿型複雜交叉路口為5112個,多幹擾不規則複雜交叉路口為7662個,其他交叉路口為4086個。按1:1的比例分為訓練集和測試集,在Caffe提供的框架下對GoogLeNet神經網絡進行訓練。
圖9為利用全國路網中複雜交叉路口樣本對GoogLeNet網絡模型進行訓練過程中loss值和accuracy值的變化曲線,accuracy是指模型在分類正確時給出的概率值,該值越靠近於1表示分類的準確率越高,反之越低。由圖9可知GoogLeNet神經網絡模型對於複雜交叉路口樣本測試集的最終分類loss值為0.0756,accuracy值為0.9652,同時可以看出該神經網絡模型在訓練過程中基本上得到了很好的收斂。GoogLeNet網絡模型對路網中複雜交叉路口的識別準確值accuracy為0.9652,所以說明GoogLeNet網絡模型對複雜交叉路口的深層次模糊特徵能夠進行有效的學習。
圖9 GoogLeNet網絡模型訓練過程中loss和accuracy變化曲線
Fig. 9. Loss and accuracy curves of the GoogLeNet model during the training process
2 實驗與分析
2.1 實驗數據與實驗環境
實驗數據為天津市和南京市的OSM城市交通路網數據,該數據初始比例尺為1:1萬,通過複雜交叉路口初定為,共獲取天津市待識別的交叉路口2102個、南京市待識別的交叉路口1852個,如圖10所示。在同一數據集下,將本文方法與文獻[13]提出的基於AlexNet神經網絡方法進行對比實驗,以驗證本文方法的準確性和適應性。
實驗環境為 Microsoft Win7 64位作業系統,CPU為Intel Core I7-3770,主頻3.2GHz,內存16GB,固態硬碟1024GB。
圖10 驗證數據及待識別定位點
Fig. 10. Experimental data and location points to be identified
2.2 識別準確度分析
分別應用兩種神經網絡模型對天津市和南京市的交通數據城市路網中包含的複雜交叉路口進行識別,並統計兩種神經網絡模型下複雜交叉路口各自的模型分類數和模型正確分類數,同時統計人工判別下的交叉路口數,進而計算兩種神經網絡模型下各自的查準率(Precision Ratio,PR)、查全率(Recall Ratio,RR)和測度值(F-score),數學函數見式(5)、(6)、(7),天津結果如表1所示、南京結果如表2所示。
由表1和表2可以看出,利用本文製作的訓練樣本庫,基於AlexNet網絡模型和GoogLeNet網絡模型的複雜交叉路口識別查全率均在90%左右,說明本文樣本庫複雜交叉路口類型豐富、採樣參數合理,使這兩種模型都能夠較好地學習複雜交叉路口的深層次模糊特徵,對路網中的複雜交叉路口進行有效地識別;此外,在查準率方面,相對於基於AlexNet網絡模型的識別方法,基於GoogLeNet網絡模型的識別方法天津高出11.43%、南京高出11.94%,說明GoogLeNet網絡模型對複雜交叉路口深層特徵的描述更為準確,將待識別複雜交叉路口以較高的概率劃分到了正確的分類中。此外,本文方法的查準率和查全率均超過了90%,說明基於矢柵數據結合的神經網絡訓練相較直接應用柵格數據進行訓練更為有效,矢量數據本身作為一種高階特徵,沒有多餘的背景影像影響,噪聲少,所包含的信息純度高,更有利於提高模型訓練精度。
2.3 視覺認知分析
利用複雜交叉路口GoogLeNet神經網絡模型對天津OSM路網數據進行識別的總體結果如表3所示,局部放大效果如圖11所示。
由表3可以發現,對於典型、少幹擾兩種類型的複雜交叉路口,兩種神經網絡的識別結果基本一致,然而,對於喇叭型、苜蓿型及多幹擾不規則複雜交叉路口,基於GoogLeNet網絡模型的識別結果較基於AlexNet網絡模型的識別結果分別提高了21及33個,準確度分別提高了7.40%和6.40%,說明前者對局部細節的辨識能力上明顯優於後者。
圖11 利用複雜交叉路口GoogLeNet神經網絡模型對天津OSM路網數據進行識別
Fig. 11. Complex junctions recognized by the GoogLeNet model for complex junctions
分類的局部效果如圖11所示,紅色點表示識別為複雜交叉路口,綠色點表示典型交叉路口,藍色點表示鄰近路段幹擾較少的複雜交叉路口,紫色點表示喇叭型、苜蓿型複雜交叉路口。從分類的局部放大效果圖可以看出,分類結果與路口實際類型吻合度較高,識別交叉路口類型豐富且識別出的複雜交叉路口中心基本位於圖幅中心,圖幅範圍較好地概括了路口的空間範圍。
3 結束語
複雜交叉路口結構錯綜複雜,形態變化多樣,傳統識別方法多依賴於人工設計的低層次特徵,基於深度學習的識別方法取得了一定程度的有益探索,但是由於訓練樣本庫不夠豐富且樣本中多餘幹擾過多,導致對複雜交叉路口的識別豐富度有限且精度不高。為此,本文將機器視覺領域的研究熱點GoogLeNet神經網絡引入到複雜交叉路口識別中,通過矢量數據與柵格圖像相結合的方式,實現了對於OSM數據複雜交叉路口的快速和精準識別。通過實際數據驗證,得出結論如下:
(1)在樣本豐富度方面:本文以全國複雜交叉路口為樣本源,共獲取用於訓練和測試的交叉路口數據樣本總量為23502個;
(2)在識別準確性方面:通過本文方法對天津市路網中複雜交叉路口的查全率和查準率分別達到了92.55%和91.32%,較基於AlexNet網絡模型的識別方法分別提高了3.31%和11.43%;對南京市路網中複雜交叉路口的查全率和查準率分別達到了93.15%和92.44%,較基於AlexNet網絡模型的識別方法分別提高了3.30%和11.94%。
參考文獻見原文
——相關閱讀——
陳銳志:室內定位技術已進入了一個新的時代
基於精準地圖的室內定位解決方案
聲波室內定位系統中基站幾何布局探究
室內導航定位技術研究進展與展望