GoogLeNet神經網絡的複雜交叉路口識別方法

2021-01-21 測繪學術資訊

Fig. 6. Parameter of the sample area, resolution, and size

1.4 樣本的增強

要訓練具有22層結構的GoogLeNet深度神經網絡,數據量是基礎。即使本文將全國多個城市的OSM交通數據作為訓練複雜交叉路口樣本的採樣源,樣本量仍不夠充足。為此,本文通過對樣本進行處理和變換來擴充訓練數據容量。

1.4.1樣本簡化

充分發揮矢量數據模型精確可控、便於處理結構化、可線性描述的問題的優勢,對選取的樣本進行簡化處理。由圖7可以發現,對於採集的樣本,其周圍經常存在冗餘道路對樣本精度造成幹擾,為此,本文進行如下道路簡化處理:首先,刪除樣本內部的孤立弧段;其次,識別與道路及樣本邊界相連接的懸掛弧段,並設置長度剔除閾值,若該懸掛弧段的長度小於或等於長度閾值,則刪除這條懸掛弧段;反之,則保留該懸掛弧段。經過大量實驗,本文將長度閾值設置為樣本邊長長度的二分之一。圖7為某一樣本化簡示例,其中黑色實線為化簡剔除弧段。

圖7 樣本簡化

Fig. 7. Sample simplification

1.4.2樣本旋轉和鏡像

矢量數據旋轉處理:對複雜交叉路口矢量數據分別旋轉90°、180°、270°,增加3倍樣本容量;矢量數據鏡像處理:對複雜交叉路口矢量數據分別進行左右和上下鏡像處理,增加2倍樣本容量,如圖8所示。

     

圖8 樣本旋轉和鏡像

Fig. 8. Sample rotation and mirroring

最後對增強後的複雜交叉路口樣本進行標記和人工篩選,將增強後的樣本數據分為訓練集和測試集,訓練集和測試集中的複雜交叉路口打標籤為1,一般交叉路口打標籤為0,形成最終樣本數據集。

1.5 樣本訓練

本文以全國路網中的複雜交叉路口路網為樣本,該數據初始比例尺為1:1萬,共獲取用於訓練和測試的交叉路口數據樣本總量為23502個,其中典型複雜交叉路口為2556個,少幹擾的複雜交叉路口為4086個,喇叭型、苜蓿型複雜交叉路口為5112個,多幹擾不規則複雜交叉路口為7662個,其他交叉路口為4086個。按1:1的比例分為訓練集和測試集,在Caffe提供的框架下對GoogLeNet神經網絡進行訓練。

圖9為利用全國路網中複雜交叉路口樣本對GoogLeNet網絡模型進行訓練過程中loss值和accuracy值的變化曲線,accuracy是指模型在分類正確時給出的概率值,該值越靠近於1表示分類的準確率越高,反之越低。由圖9可知GoogLeNet神經網絡模型對於複雜交叉路口樣本測試集的最終分類loss值為0.0756,accuracy值為0.9652,同時可以看出該神經網絡模型在訓練過程中基本上得到了很好的收斂。GoogLeNet網絡模型對路網中複雜交叉路口的識別準確值accuracy為0.9652,所以說明GoogLeNet網絡模型對複雜交叉路口的深層次模糊特徵能夠進行有效的學習。

圖9 GoogLeNet網絡模型訓練過程中loss和accuracy變化曲線

Fig. 9. Loss and accuracy curves of the GoogLeNet model during the training process

2 實驗與分析

2.1 實驗數據與實驗環境

實驗數據為天津市和南京市的OSM城市交通路網數據,該數據初始比例尺為1:1萬,通過複雜交叉路口初定為,共獲取天津市待識別的交叉路口2102個、南京市待識別的交叉路口1852個,如圖10所示。在同一數據集下,將本文方法與文獻[13]提出的基於AlexNet神經網絡方法進行對比實驗,以驗證本文方法的準確性和適應性。

實驗環境為 Microsoft Win7 64位作業系統,CPU為Intel Core I7-3770,主頻3.2GHz,內存16GB,固態硬碟1024GB。

圖10 驗證數據及待識別定位點

Fig. 10. Experimental data and location points to be identified

2.2 識別準確度分析

分別應用兩種神經網絡模型對天津市和南京市的交通數據城市路網中包含的複雜交叉路口進行識別,並統計兩種神經網絡模型下複雜交叉路口各自的模型分類數和模型正確分類數,同時統計人工判別下的交叉路口數,進而計算兩種神經網絡模型下各自的查準率(Precision Ratio,PR)、查全率(Recall Ratio,RR)和測度值(F-score),數學函數見式(5)、(6)、(7),天津結果如表1所示、南京結果如表2所示。

由表1和表2可以看出,利用本文製作的訓練樣本庫,基於AlexNet網絡模型和GoogLeNet網絡模型的複雜交叉路口識別查全率均在90%左右,說明本文樣本庫複雜交叉路口類型豐富、採樣參數合理,使這兩種模型都能夠較好地學習複雜交叉路口的深層次模糊特徵,對路網中的複雜交叉路口進行有效地識別;此外,在查準率方面,相對於基於AlexNet網絡模型的識別方法,基於GoogLeNet網絡模型的識別方法天津高出11.43%、南京高出11.94%,說明GoogLeNet網絡模型對複雜交叉路口深層特徵的描述更為準確,將待識別複雜交叉路口以較高的概率劃分到了正確的分類中。此外,本文方法的查準率和查全率均超過了90%,說明基於矢柵數據結合的神經網絡訓練相較直接應用柵格數據進行訓練更為有效,矢量數據本身作為一種高階特徵,沒有多餘的背景影像影響,噪聲少,所包含的信息純度高,更有利於提高模型訓練精度。

2.3 視覺認知分析

利用複雜交叉路口GoogLeNet神經網絡模型對天津OSM路網數據進行識別的總體結果如表3所示,局部放大效果如圖11所示。

由表3可以發現,對於典型、少幹擾兩種類型的複雜交叉路口,兩種神經網絡的識別結果基本一致,然而,對於喇叭型、苜蓿型及多幹擾不規則複雜交叉路口,基於GoogLeNet網絡模型的識別結果較基於AlexNet網絡模型的識別結果分別提高了21及33個,準確度分別提高了7.40%和6.40%,說明前者對局部細節的辨識能力上明顯優於後者。

圖11 利用複雜交叉路口GoogLeNet神經網絡模型對天津OSM路網數據進行識別

    Fig. 11. Complex junctions recognized by the GoogLeNet model for complex junctions

分類的局部效果如圖11所示,紅色點表示識別為複雜交叉路口,綠色點表示典型交叉路口,藍色點表示鄰近路段幹擾較少的複雜交叉路口,紫色點表示喇叭型、苜蓿型複雜交叉路口。從分類的局部放大效果圖可以看出,分類結果與路口實際類型吻合度較高,識別交叉路口類型豐富且識別出的複雜交叉路口中心基本位於圖幅中心,圖幅範圍較好地概括了路口的空間範圍。

3 結束語

複雜交叉路口結構錯綜複雜,形態變化多樣,傳統識別方法多依賴於人工設計的低層次特徵,基於深度學習的識別方法取得了一定程度的有益探索,但是由於訓練樣本庫不夠豐富且樣本中多餘幹擾過多,導致對複雜交叉路口的識別豐富度有限且精度不高。為此,本文將機器視覺領域的研究熱點GoogLeNet神經網絡引入到複雜交叉路口識別中,通過矢量數據與柵格圖像相結合的方式,實現了對於OSM數據複雜交叉路口的快速和精準識別。通過實際數據驗證,得出結論如下:

(1)在樣本豐富度方面:本文以全國複雜交叉路口為樣本源,共獲取用於訓練和測試的交叉路口數據樣本總量為23502個;

(2)在識別準確性方面:通過本文方法對天津市路網中複雜交叉路口的查全率和查準率分別達到了92.55%和91.32%,較基於AlexNet網絡模型的識別方法分別提高了3.31%和11.43%;對南京市路網中複雜交叉路口的查全率和查準率分別達到了93.15%和92.44%,較基於AlexNet網絡模型的識別方法分別提高了3.30%和11.94%。

參考文獻見原文


——相關閱讀——

陳銳志:室內定位技術已進入了一個新的時代

基於精準地圖的室內定位解決方案

聲波室內定位系統中基站幾何布局探究

室內導航定位技術研究進展與展望

相關焦點

  • 生物電子-具有交叉模式整合和識別的生物啟發式多感覺神經網絡
    視覺,觸覺,聽覺,嗅覺和味覺在人類多感覺神經網絡中的集成和交互作用促進了高級認知功能,例如跨模態集成,識別和想像力,以準確評估和全面理解多模態世界
  • 提出神經網絡構建非絕熱勢能面新方法—新聞—科學網
    中科院大連化物所
  • 神經網絡算法原理_神經網絡算法的應用_神經網絡算法實例說明
    神經網絡是一種模擬人腦結構的算法模型。其原理就在於將信息分布式存儲和並行協同處理。雖然每個單元的功能非常簡單,但大量單元構成的網絡系統就能實現非常複雜的數據計算,並且還是一個高度複雜的非線性動力學習系統。   神經網絡的結構更接近於人腦,具有大規模並行、分布式存儲和處理、自組織、自適應和自學能力。
  • 用於英文字母識別的三種人工神經網絡的設計
    摘要分別採用單層感知器、BP網絡和霍普菲爾德網絡三種神經網絡對26個英文字母進行識別,通過實驗給出各網絡的識別出錯率,從中可以看出三種人工神經網絡各自的優缺點,為選擇神經網絡進行字符識別提供了一定的依據。
  • 基於憶阻器的神經網絡應用研究
    不難看出,在多層感知機神經網絡的計算過程中,輸入信息向量與權重矩陣之間的矩陣向量乘法運算消耗了大量計算資源,因而利用憶阻交叉陣列並行一步實現矩陣向量乘法計算,可以大大減少硬體化神經網絡的能耗。在基於憶阻突觸器件的多層感知機應用中,憶阻交叉陣列被用來存儲突觸權重矩陣,每一個交叉點處的憶阻器的電導值被用來表示一個突觸連接的權重值[40-42]。
  • 如何通過人工神經網絡實現圖像識別?
    人工神經網絡(Artificial Neural Networks)(簡稱ANN)系統從20 世紀40 年代末誕生至今僅短短半個多世紀,但由於他具有信息的分布存儲模式識別領域中大多數課題都會遇到的基本問題,並且在不同的課題中,由於具體的條件不同,解決的方法也不盡相同,因而目標識別的研究仍具有理論和實踐意義。
  • 基於英文字母識別的三種人工神經網絡的設計方案
    3.2BP網絡的設計及其識別效果 該網絡設計方法在文獻[lj中有詳細介紹。網絡具有35個輸人節點和26個輸出節點。目標誤差為0.0001,採用輸人在(0,l)範圍內對數S型激活函數兩層109519/109519網絡,隱含層根據經驗選取10個神經元。
  • 基於憶阻器的神經網絡應用研究
    不難看出,在多層感知機神經網絡的計算過程中,輸入信息向量與權重矩陣之間的矩陣向量乘法運算消耗了大量計算資源,因而利用憶阻交叉陣列並行一步實現矩陣向量乘法計算,可以大大減少硬體化神經網絡的能耗。在基於憶阻突觸器件的多層感知機應用中,憶阻交叉陣列被用來存儲突觸權重矩陣,每一個交叉點處的憶阻器的電導值被用來表示一個突觸連接的權重值[40-42]。
  • 美國研發快速法評估神經網絡的不確定性 改進自動駕駛車決策能力
    蓋世汽車訊 現在,深度學習神經網絡等人工智慧系統越來越多地用於為對人類健康和安全至關重要的決策提供信息,如自動駕駛或醫療診斷等。此類網絡善於識別大型複雜數據集,以幫助做決策。但是,怎麼才知道此類網絡是正確的呢?據外媒報導,美國麻省理工學院(MIT)和哈佛大學(Harvard University)的研究人員決心找出答案。
  • 神經、認知、計算三學科深度交叉 建開源開放平臺探索人工智慧...
    深度學習在人臉識別等方面取得重大進展,但並未真正解決感知問題,例如對抗性圖片可以欺騙人臉識別系統,這不是個案,而是揭示了深度學習的根本性缺陷。因此,人工智慧未來發展的關鍵不是簡單提高算力和增加數據,而是要重新思考智能模型。」北京大學計算機科學技術系教授、北京智源人工智慧研究院院長黃鐵軍表示。什麼是智能?「我認為智能是系統通過獲取和加工信息而獲得的一種能力,從而實現從簡單到複雜的演化。
  • 什麼是人工智慧神經網絡? 神經網絡是怎麼應用到各領域的?|什麼|...
    前不久,據華爾街日報報導, Uber在一宗無人車的測試過程中,造成了一名行人死亡的嚴重交通事故,除此之外,環顧我們身邊,蘋果手機的虛擬個人助理Siri有時會無法識別我們在說什麼;某些人臉識別支付   原標題:什麼是人工智慧神經網絡? 神經網絡是怎麼應用到各領域的?
  • 模式識別與機器學習(教學大綱)|向量|貝葉斯|算法|神經網絡_網易訂閱
    以貝葉斯學習思想貫穿始終,並適時與其他重要知識點(如支持向量機、深度學習)等進行交叉和關聯,便於讀者在形成良好知識體系的同時保持對整個領域知識的把握。  全書共14章和4個附錄,循序漸進地剖析模式識別與機器學習領域。
  • 具有自學習能力的全光尖峰神經突觸網絡
    當這些硬體連接到網絡或神經形態系統時,它們處理信息的方式更類似於大腦。在這裡,我們提出了一個全光學版本的神經突觸系統,能夠監督和非監督學習。利用波分復用技術實現了一種可擴展的光子神經網絡電路結構,成功地在光學領域實現了模式識別。這種光子神經突觸網絡有望獲得光學系統固有的高速和高帶寬,從而能夠直接處理光學通信和視覺數據。
  • 盤點人臉識別中的黑科技——人工神經網絡
    他們發現大腦中編碼人臉的方式和成功地執行人工智慧系統(稱為深度神經網絡)的驚人相似性。當我們看一張面孔時,視覺皮層中的神經元群被激活並發射它們的信號。事實上,某些神經元對面部有選擇性的反應,而不是對其他物體的反應。但是單個神經元的激活是如何共同產生面部感知和識別的呢?
  • 神經網絡技術解析:手寫數字識別項目解讀
    打開APP 神經網絡技術解析:手寫數字識別項目解讀 澤南 張倩 發表於 2021-01-13 15:50:11 手寫數字識別是很多人入門神經網絡時用來練手的一個項目
  • 新型雷達監控系統專為交叉路口設計 可檢測/區分/定位多達128個物體
    蓋世汽車訊 據外媒報導,德國交通傳感器開發商InnoSenT推出了一款用於複雜交叉路口的雷達監控系統iSYS-5220,該系統結合了先進的技術,但是設置和使用起來都非常簡單。
  • 英特爾Loihi神經形態晶片可識彆氣味中有害化學物質
    英特爾實驗室和康奈爾大學的研究人員,剛剛展示了英特爾神經形態研究晶片 Loihi 的獨特能力 —— 僅通過氣味來識別多種有害的化學物質。 研究人員稱:Loihi 可分析識別測試樣品中的每種化學物質,而不會破壞先前學習到的有關氣味的記憶。
  • 英特爾Loihi神經形態晶片可識彆氣味中的有害化學物質
    英特爾實驗室和康奈爾大學的研究人員,剛剛展示了英特爾神經形態研究晶片 Loihi 的獨特能力 —— 僅通過氣味來識別多種有害的化學物質。研究人員稱:Loihi 可分析識別測試樣品中的每種化學物質,而不會破壞先前學習到的有關氣味的記憶。
  • 用PLC設計複雜十字路口的紅綠燈控制系統,讓交通井然有序
    通過分析交通複雜十字路口信號燈的控制要求,結合S7-200的控制性能,在傳統的交通燈控制基礎上增加了左轉控制功能,對系統進行了軟、硬體設計,實現了複雜十字路口的東西南北方向的直行、左轉及人行道信號燈的合理控制的功能,實驗驗證了方法的可靠性。
  • 人工神經網絡的特點有哪些
    人工神經網絡的特點和優越性,主要表現在三個方面: 第一,具有自學習功能。例如實現圖像識別時,只在先把許多不同的圖像樣板和對應的應識別的結果輸入人工神經網絡,網絡就會通過自學習功能,慢慢學會識別類似的圖像。自學習功能對於預測有特別重要的意義。