2018-01-15 14:18 |浙江新聞客戶端 |記者 祝梅
繼阿里巴巴iDST自然語言處理團隊在機器閱讀理解領域頂級賽事SQuAD中刷新世界記錄、讓機器在精準度匹配上首次超越人類以來,阿里巴巴的技術團隊又奪得了三項世界第一。這一次,在國際最大的自動駕駛計算機視覺算法集KITTI中,阿里巴巴一舉囊括了包括UMM_ROAD(多車道)與UU_ROAD(鄉村車道)兩項特定場景評測任務,及整體場景的綜合評測任務URBAN_ROAD在內的三項道路場景分割任務第一。
據介紹,這三個世界第一,都是與自動駕駛緊密相關的道路場景分割任務。由機器視覺科學家任小楓帶領的視覺技術團隊最終以96.06%、97.70%的分割準確率分別獲得UU_ROAD(鄉村車道)、UMM_ROAD(多車道)兩項特定場景評測任務第一,96.76%的準確率獲整個道路場景分割綜合評測任務URBAN_ROAD第一。
△阿里巴巴提供的道路場景分割示意圖
這也是阿里巴巴首次出現在KITTI道路場景分割的排行榜上。據悉,KITTI數據集由德國卡爾斯魯厄理工學院和豐田美國技術研究院聯合創辦,是國際公認的最大自動駕駛計算機算法評測數據集。多樣性是KITTI數據集的最大特點,涵蓋城市、住宅區、道路、校園、行人等五大場景,採用更適合自動駕駛的BEV視角評價方式,包含眾多難度較大的無標識線道路,是自動駕駛技術研發必選的調測平臺。
其中,道路場景分割在自動駕駛領域至關重要,主要應用在自動駕駛中的可行駛區域劃分、自動駕駛路徑規劃、高精地圖構建以及輔助駕駛的AR導航。大多數自動駕駛研究機構都能做到對城市道路的大塊分割,但對於邊緣路面,例如路巖石、車輛沿路停靠等還存在很大識別難度。
如何把道路邊緣分割得更為精細,是目前的主要攻堅方向。據介紹,由任小楓帶領的視覺技術團隊提出基於在線難樣本挖掘的網絡學習方法,同時在網絡中增加在線數據增強模塊,及全局特徵、局部特徵融合機制,提升網絡特徵的表徵能力與推廣能力,解決道路分割問題中的道路邊沿與車輛周圍路面分割不準確、陰影幹擾等問題。
阿里巴巴長期佔據KITTI的車輛檢測世界冠軍,近日還獲得行人檢測項目第一,在計算機視覺國際頂級期刊和會議TIP、ACM MM等發表多篇論文,與世界分享中國技術。作為一家被電商掩蓋光芒的科技公司,阿里巴巴的科研能力正在強勢崛起,並尤為強調對基礎科學的研究投入。
此前,在去年的雲棲大會上,阿里巴巴曾宣布成立探索人類科技未來的實驗室「達摩院」,計劃在三年內對新技術投資超過1000億人民幣,用於涵蓋基礎科學和顛覆式技術創新的研究。與此同時,阿里巴巴也正成為全球頂尖科技人才回流的第一站。去年6月,計算機視覺頂級科學家任小楓加入阿里,隨後世界級量子科學家施堯耘、聲學專家馮津偉等相繼加盟,在阿里的豐富場景下探索人類的領先技術。
1515997088000