要實現自主飛行,無人機需要了解它們在環境中感知到的東西,並根據這些信息做出判斷。卡內基梅隆大學的研究人員研發出了一種新方法,讓無人機分別學習感知和行動。
這種兩階段方法戰勝了「模擬與現實的差距」,並創造了一種將完全根據模擬數據訓練出來的無人機安全安排到現實世界航嚮導航中的方法。
計算機科學學院機器人研究所博士生羅格裡奧·博納蒂表示:「通常情況下,即便是在最逼真模擬數據上訓練的無人機,再安排到現實世界中時也會遭到失敗,因為光線、顏色和紋理差異仍然太大,無法轉化。」「我們的感知模塊接受了兩種模式的訓練,以提高對環境變化的穩健性。」
幫助訓練無人機感知能力的第一種方式是圖像。研究人員使用逼真的感模擬器創建了一個環境,其中包括無人機、足球場和從地面升起並隨機放置的紅色正方形大門,以創建一條軌跡。然後,他們從成千上萬隨機生成的無人機和大門配置中建立了一個模擬圖像的大型數據集。
感知所需的第二種方式是知道大門在空間中的位置和方向,這是研究人員利用模擬圖像的數據集完成的。
使用多種模式對模型進行教學,增強對無人機經驗的有力描述,這表示著它可以以一種從模擬轉換為現實的方式理解場和大門的本質。壓縮圖像以減少像素對此過程有所幫助。通過對低維表示的學習,可以使模型能夠看穿現實世界中的視覺噪音並識別大門。
隨著感知的學習,研究人員在模擬環境中部署無人機,這樣它就可以學習自己的控制策略或怎樣進行實際移動。在這種情況下,它會學習當在航道上航行並遇到每扇大門的時候,應該使用哪種速度。因為這是一個模擬的環境,所以程序可以在安排之前計算出無人機的最佳飛行軌跡。這種方法相比使用專家操作人員的手動監督學習具有優勢,因為現實世界中的學習可能是危險的、耗時的和昂貴的。
研究人員讓無人機通過指定的訓練步驟來學習導航課程。博納蒂說,他對無人機在現實世界中需要的特定敏捷性和方向提出了挑戰。
「我讓無人機以不同的軌跡形狀向左和向右轉彎,隨著我增加更多的噪音,這些轉彎會變得越來越難。機器人並不是在學習如何重新穿越任何特定的軌跡。相反,通過戰略性地指揮模擬無人機,它正在學習所有的元素和運動類型,從而自主的比賽,」博納蒂說。
博納蒂希望推動現有技術接近人類解讀環境線索的能力。
「到目前為止,大多數關於自主無人機競賽的工作都集中在設計一個增加額外的傳感器和軟體的系統上,唯一的目標是速度。相反,我們的目標是創造一種計算結構,靈感來源於人腦的功能,將視覺信息通過潛在的表徵映射到正確的控制動作上,」博納蒂說。
但無人機比賽只是這種類型學習的一種可能性。感知和控制分離的方法可以應用在許多不同的人工智慧任務,如駕駛或烹飪。雖然這個模型依賴於圖像和位置來傳授認識能力,但其他形式,如聲音和形狀,也能用在識別汽車、野生動物或物體。