Cruise利用遊戲動作捕捉技術 教自動駕駛汽車讀懂人類的身體語言

2020-12-14 騰訊網

蓋世汽車訊 在一條四車道的街道上,有兩條車道被工人佔用以修復路上的坑洞,其中一名工人左手舉著停車標誌,右手揮手示意汽車通過。如果是人類駕駛員,則會毫不猶豫地遵循手勢或標誌,不停地平穩前進。但是,對於自動駕駛汽車而言,則可能會停下,因為它未必能夠理解標誌或手勢。

圖片來源:Cruise

對於駕駛員、人類和計算機而言,每天都需要面對此類複雜情況。而在此類情況下,解讀肢體語言是關鍵。如何在不影響交通的情況,讓自動駕駛汽車安全、無縫地應對此類挑戰呢?這需要自動駕駛汽車了解用於引導人類駕駛員應對意外情況的常見手勢,以及行人處理事情時的手勢和肢體語言。

全球的自動駕駛汽車開發人員多年來一直致力於讓自動駕駛汽車了解一些基本手勢,最初是理解自行車騎手發出的信號。一般而言,開發人員依靠機器學習提升汽車識別真實情況的能力以及提升其理解如何處理情況的能力。據外媒報導,對於Cruise而言,他們從由200多輛自動駕駛汽車構成的車隊中收集了大量數據,而且此類汽車的學習速度很快,因為都在美國最複雜的駕駛環境之一——舊金山的街道上行駛。

不過,Cruise意識到機器學習模型不會總是有足夠的訓練數據,因為汽車在現實世界中看到重要手勢的次數並不多。自動駕駛汽車需要從不同的角度、不同的距離以及不同的光照條件下識別出每一種情況,而此類情況結合又會產生無數的可能性。如果僅靠汽車的真實體驗,則需要數年的時間來獲取足夠的信息。

於是,Cruise找到了一種創造性的解決方案——人類手勢的動作捕捉技術。此種技術一般由遊戲開發人員用於創造角色,Cruise一直在僱傭遊戲開發人員模擬真實世界的細節,並捕捉數據以教會自動駕駛車輛理解手勢。

圖片來源:Cruise

首先,Cruise數據收集團隊建立了一份完整的清單,列出人類利用身體與世界和他人互動的方式,比如打計程車、走路時打電話、或者在街道上行走時避開人行道施工等。一開始,Cruise自動駕駛汽車從可能會誤解的指令開始,例如行人向朋友揮手。接著,Cruise團隊測試在車輛附近,但沒有指著車輛的手勢,例如,停車人員在車輛旁邊的車道上揮手示意車輛開進車庫,建築工人舉著要求車輛暫時停下的牌子等。

最終,Cruise提出了一個列表,其中包含用手勢傳達的五個關鍵信息:停、走、左轉、右轉以及「不」(與車輛無關的常見動作,如自拍或取走背包等)。此外,Cruise採用了普遍接受的美國手勢,並假設車輛靠右行駛。

創造此類數據集需要採用動作捕捉技術,一共有兩種動作捕捉系統——光學與非光學系統。光學動作捕捉技術採用網格類結構上分布的攝像頭,此類攝像頭的視頻流可用於定位演員全身套裝上視覺標記的3D位置。此類系統有多個版本,能夠捕捉非常詳細的信息,包括面部表情。

不過,光學動作捕捉必須在工作室中採用複雜的多攝像頭設置來完成。因此,Cruise採用了一種非光學、基於傳感器的動作捕捉技術。該項技術依賴微機電系統(MEMS),攜帶方便、無線、不需要專門的工作室,因而具有很大的靈活性,可用於現實世界中。

圖片來源:Cruise

Cruise的動作捕捉套裝每個都含有19個傳感器包,附著在身體的關鍵部位,如頭部、胸部、臀部、肩膀、上臂、前臂和腿部。每個傳感器包大約為一枚銀幣大小,包括一個加速計、一個陀螺儀和一個磁強計。此類設備被連接到一條包含電池組、控制總線和Wi-Fi收音機的皮帶上,其中傳感器數據可無線傳輸至運行專用軟體的筆記本電腦上,供工程師實時查看和評估數據。

Cruise從工程團隊僱傭了五位身體特徵不一(身高、體重和性別)的志願者,讓他們將動作捕捉套裝穿上,並將他們帶往相對不受電子幹擾的地方。每個工程師首先需要擺出T字姿勢(站直,雙腳併攏,兩臂張開),以校準該動作捕捉系統。然後,工程師做出一個又一個手勢,將清單上的姿勢都做完,並且連續7天,一直重複做出此類姿勢,有些情況下分別採用左右手做,有時雙手一起做。Cruise還要求工程師做出力度不一的手勢。例如,對在施工區超速行駛的車輛做出緊急停下的手勢,力度可能會更強。最終,Cruise獲得239段3秒的視頻數據。

之後,Cruise將此類數據輸入到機器學習模型中。首先,驗證了所有的手勢都被正確記錄下來,沒有額外的噪音,並且沒有錯誤旋轉的傳感器提供了錯誤的數據。然後,工程師們通過軟體運行手勢序列,該軟體可以確認序列中每一幀關節的位置和方向。由於此類位置最初是通過3D形式獲取,該軟體可以計算每個序列的多個2D視圖,從而可以不斷增加旋轉,模擬10種不同的視點,從而擴展手勢數據集。此外,Cruise還隨意地利用身體的不同點模擬真實世界中被隱藏的某些點,然後增加旋轉,以創造不同的視角。

上述做法除了提供不同的人從不同的角度所做出的各種各樣的手勢數據集,還可提供非常清晰的數據,即無論服裝風格、顏色或光線條件如何,人體姿勢的骨骼結構是一致的。此類數據可讓Cruise更高效地訓練機器學習系統。

圖片來源:Cruise

一旦Cruise的汽車接受了動作捕捉數據的訓練,就可以更好地駕馭城市駕駛中的各種場景。其中之一就是道路建設,採用手勢識別系統,Cruise汽車將能夠在理解手勢的同時,安全地繞過多個工作人員。

此外,Cruise還計劃擴大數據集,以讓自動駕駛汽車更好地理解自行車騎手的手勢,例如,左手向上,肘部呈90度,意味著騎手要右轉;右臂垂直向外也表示此種意思。Cruise的自動駕駛汽車已經可以識別騎手,並自動減速為騎手騰出空間。但是,如果自動駕駛汽車能夠了解手勢的意思,就可以在為騎手留出足夠空間的同時,來執行有一定含義的操作,讓汽車無需停下,以造成不必要的交通堵塞。

相關焦點

  • 讓自動駕駛學習如何解讀行人的肢體語言
    遊戲開發者使用動作捕捉技術教導自動駕駛Cruise理解行人手勢圖中表示工人在兩車道的馬路上進行施工。一名工人左手舉著停車標誌,用右手揮手示意汽車通過。這在司機看來並不是難事。然而,這種情況是否會讓自動駕駛汽車停下來嗎。它能否理解停止的標誌以及如何反應,但是那個手勢呢?這要複雜得多。
  • 光學動作捕捉(光學動捕)系統是什麼?它能在自動駕駛、無人機、機器...
    在智能體算法層面,動作捕捉是自動駕駛、無人機、機器人、安防等涉及電子運動學中最重要的技術和算法,而光學動作捕捉(簡稱光學動捕)處於這門算法學科的最前端。那麼光學動作捕捉系統到底能做哪些事情呢?iyPednc本文由柒DoF原創發表在EDN電子技術設計,通過通俗易懂的方式介紹了光學動作捕捉系統的原理、應用場景和基本算法等。
  • 哈弗神經學博士:自動駕駛汽車不會讀心術,但人會!
    然而,目前自動駕駛汽車缺乏的正是這個能力——看一眼某個人(如行車過程中經常遇見的三類人:行人、駕駛員和騎自行車的人),就知道他們此刻在想什麼。事實上,人類駕駛員在開車時的這些即時判斷,對自身與他人的行車安全起著至關重要的作用。來自哈佛大學的自動駕駛初創公司
  • 史丹福大學研發計算技術 可讓自動駕駛汽車根據周圍情況自動調整...
    人類通常能夠明白周圍車輛駕駛員的目標,並能夠協商出決策,例如在一個十字路口上,哪一個先走。史丹福大學的研究人員嘗試在自動駕駛車輛上複製此種能力,並將此種複雜行為應用到自動駕駛汽車上,總體目標是讓自動駕駛汽車能夠識別周圍車輛的目標,從而在需要協商的駕駛情境中規劃出更合適的行進路徑。
  • 沃爾沃汽車「高度仿真駕駛模擬裝置」利用最新遊戲技術開發更安全...
    近期,沃爾沃汽車創新專家團隊在其「開放式創新中心」舉行了一場現場直播活動,演示了沃爾沃汽車「高度仿真模擬裝置」。工程師將其稱為「高度仿真駕駛模擬裝置」,並不只是讓玩家沉迷遊戲的藉口。相反,沃爾沃汽車將藉助這款開創性的混合現實模擬裝置,力求在安全與自動駕駛技術領域取得新的重大突破。
  • 讀懂ADAS,無人駕駛的過渡,卻是實現自動駕駛的第一步
    美國汽車工程師學會SAE(Society of Automotive Engineers),在2014年制定了自動駕駛的分級標準,按照汽車是否能控制關鍵駕駛功能的原則,將自動駕駛分為了L0至L5六個等級。
  • 道德機器"考驗自動駕駛道德觀|自動駕駛汽車|無...
    麻省理工學院將著名的「電車難題」問題製作成網頁遊戲,通過全球網民的參與來收集人類對此問題的看法。你可以在http://moralmachine.mit.edu/hl/zh參與測試,網站提供中文語言界面。
  • 史丹福大學研發計算技術 可讓自動駕駛汽車根據周圍情況自動調整軌跡
    人類通常能夠明白周圍車輛駕駛員的目標,並能夠協商出決策,例如在一個十字路口上,哪一個先走。史丹福大學的研究人員嘗試在自動駕駛車輛上複製此種能力,並將此種複雜行為應用到自動駕駛汽車上,總體目標是讓自動駕駛汽車能夠識別周圍車輛的目標,從而在需要協商的駕駛情境中規劃出更合適的行進路徑。
  • 自動駕駛汽車技術的潛在能力是多少?
    隨著市場上互聯自動駕駛汽車的大量出現及共享經濟在城市交通中的持續增長,當今社會正處於全球社會和經濟變革的邊緣。自動駕駛汽車技術的潛在能力是多少?消費者將如何使用自動駕駛汽車?針對這些疑問,來自L.E.K.艾意凱諮詢的專家們給出了解答。
  • 無人駕駛自動汽車時代來臨
    無人駕駛汽車時代  無人駕駛全自動汽車聽上去像科學幻想,但大多數技術已經存在。事實上,在過去一個世紀,我們已經逐漸將駕駛任務交給自動系統。Google公司的無人駕駛自動汽車已經累計行駛20萬英裡。除了Google之外,各大汽車公司都在研發全自動汽車。全自動汽車的反應速度超過人類駕駛員,而且可以同時處理更多信息,對緊急情況的反應更快。它從不驚慌失措,從不發脾氣,從不分心,甚至連眼睛都不眨一下,無論從哪個方面看都優於人類。  那個東西躺在高速路路肩上,漸漸進入視野。是動物屍體嗎?還是某種古怪的灌木。
  • 自動駕駛仿真平臺VISTA推出,大幅優化自動駕駛汽車測試和部署時間
    研究人員稱,VISTA是一款數字驅動型平臺,其所用的數據與真實的路況、駕駛情境內所涉及的目標物無論在距離還是行為動作上都保持一致。這防止了自動駕駛汽車在仿真軟體裡所學的駕駛技巧與真實環境下的車輛操控存在不匹配的情況。為了創建VISTA,人類駕駛員每行駛一段距離,研究人員就會採集相應的視頻數據,逐幀地提取分析。
  • 乾貨分享:遊戲技術如何助力自動駕駛仿真測試
    自動駕駛虛擬仿真技術,作為推動自動駕駛落地的必要工具,已經被行業廣泛運用。與在遊戲中復現虛擬的現實世界類似,自動駕駛虛擬仿真系統,是通過虛構一個幾何形象、物理規律乃至運行邏輯都與真實世界無限接近的虛擬環境,讓自動駕駛汽車在其中運行,積累算法訓練和驗證需要的海量數據,以此解決現實中測試成本高、耗時長、風險高、場景局限性大等問題。
  • 人工智慧自動跟蹤果蠅產卵、小鼠伸爪,大大降低動作捕捉成本
    130多年前,英國著名攝影師邁布裡奇利用橫跨賽道的緊繃繩子控制快門,馬匹跑過時自動觸發拍照,由此解決了這個爭論已久的話題。這可能是「動作捕捉」技術的鼻祖。如今,基於視頻記錄的動作捕捉技術已經廣泛應用於動畫製作、體育訓練、人機工程等領域,其核心是將運動物關鍵部位的動作處理成計算機數據。
  • 蘇州相城區發布智能駕駛「上路計劃」,福特開放自動駕駛汽車數據集
    2020年2月,發改委、工信部、交通運輸部等11個國家部委聯合印發了《智能汽車創新發展戰略》,代表我國智能汽車頂層設計出爐,戰略提出要實現有條件自動駕駛的智能汽車達到規模化生產,實現高度自動駕駛的智能汽車在特定環境下市場化應用。
  • 從街談巷議到鮮有曝光,自動駕駛汽車已經涼了?
    這個理念背後的邏輯非常簡單——為一部汽車配備大量攝像頭,攝像頭系統可以同時監控周邊的所有情況,讓汽車據此判斷該做出怎樣的反應。將行車的規則教給車載電腦,然後讓後者自行決定如何駛往目的地。 解釋雖然非常簡單,但是要真正做到,卻是極為複雜的工作。在人類常見的行為當中,駕駛本身就屬於最複雜者之一。
  • 吳恩達的Drive.ai,在教自動駕駛汽車如何與人類交流
    一臺搭載著乘客的汽車,行駛在馬路上,要解決兩個方面的問題:一是讓乘客有安全感;二是讓周邊的人和車有安全感。現在,這兩個方面的問題,都是由充當司機角色的人類來解決。當自動駕駛成為高頻詞,機器即將替代人類駕駛的時候,搭載著自動駕駛技術的車輛,就要解決上述兩個方面的問題了。
  • 全無人自動駕駛汽車大躍進:Cruise 測試車登陸舊金山
    雷鋒網(公眾號:雷鋒網)按,繼 Waymo 之後,有通用、軟銀和本田強力支持的 Cruise 也開始發力,它們的全無人自動駕駛汽車(方向盤後不再有安全駕駛員準備接管了)終於在年底正式上路,而且落地城市直接選了交通異常繁忙的舊金山,絕對的勇氣可嘉。
  • 大眾正在測試自動駕駛汽車的防嘔吐技術
    而對於暈車這件在長途乘坐汽車中很容易發生的事情,目前大眾汽車正在尋求比嘔吐袋更好的解決方案,但測試仍在繼續,這個棘手問題在未來終將被解決。當易受影響的人是乘客而不是司機時,情況往往會變得更糟,而隨著自動駕駛汽車和半自動駕駛功能進入主流,情況往往會變得更糟。因此,大眾汽車正在自動駕駛汽車上測試暈車的解決方案,包括紅色和綠色LED燈以及可移動座椅等功能。
  • 自動駕駛:較強遊戲規則顛覆者
    同時,英特爾公司執行長科再奇發表了一篇標題為《自動駕駛:較強遊戲規則顛覆者》的文章。在自動駕駛的問題上,科再奇提出了「汽車是新興消費空間」的觀點,他認為,自動駕駛系統是安全帶、安全氣囊和防抱死制動系統的延伸,而英特爾的長期目標是完全避免駕駛相關的生命損失。
  • 沃爾沃汽車利用遊戲技術打造更安全的汽車
    但是,如果製作這個遊戲的高等技術進入製造更安全的汽車,該怎麼辦?以製造世界安全汽車而聞名的沃爾沃汽車公司最近表示,將利用電子遊戲技術製造更安全的汽車,成為熱門話題。