手勢交互新突破!ContactPose或助力未來XR再無手柄?

2020-12-20 VR陀螺

文/VR陀螺 X

手勢追蹤被視為人機互動(HCI)/人類數據交互(Human data interaction,HDI)中最直觀的交互模式之一,是混合現實(XR)終端交互的最新趨勢。

在XR領域中,手部運動軌跡的感知與追蹤是改善用戶在不同技術領域和平臺體驗的一個重要組成部分。手部追蹤技術在未來可以幫助用戶「解放雙手」,人機互動不再需要通過手柄控制,實現真正的解放雙手,讓用戶以最直觀的方式體驗在增強現實和物理世界之間的融合。

最近熱度不斷攀升的Oculus Quest 2一體機,在手勢追蹤識別功能上進行了一系列升級,除了早期的特定手勢操控主界面,最新解決方案甚至實現了基於手部追蹤的全文本輸入操作——即便如此,Oculus對於目前在手勢識別技術上取得的成就依然不是非常滿意。

Oculus曾表示,儘管手勢是一種有潛力的新型輸入方式,但由於計算機視覺與定位技術的局限,手勢識別技術的實際應用場景也受到限制。因此,Oculus一直在探索一些有用的技巧來幫助開發者適應手勢的局限性,甚至為了讓虛擬世界更具3D效果、更加智能地對手勢進行回應,Oculus已收購兩家虛擬實境手勢和3D技術的創業型公司 Nimble VR和13th Lab,以改善其一體機的手勢控制功能。

目前,由於涉及複雜的手指手掌結構和相關軟組織在運動時的變化,以及手和物體之間的接觸互動有著非常複雜的接觸點位和運動區域,強大的實時手部運動感知和追蹤已成為公認的一項極具挑戰性的計算機視覺任務,是科技研究領域中的大熱項目。

手部交互領域的一項新突破:ContactPose數據集

就在今年,美國三大理工學院之一的喬治亞理工學院,其機器學習中心更新了有關手部追蹤模型數據的新研究 -- ContactPose,一個手部抓握物體時觸點動態變化的數據集。

· ContactPose連結

https://contactpose.cc.gatech.edu/contactpose_explorer.html

ContactPose數據集通過機器學習(ML)和熱像儀捕獲記錄手部抓握不同物體時的每個3D關鍵觸點的變化,精準縮小手勢追蹤軌跡的總體性偏差。

ContactPose利用熱像儀將被抓握的受作用物體進行熱圖像紋理網格化,極大程度的減少外部設備幹擾,可以支持實現更加敏感精準的手勢交互追蹤,對於未來開發虛擬實境人機互動建模技術至關重要,該論文研究已被ECCV 2020 (2020年歐洲計算機視覺國際會議)收錄。

這篇文章中,VR陀螺將從覆蓋研究組、技術突破點和應用領域三大方面,為行業內感興趣的相關人士深度解析這項科研成果。

1. 研究組:基本覆蓋相關變化指數

ContactPose的論文研究中,設置的研究組變量覆蓋範圍很廣,這意味著ContactPose全面精準的包括了不同人群、不同物體、不同手部運動軌跡的數據集合。

總結其主要研究者Samarth Brahmbhatt等人的研究組數如下:

ContactPose在採集手部追蹤數據時,邀請了50名實驗者參與對25種不同物品的抓握,包括望遠鏡、相機、手電筒、眼鏡、刀具、紅酒杯、牙膏等基本生活用品,通過抓握和移交主體物品的兩大手部運動意圖,共採集了2306組手部運動觸點數據,其研究的主體參量非常豐富,可以實現用戶生活中手部追蹤觸覺點的變化數據採集。

ContactPose數據集的呈現包括高解析度的觸點視圖、3D關節追蹤和多視圖RGB-D手部抓握動態視頻,並且區分左右手,左手為綠色,右手為紅色,通過明晰的顏色區分,能夠追蹤更複雜的雙手運動。

2. 研究突破點:防幹擾熱像儀可追蹤到手部具體3D關節

手部追蹤的人機互動領域作為亟需突破的領域之一,近年來有很多代表性的手勢交互技術更新。在手勢追蹤數據採集上,大部分研究都通過觸覺手套或其他設備捕捉手部運動數據,這意味著有的時候這些外部設備會影響手部運動的靈活性和主體自發性。

但喬治亞理工學院Samarth Brahmbhatt研究小組其最大突破為,用熱像儀把被抓握的受作用物體的表面紋理網格化,通過C相機記錄觀察手部抓握物體時每一幀RGB-D成像圖的變化,ContactPose不僅減少外部設備和環境限制的幹擾,更通過高幀密集觀察實現了敏感精準的手勢交互追蹤。

ContactPose利用機器學習的大原理來進行手勢運動感知,但因引入熱像儀追蹤技術,其可根據一幀圖像推斷出單手的21個3D立體關節點,支持高準確性的手勢和五指關節追蹤。換言之,其他很多手勢交互的研究是不能進行具體手指關節追蹤的,即只能體現整體手部運動但卻不知道是具體哪個手指尖先觸碰了物品。但ContactPose卻可以精準定位到具體手指部位、手部運動時的先後順序。

並且根據數據分析對比,ContactPose在資料庫規模、手部物體觸點追蹤、手勢和物體運動變化觸點等方面十分突出。

其實ContactPose並不是Samarth Brahmbhatt研究小組在這一領域的處女作,早在2019年,喬治亞理工學院發布了只包括觸點分布圖和RGB-D成像圖的ContactDB數據集研究。而相比之下,ContactPose是一次全面升級。

通過交叉對比,ContactPose無疑是手勢交互數據的一次重要突破。不僅為日後的手部人機互動設備研發提供了數據基石,更通過數據的剖析揭示了手勢和主體事物接觸點的變化關係,為建立手勢運動觸點模型提供了體系結構算法參考。

ContactPose應用前景:

助力高精度級別手勢識別,或許可取代手柄操控

在2019年的第 6 屆Oculus Connect大會上,扎克伯格表示了進軍手勢交互領域的心,想要實現一個用戶不用拿著手柄、也沒有按鈕、沒有腕帶,甚至沒有其它傳感器的自由交互的虛擬實境沉浸世界。

目前,由於沒有高精度級別的手勢識別交互系統支持,手柄控制器長期以來就相當於用戶在虛擬世界中的雙手,無論是 Oculus 還是 HTC Vive 的 VR 頭盔,都需要藉助獨立的手柄控制器來實現手部運動追蹤。

但手柄控制器的存在卻一直局限著用戶在虛擬實境中的交互真實性。比如說當用戶要在遊戲中拿起一個物體,只能將手柄靠近並按鍵,這顯然破壞了虛擬世界沉浸交互的整體性,不夠真實。

然而,隨著更多的類似於ContactPose這種手勢數據規模化的支持,未來實現從真正的3D用戶界面,到虛擬對象操作,再到移動機制,以手部為中心的虛擬實境產品設計理念是存在可能的。手勢控制可以自由的取代語音或者手柄控制,亦是成為未來虛擬實境的大方向。

介於ContactPose在很大程度上可以為實現無接觸手勢運動追蹤和操控機器界面的技術提供了數據化支持,未來通過實時採集用戶手勢,將手勢的運動軌跡轉換為虛擬實境中的指令,可以實現自然、高效的人機互動,讓用戶完全的沉浸在一個新的可以自由運動的虛擬世界。

但通俗的談及到手勢交互應用的落地場景,現有的手勢交互技術與完全自然、高效的交互,仍然存在一定距離。

手勢交互應用的難點主要在於難以形成一致的手部操作方式,加上其屬於非精確性指令操作,其應用範圍會受交互設備、識別方法、用戶熟練程度等多個因素影響。由於不同用戶對不同產品使用手勢交互時,其手部運動軌跡也大相逕庭,所以用戶可能需要預先訓練一段時間去掌握相關設備或者系統,一定程度上是用戶要滿足機器的模版識別度。但ContactPose包括著不同人群抓握不同物體時的數據集,這意味著,日後隨著數據採集的規模化,機器可以開始輕鬆識別不同的手勢運動軌跡,從而實現機器識別的個性化、靈活性。

未來手勢交互將成為新一代「觸屏」

縱觀Oculus或者HoloLens這些行業領頭羊的設備,在用戶使用時,很多時候由於對手勢識別的不敏感或者錯誤偏差,使得用戶不得不依賴於手柄操作和語音控制來完成對虛擬實境設備界面的指令,手勢交互的人機操控方式在技術上顯然不夠成熟,尚且還處在行業早期階段。

但根據對ContactPose等相關數據集的研究分析,VR陀螺在此認為,隨著日後手部運動追蹤資料庫的大規模完善,手勢交互會像之前的觸屏手機一樣,成為新一代XR領域的主導人機互動方式,讓用戶無縫的在虛擬與現實世界中切換。

相關焦點

  • Handpose:快速、精確的手勢識別
    Handpose 是微軟研究院的一項發明,其目的是讓計算機精確地識別手勢動作。這並非什麼全新的發明,但是,Handpose 的速度更快,感應距離更遠。它不僅可以用於現有硬體,將來也能夠用到手機上面。
  • 手勢交互方案、算法場景全解析
    由於此處討論的用於手勢的神經網絡與普通的圖的神經網絡並無本質差異,而神經網絡的科普文章已經很多,這裡就不做科普了,我們僅挑幾個有代表性的網絡結構介紹一下:DeepPrior:網絡結構大體如下圖,通過初始網絡得到粗略的 pose,再用 refine 網絡不斷優化, 並且在最後的全連接層前加了一個低維嵌入,迫使網絡學習把特徵空間壓縮到更低維度
  • 手勢交互成大勢,如何進行用戶體驗設計?
    那麼,面對新興的手勢交互,我們要如何進行用戶體驗設計呢?自然的手勢交互手勢本身是一種很自然的交互方式,畢竟小孩子在還不會說話也不會使用工具時,就已經可以靠本能去做出抓取的動作。充分融入使用場景,是讓手勢交互更加自然方法之一。
  • 歡迎來到5G XR 時代未來城市:XRSPACE今日正式亮相!
    從外型來看,XRSPACE MANOVA VR一體機設計輕巧便攜,無線纜束縛,能實現隨時隨地暢玩;從配置來看,其內置高通驍龍845移動平臺為性能做支撐,頭顯搭配深度攝像頭支持6DoF空間定位及手勢識別,同時可搭配6DoF手柄使用,兼顧多種交互方式;內存6GB;單眼解析度1440*1440,DPI為702,刷新頻率90Hz,呈現出更清晰絲滑的視覺效果。
  • 應用於VR/AR的主流光學手勢識別技術解析
    可以想見,Pebbles Interfaces和去年的Nimble VR一道,將繼續增強Oculus在手勢控制方面的優勢,在未來將手勢VR控制、AR互動整合在產品中,其重要性不言而喻。這裡翻出原來寫的光學手勢識別技術文章,再給大家介紹一下主流技術。
  • 新設備可直接讀取手勢
    新設備結合了可穿戴生物傳感器和人工智慧軟體,可根據前臂的電信號模式識別用戶手勢。不用鍵盤在電腦上錄入字符?不用手柄玩電子遊戲?或者不用方向盤駕駛汽車?這些場景可能會在不久的將來一一實現。當地時間12月21日,美國加州大學伯克利分校(UCB)的研究人員在《自然電子學》雜誌發表論文稱,他們開發了一種結合可穿戴生物傳感器與人工智慧系統的新設備,它可根據檢測到的前臂電信號來識別手勢。研究人員表示,這種智能設備有望用於控制假肢,甚至與幾乎任何類型的電子設備交互。
  • UNI-K全新車機設計語言,樹中國品牌智能交互新標杆
    當步入智能時代HMI(人機互動系統)不斷實現突破時,長安汽車的工程師們希望回到產品設計的原點,歸零思考,以人因工程的理論和方法對HMI進行徹底重構,從信息載體的布局,到信息分布、流動的邏輯、再到元素、符號的運用,圍繞用戶日常用車場景打造極致安全高效的交互體驗
  • 清華大學領銜,99 頁報告揭秘人機互動的發展狀況及未來發展趨勢 |...
    不可否認,人工智慧正在變得越來越「聰明」,也越來越貼近人類,未來它會是什麼樣子呢?近日,清華由清華大學人工智慧研究院、北京智源人工智慧研究院和清華-中國工程知識智能聯合研究中心發布了《人工智慧之人機互動》報告(以下簡稱《報告》),《報告》梳理了其概念定義和發展歷程,重點研究了主要技術的發展情況、領域專家現狀和應用領域,並探討了人機互動未來發展趨勢。
  • 凌感uSens與詮視科技戰略合作,加速VR/AR設備的手勢識別技術落地
    凌感科技專攻手勢識別/骨骼識別以及6DoF Slam技術、物體識別等。而詮視科技的優勢在於視覺模組和頭顯頭顯設計並且已應用於諸多VR/AR設備上。因此雙方合作後,未來採用了詮視模組的VR/AR頭顯能夠在不增加任何傳感器的前提下具有高精度手識別能力,實現自然、高效的交互體驗。
  • 聊聊那些有趣的互動設計
    之後,又經歷了二十多年的技術革新和再設計,以當年滑鼠原型的新滑鼠,終於隨著 Mac 以及 Windows 的普及走向了大眾,成為 PC 不可缺少的組成部分。值得一提的是,當年的酷玩意軌跡球,在製圖領域中一直被使用,此外經過改造後廣泛地應用在了在大名鼎鼎的黑莓手機中,也收到不少人的追捧。想一想你當年學電腦時,用了多久開始會用鍵盤,而用了多久就能夠使用滑鼠。
  • 手勢操控——用科技定義豪車,寶馬的小心機
    演示視頻:http://v.youku.com/v_show/id_XMTUxNTk0NTIyNA==.html  「預測未來,不如創造未來」,全新BMW7系推出以來,多處創新設計很是吸睛,在民用汽車中引入未來感十足的新技術,看得出寶馬是在用心地「創造未來」,也在將操控性出色的優良傳統繼承下去。
  • 手勢遊戲《Hand Physics Lab》更新,VR中甚至還能掰腕子
    此前,青亭網曾報導過一款集成近10種手勢交互內容的VR手勢識別應用《Hand Physics Lab》,這是一款探索Quest手勢識別應用場景和效果的作品,目前並未在官方商店上線,只能在SideQuest第三方商店下載。
  • 數字科技產業助力 中國美術館文創數位化再添新亮點
    數字科技產業助力 中國美術館文創數位化再添新亮點 2018-04-28 11:18:05來源:中國新聞網作者:${中新記者姓名}責任編輯:史建磊
  • 百度景鯤:小度在家智能屏X8三要素,定義智能屏語音交互新物種
    作為小度家族的新成員,小度在家智能屏X8配備8英寸超大智能屏,擁有遠場語音交互、人臉識別、手勢控制、眼神喚醒在內的多模態人工智慧黑科技,更有「童臉識別」精緻兒童模式提供五重呵護,為孩子的成長一路護航,讓智能音箱再升級。發布會現場,景鯤正式展示了潮流科技範兒的小度在家智能屏X8。在硬體層面,小度在家智能屏X8纖薄有力、簡約優美,無縫融入家居環境。
  • 支持安卓數百萬App,光感科技發布多任務XR作業系統feelarOS
    該作業系統可以安裝在任何安卓手機上運行,並能夠將手機App以「超大懸浮屏」的形態開啟在智能眼鏡的3D空間中,實現「騰空點擊交互」。更重要的是,在智能眼鏡中呈現的App全都支持虛擬觸控等多種交互方式,用戶可以用手柄或手指「騰空」觸控安卓App的圖形界面完成交互。通過AR和VR眼鏡,能讓App實現大視場角顯示,高效多任務交互,從而讓用戶擺脫手機小屏幕的束縛。
  • 手柄可以扔了?適用於AR的觸覺力回饋解決方案誕生
    該演示是通過一種輕量級電肌肉刺激設備(簡稱:EMS)來完成的,其原理是通過為手臂肌肉提供較低的電流,從而讓處於雙手免提狀態的AR頭顯用戶在與虛擬物體交互時也能體驗到強制反饋,在接觸到物理對象時也能感受到額外的力量。
  • 21Face互動智慧屏全球首發 雲米實現全場景跨屏交互
    隨著5G和智能設備的蓬勃發展,家居生活越來越智能化,那未來的家將會是什麼樣?5月19日,雲米科技在線上召開了"互聯未來·互動家"為主題的雲米5G IoT戰略發布暨2020新品發布會,帶來全球首臺5G客廳智慧大屏——"21Face互動智慧屏",徹底顛覆了傳統客廳大屏,並實現5G時代下未來家全場景跨屏交互體驗。
  • 虛實交互零時差,Yahoo TV結合5G打造XR次世代娛樂
    高速率低延遲,Live即時呈現異地應用過去因受限於帶寬和硬體限制,虛擬展演要做到Live即時是一大挑戰,播放畫質和交互體驗也較難突破。現場兩位表演者分別位於兩個不同地點,通過5G即時進行「類同臺」演出,讓歌手與樂手跨時空同臺,畫面無接縫感也更逼真,將真實表演者放在虛擬空間,還可做出各種有趣的特效和運鏡。Yahoo TV總製作耿暄提到,異地同臺還有很多細節需要處理,像是如果兩地光影不同,「同臺」時會使畫面接合有違和感、不夠逼真,還有交互之間的延遲也必須細膩到感覺不出差異。
  • 飛智科技聯手騰訊心悅打造風頭正盛的八爪魚2手柄,滿足玩家各種期待!
    而飛智與騰訊心悅的連接由來已久,自誕生以來,雙方與遊戲玩家緊密聯繫,為遊戲玩家不斷創造新的玩法、新的技術。不論是心悅助力玩家遊戲成長,感受遊戲帶來的快樂的理念,還是飛智為玩家提供極致的遊戲體驗以及連接玩家和遊戲世界的信念,都是來自其一直以來與玩家密不可分的關係。
  • 愛奇藝奇遇VR發布CV頭手6DoF交互技術 同時啟動「哥倫布計劃」
    1月6日,愛奇藝奇遇VR在京召開主題為"誰與爭鋒"的VR技術發布會,正式發布國內首個CV(計算機視覺技術)頭手6DoF VR交互技術——追光,並面向全球VR遊戲開發者啟動"哥倫布計劃"。愛奇藝智能CEO熊文表示,"面向未來,我們將繼續加大自主技術創新力度,並在內容生態方面持續投入,為讓中國VR技術引領下一代計算平臺貢獻自身的力量。"CV頭手6DoF VR交互技術方案——追光人機互動是影響VR產品體驗的關鍵因素。