殺雞焉用牛刀?3D手勢識別不是VR交互的唯一選擇

2021-01-11 中關村在線

自人類發明了工具以來,與工具之間就需要通過一種方式建立起聯繫,用手握住工具的把手就是聯繫的一種。進入電子科技時代,交互的重要性愈加凸顯,就好像遙控器之於空調、鍵盤滑鼠之於電腦、遊戲手柄之於電視遊戲等等,缺少了一個簡單有效的交互,工具對於人類也就失去了意義。

隨著虛擬實境的崛起,如何尋找到合適的交互技術也成為了從業者們研究的重中之重。

一、我們為什麼需要為VR需要找一個新的交互形式?

與其他科技產品不同,VR體驗強調的是沉浸感,而沉浸感的來源又是與外界的隔絕而造就的,尤其是視覺和聽覺的隔絕,使得大腦被欺騙,產生脫離於現實世界的虛擬沉浸感。這就產生了新的問題:看不見自己的身體,尤其是人類交互感知最重要的手和運動最重要的腳,無法與虛擬環境產生交互,在虛擬的世界裡變成了一個看客。

在虛擬實境興起之初,用戶在新鮮感爆棚的情況下,追求的重點在VR是否能夠營造出沉浸感十足的情境,對於交互的需求相對並沒有那麼強烈。人類的主觀能動性作祟,於是希望去操縱、控制虛擬世界,以尋找到更多的存在感。隨著行業的不斷發展,VR對於用戶新鮮感的下降,用戶開始將尋找虛擬世界存在感的需求放在了首位,開始追求更深層次的沉浸,希望與虛擬實境世界產生互動。

非常不湊巧的是,大廠優先追求的是輸出設備的高技術含量,在頭顯這一塊投入的技術與精力更多。在交互這一塊的研發相對滯後,就導致了交互手段缺失情況的出現,比如Oculus Rift只能選擇XBox手柄湊數。

通過傳統電子設備的交互方式,比如手柄一類的產品,暫時解決交互了的問題,卻又使得用戶從虛擬世界中被帶出,沉浸感大打折扣。舉個例子,成熟度相對較高的三星Gear VR頭顯在視覺方面的體驗不錯,但操控方式是配置於頭顯右側的觸摸板,這意味著用戶需要時刻舉起右手來操作,這無形中就破壞了沉浸感受。

在二維屏幕交互中,幾乎所有控制命令都可以抽象為按鍵動作。但在虛擬實境中,用戶希望自然交互,也就是人類在現實世界裡怎麼跟外界交互,在虛擬世界裡我們也希望按照同樣的方式交互,沉浸感更高,效率高,學習成本低。

於是,尋找一種全新的、合適的虛擬實境交互形式就成為了一件非常有必要的事情。

二、為什麼手部動作識別在已知的交互形式中最受歡迎?

到目前為止,VR領域目前還沒有一個成熟的具有普適性的操控交互手段。小編大概列舉了目前業界理論上比較主張的幾種交互形式:用「眼球追蹤」實現交互、用「動作捕捉」實現交互、用「肌電模擬」實現交互、用「觸覺反饋」實現交互、用「語音」實現交互、用「手勢跟蹤」實現交互、用「傳感器」實現交互等等。

這些交互形式到目前為止,雖然各自有各自的優點,但也都存在一定的缺陷。比如眼球追蹤,儘管眾多公司都在研究眼球追蹤技術,但幾乎沒有一家的解決方案令人滿意,都無法提供精準和實時的反饋。或如動作捕捉,市面上的動作捕捉設備只會在特定超重度的場景中使用,而且需要用戶花費比較長的時間穿戴和校準才能夠使用,而且這種方式的一大痛點是沒有反饋,用戶很難感覺到自己的操作是有效的。

又如觸覺反饋,它無法適應更加廣泛的應用場景,雖然目前三大VR頭顯廠商Oculus、索尼、HTC Vive都不約而同的採用了虛擬實境手柄作為標準的交互模式,但這只是針對一些高度特化的遊戲類應用或輕度的消費應用,不過是商家退而求其次的一種妥協策略,因為VR頭顯的早期消費者基本是遊戲玩家。再比如語音交互,首先機器對於人類語言的理解就是一大問題,簡單的語音還好,複雜的就不行了,而理解之後機器對指令能否準確執行又是一大問題。

對於人類來說,最自然最有效的的交互方式有兩個當屬動作莫屬了,因為即便語言不通,你仍然可以通過動作的比劃與他人進行溝通。放在VR裡面來說,肢體和手勢動作可以用於大部分交互場景,尤其是輕度交互的固定場景還是對於重度交互的移動場景,手勢的優勢都非常突出。

於是,手部動作識別在已知的交互形式中成為最受歡迎形式。

三、手部動作識別是不是只有3D手勢識別嗎?

說起手部動作識別,大家耳熟能詳的應該就是Leap Motion這家公司了。但實際上,手部動作識別的解決方案並不是只有Leap Motion一家公司有,技術原理上也並不是只有這一個方向。只不過因為Oculus的對Leap Motion的大力支持,伴隨著Oculus Rift的高曝光率,使得Leap Motion的3D手勢識別被公眾所熟知。

3D手勢識別並不是VR交互領域手部動作識別方案的唯一,其實可以分為二維手型識別、二維手勢識別、三維手勢識別三種。

二維手型識別

二維手型識別,也可稱為靜態二維手勢識別,識別的是手勢中最簡單的一類。這種技術在獲取二維信息輸入之後,可以識別幾個靜態的手勢,比如握拳或者五指張開。其代表公司是一年前被Google收購的Flutter。在使用了他家的軟體之後,用戶可以用幾個手型來控制播放器。

「靜態」是這種二維手勢識別技術的重要特徵,這種技術只能識別手勢的「狀態」,而不能感知手勢的「持續變化」。舉個例子來說,如果將這種技術用在猜拳上的話,它可以識別出石頭、剪刀和布的手勢狀態。但是對除此之外的手勢,它就一無所知了。所以這種技術說到底是一種模式匹配技術,通過計算機視覺算法分析圖像,和預設的圖像模式進行比對,從而理解這種手勢的含義。

這種技術的不足之處顯而易見:只可以識別預設好的狀態,拓展性差,控制感很弱,用戶只能實現最基礎的人機互動功能。

二維手勢識別

二維手勢識別,比起二維手型識別來說稍難一些,但仍然基本不含深度信息,停留在二維的層面上。這種技術不僅可以識別手型,還可以識別一些簡單的二維手勢動作,比如對著攝像頭揮揮手。其代表公司是來自以色列的PointGrab,EyeSight和ExtremeReality。

二維手勢識別擁有了動態的特徵,可以追蹤手勢的運動,進而識別將手勢和手部運動結合在一起的複雜動作。這樣一來,我們就把手勢識別的範圍真正拓展到二維平面了。我們不僅可以通過手勢來控制計算機播放/暫停,我們還可以實現前進/後退/向上翻頁/向下滾動這些需求二維坐標變更信息的複雜操作了。

這種技術雖然在硬體要求上和二維手型識別並無區別,但是得益於更加先進的計算機視覺算法,可以獲得更加豐富的人機互動內容。在使用體驗上也提高了一個檔次,從純粹的狀態控制,變成了比較豐富的平面控制。

三維手勢識別

三維手勢識別需要的輸入是包含有深度的信息,可以識別各種手型、手勢和動作。相比於前兩種二維手勢識別技術,三維手勢識別不能再只使用單個普通攝像頭,因為單個普通攝像頭無法提供深度信息。要得到深度信息需要特別的硬體,目前世界上主要有3種硬體實現方式,加上新的先進的計算機視覺軟體算法就可以實現三維手勢識別了。

1. 結構光(Structure Light)

結構光的代表應用產品就是PrimeSense的Kinect一代了。

這種技術的基本原理是,加載一個雷射投射器,在雷射投射器外面放一個刻有特定圖樣的光柵,雷射通過光柵進行投射成像時會發生折射,從而使得雷射最終在物體表面上的落點產生位移。

當物體距離雷射投射器比較近的時候,折射而產生的位移就較小;當物體距離較遠時,折射而產生的位移也就會相應的變大。這時使用一個攝像頭來檢測採集投射到物體表面上的圖樣,通過圖樣的位移變化,就能用算法計算出物體的位置和深度信息,進而復原整個三維空間。

以Kinect一代的結構光技術來說,因為依賴於雷射折射後產生的落點位移,所以在太近的距離上,折射導致的位移尚不明顯,使用該技術就不能太精確的計算出深度信息,所以1米到4米是其最佳應用範圍。

2. 光飛時間(Time of Flight)

光飛時間是SoftKinetic公司所採用的技術,該公司為Intel提供帶手勢識別功能的三維攝像頭。同時,這一硬體技術也是微軟新一代Kinect所使用的。

這種技術的基本原理是加載一個發光元件,發光元件發出的光子在碰到物體表面後會反射回來。使用一個特別的CMOS傳感器來捕捉這些由發光元件發出、又從物體表面反射回來的光子,就能得到光子的飛行時間。根據光子飛行時間進而可以推算出光子飛行的距離,也就得到了物體的深度信息。就計算上而言,光飛時間是三維手勢識別中最簡單的,不需要任何計算機視覺方面的計算。

3. 多角成像(Multi-camera)

多角成像這一技術的代表產品是Leap Motion公司的同名產品和Usens公司的Fingo。

這種技術的基本原理是使用兩個或者兩個以上的攝像頭同時攝取圖像,就好像是人類用雙眼、昆蟲用多目複眼來觀察世界,通過比對這些不同攝像頭在同一時刻獲得的圖像的差別,使用算法來計算深度信息,從而多角三維成像。

在這裡我們以兩個攝像頭成像來簡單解釋一下:

雙攝像頭測距是根據幾何原理來計算深度信息的。使用兩臺攝像機對當前環境進行拍攝,得到兩幅針對同一環境的不同視角照片,實際上就是模擬了人眼工作的原理。因為兩臺攝像機的各項參數以及它們之間相對位置的關係是已知的,只要找出相同物體(楓葉)在不同畫面中的位置,我們就能通過算法計算出這個物體(楓葉)距離攝像頭的深度了。

多角成像是三維手勢識別技術中硬體要求最低,但同時是最難實現的。多角成像不需要任何額外的特殊設備,完全依賴於計算機視覺算法來匹配兩張圖片裡的相同目標。相比於結構光或者光飛時間這兩種技術成本高、功耗大的缺點,多角成像能提供「價廉物美」的三維手勢識別效果。

四、殺雞不用牛刀,VR中的交互到底應該如何抉擇?

輕度交互

移動端VR設備一般無法運行重度體驗的VR內容,對於交互的需求基本保留在輕量級別。3D的手勢識別用在輕度VR交互上實際有點殺雞用牛刀的感覺,絕大部分人日常接觸最多的就是2D觸控螢幕,而大部分UI也是2D設計,3D手勢識別加入的深度信息對於大部分人來說太超前,而且大部分人臂展不超過1米,深度信息在這裡沒法體現出相對2D平面的不同。

所以,一個普通單攝像頭通過邊緣識別的簡單手勢交互系統能滿足目前大部分VR場景的交互需求,降低手勢交互的門檻,從而快速普及手勢交互概念,如果還能夠配合語音交互功能,就能快速滿足短期內VR應用的交互需求。

重度交互

PC端VR設備,成本高技術含量高,能夠運行重度體驗的VR內容,因而對於交互的需求也是重量級別。3D的手勢識別用在重度VR交互上才是真正的好鋼用到了刀刃上,能夠滿足用戶的重度交互需求,還能夠提供較好的反饋和沉浸感。用戶置身的三維場景中,要跟三維場景裡面的物品進行交互,沒有深度信息是不可能做到的。

現在Oculus和HTC Vive其實都採用的是手柄的解決方案,但是3D的手勢交互其實是一種更自然、更舒服的方式。對於複雜的3D場景,3D的手勢交互是不可缺少的,而且更加真實和沉浸式的3D場景體驗,才是VR內容的未來。而在重度VR體驗內容中,空間的深度信息更為複雜,應用場景的變化也更加多樣化,只有3D的手勢識別能夠較好的滿足精度、延遲和沉浸的要求。

至於未來如何發展,歷史總是由人民書寫的,消費者的選擇才是技術方向的選擇。

 

http://news.zol.com.cn/599/5997487.html news.zol.com.cn true 中關村在線 http://news.zol.com.cn/599/5997487.html report 8665 自人類發明了工具以來,與工具之間就需要通過一種方式建立起聯繫,用手握住工具的把手就是聯繫的一種。進入電子科技時代,交互的重要性愈加凸顯,就好像遙控器之於空調、鍵盤滑鼠之於電腦、遊戲手柄之於電視遊戲等等,缺少了一個簡單有效的交互,工具對於人類也就失去了...

相關焦點

  • 《十二大戰》第三集不是什麼殺雞焉用牛刀,而是殺雞儆猴!
    大家好,十月新番《十二大戰》——又名《一集死一人大戰》,已更新至第三集,大標題就寫著什麼「殺雞焉用牛刀」,害的小編全程都以為死的一定是酉雞(誰叫你陰了二哈,有句話叫做,出來混,吃棗藥丸),可是沒想到兇手居然還真是醜牛,難道日本方面在用中國語的時候都這麼不矜持,結合第三集故事情節,竊以為,題目應該改為
  • 牛刀也殺雞,3M投影機新品高端技術低端呈現
    主流品牌低價位機型的上市,滿足了低端用戶的採購需求,而在價格不斷下調的同時,產品易用性、外觀設計、規格參數等仍然是所有投影機生產廠商格外重視的要素,一款嶄新的產品只有好用,才能最終得到消費者的認可和追捧。3M公司近日推出新品SCP715/720系列,就是在保證各方面規格參數達到高端標準的同時,又以低端超值價格呈現的好用產品。
  • vr又稱靈境技術,是模擬虛擬環境中角色的真實表現
    vr在虛擬環境中構建交互虛擬世界,運用真實的人機互動手段,創造和構建具有真實感和臨場感的虛擬世界。vr裝置類產品目前主要涉及電商,醫療健康,新零售,廣告,旅遊,房產等行業領域。通過vr設備獲取用戶的真實信息,並通過ar立體化技術將用戶的信息3d化,再根據需要列印成vr產品,產品可擺放在用戶面前就可以直接觀看和使用,用戶可根據需要進行身體和頭部的轉動和旋轉,且隨時可以攜帶。主要用戶可以在遊戲中打怪,聽音樂,與虛擬世界中的人進行交互,獲取虛擬世界的信息反饋等等。通過「vr+ar」這一創新營銷模式,可以實現消費者體驗到ar應用的內容,ar應用可使消費者感受到真實的虛擬的感覺。
  • 最新戰機赴敘 俄為何「殺雞用牛刀」?
    【「殺雞用牛刀」 俄方多重考慮】  俄羅斯派出大名鼎鼎的蘇—35S戰機到敘利亞參與反恐行動,無論是執行空襲,還是只是在戰地進行飛行測試,都可謂「殺雞用牛刀」。上海外國語大學國際關係與公共事務學院特約研究員馬堯認為,俄方有多重考慮。
  • 凌感手勢追蹤算法與詮視視覺模組結合,加速手勢識別在VR/AR中的應用
    因此雙方合作後,未來採用了詮視模組的VR/AR頭顯能夠在不增加任何傳感器的前提下具有高精度手識別能力,實現自然、高效的交互體驗。 凌感手勢追蹤算法與詮視視覺模組結合 如今VR、AR在全球興起,初創公司爭相湧入市場,相比很多廠商選擇從VR/AR硬體整機入局,凌感和詮視反而都選擇了各自的垂直賽道,而這兩條賽道也在時代的大潮下出現了必然的交集。
  • 簡單解讀VR/AR主流光學手勢識別技術
    二維只是一個平面空間,我們可以用(X坐標,Y坐標)組成的坐標信息來表示一個物體在二維空間中的坐標位置,就像是一幅畫出現在一面牆上的位置。三維則在此基礎上增加了「深度」(Z坐標)的信息,這是二維所不包含的。這裡的「深度」並不是咱們現實生活中所說的那個深度,這個「深度」表達的是「縱深」,理解為相對於眼睛的「遠度」也許更加貼切。就像是魚缸中的金魚,它可以在你面前上下左右的遊動,也可能離你更遠或者更近。
  • 體感交互的極致——用 Wi-Fi 識別手勢
    除了紅外線和攝像頭,就不能來點更新的手勢識別技術嗎?!那麼,用 WiFi 信號來識別手勢怎麼樣?華盛頓大學的幾名技術宅不僅這麼想了,而且還做出來了。據 Hackaday 報導, 近日美國華盛頓大學的 4 名研發人員向公眾展示了一項名為 WiSee  技術,這項技術通過家中的 Wi-Fi 信號來感知使用者的手勢,以此來控制家中的電子設備。
  • 基於電場感應原理的3D手勢識別技術,你會玩嗎?
    因此,其他一些非光學的3D手勢識別技術就成為人們的重要選項。其中比較有代表性的,要數Microchip公司的GestIC技術。今天我們就來看看如何才能玩轉基於電場感應原理的3D手勢識別技術?   人機互動可以算是對電子產品的用戶體驗影響最直接的一個技術。當年蘋果藉由電容觸控屏,將鍵盤、滑鼠、軌跡球等一眾技術拉下馬的景象,相信很多人還記憶猶新。
  • 3D手勢識別背後的技術
    現在,人機互動技術已邁上了更高的臺階,進入了手勢識別時代,不過這也並不是一帆風順的。手勢識別現已在娛樂及遊戲市場出現,然而這種技術將對我們的日常生活產生怎樣的影響呢?不妨假想一下,有人坐在沙發上,只需一揮手就能操控燈光和電視,或者汽車自動檢測附近是否有行人。隨著手勢識別技術支持人機互動的不斷深入發展,這些及其它功能將很快得以實現。
  • 移動VR將愈成熟!一公司推出1mm精度超聲波ToF手勢識別
    【PConline 資訊】手勢識別並不是一個新概念,但一直以來手勢識別的精度並不是很高。它們表示,「在追求儘可能自然的控制和交互上,我們已經開發了觸控螢幕、語音識別和運動追蹤,下一次用戶體驗革命將基於聲音。」或許有許多人已經了解過類似的基於光和攝像頭的系統,但Chirp的聯合創始人兼執行總監Michelle Kiang表示,這些解決方案在準確度不能媲美超聲波,而且功率消耗更大。她說:「基於紅外線或攝像頭的解決方案,在功率上可以消耗幾十毫瓦。但藉助超聲波,我們只需幾十微瓦。
  • 手勢交互新突破!ContactPose或助力未來XR再無手柄?
    最近熱度不斷攀升的Oculus Quest 2一體機,在手勢追蹤識別功能上進行了一系列升級,除了早期的特定手勢操控主界面,最新解決方案甚至實現了基於手部追蹤的全文本輸入操作——即便如此,Oculus對於目前在手勢識別技術上取得的成就依然不是非常滿意。
  • 把VR 控制器變成魔法棒,AirSig 讓玩家定義交互姿勢
    為代表的手勢識別。除了 PPT 提到的廠家外,當天在 Vive Focus 體驗區,雷鋒網還發現了其他有意思的交互玩法。在一款 VR Demo 中,雷鋒網(公眾號:雷鋒網)編輯通過控制器比劃出閃電的手勢,即可「一招制敵「;比劃愛心的手勢,馬上恢復「滿血」狀態。 在多數 VR 內容中,我們常常會通過按動控制器的按鍵,選擇觸發相應的功能,該體驗則是根據一定的手部姿勢實現。
  • 手勢識別比賽奪冠,阿爾法蛋大蛋2.0的技術太強!
    任意的中英紙質讀物放在TA面前,用手指一指紙上的字、詞,中文的有筆順筆畫、部首結構、釋義組詞,英文的則有音標、詞性詞義、例句和發音評測等。其實,阿爾法蛋大蛋2.0的指讀功能的實現集合了許多種技術,其中有一項關鍵技術叫做手勢識別——在科大訊飛的手勢識別技術基礎上,淘雲科技針對兒童使用的場景進行了深度優化,才能讓大蛋2.0「看到」孩子手指的內容、幫助孩子學習字詞、課文等。
  • 深視科技發布無穿戴體感交互解決方案 呈現VR時代全新交互體驗
    這種解決方案無需穿戴或手持設備,即可通過三維計算機視覺從場景中識別出人、以及人體的姿態和手勢。在識別過程中,系統會將用戶的姿態手勢信息通過API傳遞給上層應用,用戶可通過最自然、最直接的方式與內容進行交互。這種體感技術在真實與虛擬之間架設了一座便捷的橋梁,可有效提升沉浸式交互體驗。
  • 語音識別的痛點在哪,從交互到精準識別如何做? | 雷鋒網公開課
    今天的分享,我們一起探討如何解決這些問題,不管是通過算法,還是工程,抑或產品,都是我們可以選擇的途徑。大家首先要有個共識,人機互動目前所面臨的問題,不是一朝一夕,一蹴而就能解決的,需要在各個方向在核心技術上不斷進步。科大訊飛AIUI是怎麼做的?
  • 3d全景是什麼意思?3d全景圖怎麼做的
    3d全景便是如此,它的出現給我們帶來很多以往圖文視頻所不能達到的體驗。3d全景是什麼呢意思?3d全景圖又被很多人稱為三維全景和vr全景,實際上是一種新的展現方式,不同以往的是能夠給人帶來很好的沉浸感,對所展現的空間有一種仿佛身臨其境般的體驗。實際上目前3d全景都是由相機實景拍攝而來的,雖然也有完全使用虛擬技術來搭建完成的,但成本以及效率都要低於前者。
  • 3D-Group巨型3D印表機「猛獁」:可同時列印多個材料
    在3D界來說,大型的3D印表機常常伴隨著「殺雞焉用牛刀」的批評聲音。澳大利亞召開的3D列印巡展上,3D-Group 首次攜該公司獨有的專利技術向世人展示巨型3D印表機——猛獁(Mammoth)。
  • 「體感交互」讓你擺脫滑鼠
    但看看電腦上的滑鼠、鍵盤,以及電視遙控器上密密麻麻、80% 情況下完全用不上的按鍵,我們就能明了——即便可觸摸電容屏在手機 領域大規模流行之後,許多電子設備的人機互動仍然沒能改變。 電影《鋼鐵俠》劇照,託尼·斯塔克在 3D 桌面上調整零件、設計製造「鋼鐵俠」。
  • vr稱靈境技術,是模擬虛擬環境
    vr是以視覺、聽覺、觸覺、嗅覺等感官為依託,全方位立體地感受虛擬世界,從而達到愉悅身心、增強記憶、放鬆思考、增強娛樂和行動等目的。vr遊戲,是利用3d成像技術、計算機生成技術、傳感器技術和網絡通信技術將虛擬世界無縫轉換為現實的過程。
  • 與視覺處理晶片公司合作,聯想VR設備或支持體感交互
    Movidius是一家致力於超低能耗的視覺處理晶片公司,Movidius的Myriad 2視覺處理組件(VPU)專注於視覺圖像處理,例如頭部追蹤,手勢識別,把多個視頻整合成可交互虛擬實境視頻,而且能耗極低。