Project Tango深度解析

2021-02-25 圖漾科技

Project Tango是Google 的ATAP(Advanced Technologies and Projects)部門(來自收購的摩託羅拉,出售給聯想後仍舊保留該部門)在幾年前開發的基於VSLAM技術一種空間探測和自我定位整體方案,通過一些列傳感器的信息組合,讓集成Project Tango的設備能夠像人類一樣根據空間環境定位自我並且追蹤運動軌跡。通過Tango的技術,可以讓行動裝置不用藉助外部設備就能實現空間定位,類似微軟的Hololens。


如果你打開Project Tango的介紹視頻,第一眼看到的一個面目和藹的胖子,就是那個在2007年底把Wii玩出花的大神。07年12月John神在YouTube上傳了一系列視頻,記錄了用Wii遙控手柄追蹤人的手指,通過改裝後的Wii遙控手柄和投影儀製造出多點觸摸電子白板,還有用Wii遙控手柄追蹤人的頭部位置,與此同時,遊戲畫面也為了適應觀眾的視角而發生改變。從這幾個實驗中,我們可以看到當下Leap Motion、Oculus Rift等下一代人機互動方式的影子。之後他加入了微軟的Project Natal(該項目的成果是風靡全球的Kinect),後來跳槽到Google X,再之後加入Motorola ATAP(綽號All Things Are Possible),最終帶領團隊在2014年6月5日啟動Project Tango。

ATAP部門經過多年的潛心研究,經過了兩代原型機的不斷優化和改進,終於今年6月9日聯想在美國矽谷舉辦的第二屆全球科技創新大會(Lenovo Tech World)上發布了全球首款搭載Tango技術的AR(增強現實)智慧型手機PHAB2 Pro, Phab2 Pro是第一代可以商用的Project Tango手機,其實這也是第三代Project Tango技術,經過前面兩代的不斷優化,在設備體積、功耗、關鍵部件和軟體生態環境方面都有了重大的突破,終於在2016年和聯想一起合作發布了第一代可以商用的Project Tango設備, 同時Google也正式宣布Project Tango正式更名為Tango,同時啟用一個全新的Logo。新Logo由原來的三維坐標上的立方體變成了一個橘黃色的三維立方體,跟Google的整體新Logo風格保持了一致,而且突出了在三維空間感知的能力。


第一代Tango設備,,也就是五寸手機平臺Peanut,深度信息檢測是基於Primesense 結構光方案,通過第一代Tango設備的開發,Google基本完成了Tango Core和SDK的框架搭建,也初步驗證了Tango的整體空間感知能力,但由於採用了結構光的深度檢測信息技術,導致系統的尺寸、重量和散熱都無法做到一個真正的手機中去。


Tango的第二代產品,在Google內部叫YellowStone,是一個7寸的平板電腦,其基於NVDIA Tegra K1處理器和Mantis Vision的structured light深度檢測方案,由臺灣仁寶代工,雖然這款平板號稱上市,但卻是限量發售,並且只面向開發者,普通消費者是無法購買的。無法作為第一款商用的原因有二: 首先此款平板電腦由於採用了Tegra K1處理器和Mantis Vision的視頻處理晶片,功耗其實比第一代還要嚴重;其次由於Primesense的結構光技術被Apple收購之後,將無法繼續採用結構光的深度檢測技術方案,很明顯不適合大批量的生產。但是通過YellowStone這款開發者樣機,Google初步建立的整體的Tango生態系統,同時也開始引導開發者開始開發基於Tango的應用。


Google的第三代Tango產品,就是跟聯想一起發布的Phab2 Pro智慧型手機,Tango部分的整體構架棄用結構光,第一次採用TOF深度檢測技術,在整體的功耗、整機尺寸和Tango Core上都做了深度地優化。這款6.4英寸的平板手機擁有三顆攝像頭,包括一顆魚眼鏡頭和一顆紅外傳感器,從而實現大量的增強現實應用,產品將於9月在美國上市,售價499 美元。通過Tango的技術,這款手機可以實現類似微軟的HoloLens的AR功能。


經過這三代Tango產品的演進,2016年下半年,消費者和開發者都能購買到Phab2 Pro,並且基於Google的Tango SDK開發更多新奇的apps,屆時整個Tango的Ecosystem將會更加豐富。


Project Tango原理大探秘

看上去神乎其神的基於Tango的AR/VR應用,其實其基本核心就是三大核心技術:

運動追蹤(Motion Tracking),深度感知(Depth Perception)和區域學習(Area Learning), Google將人眼對世界的客觀感知,通過以上三個維度的拆解,利用先進的機器視覺技術和運算,將這三個維度的數據進行整合,最終體現出來就是可以讓集成Tango技術的設備能夠像人類一樣感受空間信息,並且將自身的運動趨勢定位到真實的空間中去。


運動追蹤(Motion Tracking):

Project Tango的第一個核心技術「運動追蹤」,Motion Tracking的三維動態捕捉就是利用了單目視覺技術的升級版Feature Tracking(Google稱為特徵捕捉)。這個技術是在傳統9DOF(慣性測量單元、加速度計和陀螺儀)的運動檢測基礎上,額外增加了超廣角魚眼攝像頭,通過超廣角魚眼攝像頭的視覺特徵識別補償,從而消除單純IMU運動軌跡的累計誤差。


當設備在移動的過程中,超廣角魚眼攝像頭不斷地一幀一幀進行拍攝,因為拍攝到的特徵點的相對位置在不斷變化(這裡「變化」是指拍攝到的兩幀之間同一個特徵點的相對位置變化),通過計算就可以得到超廣角魚眼攝像頭的移動距離。簡單來說Tango設備在不斷循環的一個過程就是:拍攝——識別特徵點——匹配特徵點——篩去錯誤匹配——坐標換算,通過IMU來捕捉相機的加速度和運動方向。當融合了IMU和攝像頭的數據之後Project Tango就實現了三維運動追蹤。所以Project Tango的運動追蹤功能可以理解為基於IMU技術的增強VSLAM,但這個時候是沒有深度信息的,深度信息將由後續要介紹的深度檢測單元來實現。Project Tango的運動檢測是基於單目攝像頭技術,因此對於大面積沒有特徵點的環境,比如白牆、全黑環境和玻璃,這些使用環境下都是無法正常工作的。

深度檢測(Depth Perception):

Project Tango的深度檢測方案其實是基於第三方的硬體基礎來實現,從第一代的Primesense結構光方案,到聯想Phab2 Pro所採用的TOF技術,其實都不是Google自己所特有的技術,甚至基於LeapMotion的雙目攝像頭方案,理論上來說也能實現深度距離的檢測。


在介紹Project Tango的深度檢測之前,我們先大致介紹下目前主流的3種不同的深度檢測方案:

1. 結構光方案:代表Primesense,已經被Apple收購,是通過發射特定圖形的散斑或者點陣的雷射紅外圖案,當被測物體反射這些圖案,通過攝像頭捕捉到這些反射回來的圖案,計算上面散斑或者點的大小,跟原始散斑或者點的尺寸做對比,從而測算出被測物體到攝像頭之間的距離,也就是我們所說的深度信息。結構光方案目前是業界比較成熟的深度檢測方案,很多的雷射雷達和3D掃描技術都是採用的結構光方案,但它的問題就是要在雷射發射器上安裝特定的散斑或者點陣的濾鏡,一旦有多個設備同時在使用,如果散斑或者點陣相同,那麼攝像頭就無法正確解析出哪個是正確的反射圖案了。



2. TOF方案,代表Infineon/PMD, TOF技術是發射一束經過相位調製的紅外雷射到被測物體,當紅外雷射被反射會攝像頭,會因為光飛行時間的延遲,導致相位跟發射時的相位有微小的變化,通過計算相位的變化,就可以計算出被測物體到攝像頭之間的距離。TOF方案要求發射和接收端要非常高精度的相位同步,否則光線反射回來本身的相位差就很小,如果同步不好,那麼檢測出來的距離信息誤差就非常大,甚至完全無法檢測。但TOF方案的優勢是可以對每個設備調製不同相位到雷射上,從而可以讓多個設備同時在一個環境內使用。


3. 雙目立體成像方案,代表LeapMotion,所謂雙目立體成像就是利用兩個攝像頭捕捉的圖像之前的視場角度差,來計算出被測物體到攝像頭的距離,當視場角越大說明距離越近,反之則越遠。雙面立體成像方案要求兩個攝像頭之間的距離越遠越好,因為遠距離物體在2個攝像頭中視場角變化很小,因此雙目立體成像方案的探測距離最近。


不論採用哪種方案,最終都是通過攝像頭做一個坐標系XYZ獲得三個坐標的點,從而獲得一個點的深度信息。如果有深度信息加上運動追蹤就可以測不在同一幀的兩點之間的距離了。


上述深度檢測是檢測一幀靜態的物體的表面,障礙物,物體的形狀等。最終如果能檢測到物體反射回來的所有點距離信息,就可以生成類似如下的點雲圖,每個點的表面代表實際物體的點離攝像頭的距離。圖上的點越密集,則檢測的整個立體環境的深度信息越細緻。當達到每秒30fps或者更高的動態深度檢測時,就可以完整地復現整個環境的動態空間信息,類似雷射雷達就是採用同樣的技術,但雷射雷達為了降低整體運算量只檢測一個切面,而Project Tango的深度檢測是實時的立體空間檢測,通過Tango Core優化的算法,配合Motion Tracking超廣角魚眼攝像頭抽取的特徵點,快速地實時把實際環境動態建模,從而避免了海量運算,這也為行動裝置能夠集成Tango提供了可能性。


區域學習(Area Learning):

通過運動追蹤和深度檢測,可以獲得Tango設備的移動軌跡和周邊空間信息,但對於其所處的場景位置還是要進一步學習,否則一旦設備關掉或者進入到兩個很相似的空間(比如兩個同樣大小同樣擺設的會議室),則設備之前的運動軌跡如果沒有跟區域空間匹配,則運動過程中積累的誤差就會不斷累計甚至丟失。為此Project Tango專門設計了場景學習功能,其核心是把Tango設備檢查到的空間深度信息和超廣角攝像頭檢查到的特徵點匹配成一組場景信息存在Tango設備中,隨時跟檢查到的新場景(深度和特徵點)做匹配運算,一旦發現檢查到的新的場景和某個預設的場景中深度和特徵點信息匹配,則Tango設備會把自己重新馬上定位到預設的場景中去,並且同步修正追蹤的數據,為下一次場景匹配做準備,終而復始地做如上的操作,就可以讓Tango設備能夠像人類一樣非常方便地判斷自己所處的空間位置和所在場景。


其實場景學習是把前面的運動檢測和深度檢測兩個功能做的一個結合,從而做到1+1>2的功效,通過場景學習功能,Tango算法把IMU、攝像頭和深度信息集成到一個本地端小型資料庫中,通過對資料庫的自我擴充和匹配,從而實現場景學習的功能。也就完美地模擬了人眼對真實世界的感觀。


如何玩轉Project Tango,創造更多商業機會



Project Tango技術由於採用了這一些特殊的傳奇器,同時通過三個主要的功能的應用,可以讓設備能夠感應周圍環境,追蹤運動軌跡並能認識場景並虛擬出3D模型。這不但可以實現Google一心想推廣的室內導航功能,並且在遊戲、娛樂、教育、AR/VR和機器人等專業領域,都有廣闊的應用前景。

主要應用:

1.室內導航,在2016年MWC上,聯想就邀請Google一起做了室內導航的Demo,在巴塞隆納的加泰隆尼亞國家藝術博物館演示了Project Tango的室內導航功能,通過預製或者現場掃描的室內地圖,Project Tango會持續用多個攝像頭來掃描用戶的前方,採用場景學習的功能實時匹配地圖中的特徵點,在將用戶的空間信息確認的基礎上,很容易做到如圖的室內導航。


Google希望在公共的室內場合中,如大型商場、博物館、圖書館等,能夠通過Project Tango順利地把室外的Google Maps無縫切換到基於Project Tango技術的室內導航,而且能夠在室內導航的過程中,通過雲端推送顯示沿途信息給用戶,比如用戶在羅浮宮參觀,當他到達蒙娜麗莎的畫像的區間時,顯示相關關於蒙娜麗莎的相關信息資料。(猜測此功能可能意味著在國內無法享受相應的服務,因為Google在中國大陸目前還是無法提供雲服務的)。

2. 虛擬購物:在聯想Techworld的發布會上,演示了美國家具巨頭Lowe’s(類似宜家)的虛擬購物應用,Johnny用Phab2 Pro演示了這個應用,不知道想要買什麼家具的情況下,可以用Phab2 Pro來在家裡的實際環境中,虛擬地擺放家具、調整顏色和款式,從而確認哪個家具是最適合的。


用戶可以圍繞虛擬的家具四周來觀察家具是否合適,一旦確認了還可以通過apps直接下單快速購買。類似的虛擬房地產推銷等都是類似的應用。

3. 教育培訓,通過虛擬博物館,可以讓用戶足不出戶就學習到九大行星的運作,並且近距離觀看太陽系的運行;了解恐龍的生活習性。


培訓機構可以通過Project Tango實現遠程虛擬教育。虛擬購車,可以讓用戶在家裡360度實際感受新車的形態,甚至可以坐到車裡面去觀察車的內飾,還可以根據自己的愛好調整噴漆顏色,內飾配置。


類似Hololens的應用,都可以通過Project Tango來實現。

4. VR遊戲:目前的VR頭盔設備,不管是Oculus還是HTC Vive,都需要額外攝像頭,或者在房間內組建了雷射陣列,這種追蹤方式被稱為「由外而內」的追蹤,只能使用在固定場景,而且無法感知到自身周邊移動物體(比如另外一個人)是否在VR運行的空間內,VR頭盔使用者在使用過程中經常會出現碰傷的情況。目前VR頭盔的這些缺陷,會因為Project Tango的場景學習功能而大大改善,Project Tango的各種內置傳感器能夠「由內而外」地追蹤空間環境,從而精確地知道自己在空間中的位置,而且可以把房間內的物體直接3D建模虛擬到VR環境中去,可以讓用戶在真實環境中看到的場景和行為與虛擬世界保持一致。


在VR遊戲中,可以將實際的環境變成VR遊戲的場景,家裡的桌子就是CS遊戲中的障礙物,用戶可以實際躲到桌子後面避開機器人的射擊,也可以用桌子作為掩體來攻擊來襲的機器人。

其實Project Tango的應用還遠不止這些,基於Tango的SDK,用戶可以隨意開發更多的應用,比如VSLAM、盲人導航系統、機器人控制……。如果能將Project Tango做成標準模組,那麼可以實現的功能會更廣泛,也許某一天你的手機或者VR頭盔加上Tango模組,立刻就能讓你的設備增加空間感知能力,從而讓用戶進入到一個完全不同的空間。

期待Project Tango能成為開啟下一個技術革命的窗口。 

視頻連結:

聯想產品發布的視頻:

http://v.youku.com/v_show/id_XMTYwNDY5MzQ0NA==.html?from=s1.8-1-1.2

上一代Project Tango開發者樣機的宣傳片,已經可以看到聯想Phab2 Pro的很多應用介紹了。

http://www.iqiyi.com/w_19rsztaim1.html


相關焦點

  • 通過 Project Tango 漫遊太空
    ▶ Project Tango SDK 下載連結:developers.google.com/project-tango/downloads
  • 【分享】他叫Tango,一個腦洞大到可以腦交的畫師靈魂畫手!
    最後來看看tango的真容吧!圖文/ tango 原名高幼軍 微博:@tango2010想加入#我就愛給麥格時光寫評論小分隊#
  • 從谷歌實驗室畢業的 Project Tango,發生了什麼變化?
    舉個例子,比如對三維場景需要知道深度。傳統相機只有一個攝像頭,景深雖然能估算出來,但是既不準,還耗費計算資源。這個手機上加了一個 深度傳感器,就簡化了很多問題。再比如處理器有兩塊是適於做計算機視覺的並行處理器,同樣是為了加速計算。尚且不知道谷歌是否會把這個打造成一個同 Android 類似的開源平臺。
  • 詳細解析Office Project 2010新功能
    創建一個新的Project文件  • 創建一個空白的project文件, 點擊 File 選項卡. 點擊 New,點擊 Blank Project.  • 如果需要從模版創建一個Project文件, 點擊File 選項卡.
  • 微博紅人Tango一日一畫繼續更新:把兔子變成驢分幾步?(組圖)
    Tango是個漫畫家,現實生活中他叫高幼軍,經營著一家自己的廣告公司,已出版作品集《睡不著:Tango一日一畫》,微博帳號為@tango2010。Tango喜歡給各種物件加上表情和意識,並且「Tango一日一畫」每天都在微博上更新,娛樂兼自療。 一日一畫的畫風簡潔有趣,很受網友歡迎,觀察者網也曾為讀者呈現過幾期,這次是最近的更新。一起來看生活小漫畫。
  • 微軟推出深度學習加速平臺「Project Brainwave」
    近日在 Hot Chips 2017 上,微軟團隊推出了一個新的深度學習加速平臺,其代號為腦波計劃(Project Brainwave),機器之心將簡要介紹該計劃。腦波計劃在深度學習模型雲服務方面實現了性能與靈活性的巨大提升。微軟專為實時人工智慧設計了該系統,它可以超低延遲地處理接收到的請求。
  • 聖鬥士星矢:天馬座星矢深度解析
    接下來的文章白鳳將深度解析聖鬥士星矢裡面的人物幫助大家更好地進行遊戲,今天給大家帶來的是動漫中的主角天馬座星矢的深度解析天馬座又稱飛馬座,是北天星座之一,位於仙女座西南,寶瓶座以北。今天的星矢深度解析就到這裡喜歡的小夥伴可以關注一下白鳳,下一期將會為大家帶來星矢的好兄弟紫龍的深度解析歡迎大家前來閱讀,最後謝謝各位小夥伴的支持與關注
  • 2015考研英語(二)深度解析——翻譯
    原標題:2015考研英語(二)深度解析——翻譯 中公考研英語輔導名師申虹 總體而言,2015年考研英語(二)難度下降。相比2014年的翻譯(樂觀主義),15年的翻譯部分也比較簡單,理解上沒有什麼難度。
  • 深度解析隱形車衣的材質與工藝特點
    今天,合之眾隱形車衣工廠就來跟大家深度剖析一下,隱形車衣的材質和工藝特點。深度解析隱形車衣的材質與工藝特點隱形車衣的核心也就是基材,目前市場上隱形車衣的基材主要有PVC、PU、TPU幾種,其中PVC材質的車衣因為性能不佳、使用壽命短、易黃變等缺陷,正逐漸被市場淘汰。
  • MAMMUT猛獁象#project360讓你實現登頂珠峰夢
    在最近的科技新聞中,一項名為#project360的黑科技引起了廣泛的討論與關注。為何它會如此地引人關注?首先,#project360所屬的公司名為MAMMUT猛獁象,大多數科技圈的人士都表示對該公司一無所知並紛紛表示:「這又是一家新的創業公司嗎?」
  • 新型光衍生質譜分析實現脂質深度結構解析
    儘管大規模脂質的質譜分析已非常成熟,但脂質的精細結構解析問題一直沒有解決,嚴重阻礙了脂質的生物學功能研究。從結構上看,生物體內脂質的複雜性源於脂質類型、脂肪酸鏈及sn位置、以及碳碳雙鍵(C=C)數量、位置及幾何結構等多重結構特徵。
  • 3TREES in Laos | Mahosot General Hospital Project
    It is the largest landmark project in the field of people's livelihood aided by China for Laos.It is the largest China-aided hospital project, with the largest number of beds and investment.
  • Wanhua Plans Second Ethylene Project at Yantai Site
    Wanhua Chemical Group has disclosed plans for a second ethylene cracker project at its Yantai, China, site with local government officials.
  • ...to the Project of 「Guxiyuan」 Cultural tourist Resort in...
    This project is planned to be implemented in three stages in four years, the construction area of which occupies 150,000 square meters mainly for scenery modification, facilities and cottage-building.
  • Dateng Gorge water conservancy project under construction in...
    Dateng Gorge water conservancy project under construction
  • ARXIV:深度學習在金融領域中的應用 | 唧唧堂論文解析
    picture from Internet解析文章首發於唧唧堂網站www.jijitang.com解析作者 | 唧唧堂經濟金融寫作小組
  • 用免費軟體替代MS Project
    主頁:http://ganttproject.sourceforge.net  下載:10MB for Windows 目前版本2.0.1  安裝:不需要,zip文件  運行:雙擊 ganttproject.bat  更多圖片見這裡http://ganttproject.biz/pictures.php。
  • 王者榮耀:調和銘文深度解析
    今天為大家深度解析一下調和銘文。不知道各位有沒有發現,王者榮耀五級銘文中,紅色類多是傷害性銘文,綠色類多是功能性,而藍色多是輔助性銘文,類似於調和,這類回血,增加生命的銘文很少會有人選擇,都是追求最大傷害,下面小編給大家解析一下,調和這個銘文的價值。
  • 2019年6月英語四級考試仔細閱讀解析:兩套全(合肥新東方)
    以下內容是閱讀真題解析供各位考生參考!同時廣大考生還可隨時@新東方網四六級微博及新東方網四六級微信xdfcet46,與線上老師以及考生隨時互動答疑,敬請廣大考生密切關注2019年6月英語四六級真題解析專題。
  • High-purity crystalline silicon project completed in Baotou
    A high-purity crystalline silicon project invested in by Inner Mongolia Tongwei High-purity Crystalline Silicon Co was completed in Baotou, North China’s Inner Mongolia autonomous