AI深度(下) | 非人臉識別和ToF技術

2021-01-09 千家智客

文/紐豪斯

發布/AI智道


一文看盡雙目攝像、結構光、ToF和雷射雷達技術;一文深入了解奧比中光、小覓智能、華捷艾米、的盧深視、Pico和鐳神智能;2大趨勢、2大核心技術。

在AI智道AI深度(上)中,紐豪斯為大家帶來了雙目攝像技術和3D結構光技術,在下篇中,紐豪斯繼續為大家深度解讀非人聯識別和ToF技術、雷射雷達技術。

ToF技術

ToF技術的原理是:測量發射紅外(IR)信號與相位延遲計算每個Sensor像素到目標物體的距離。TOF是Time of flight的簡寫,直譯為飛行時間的意思。所謂飛行時間法3D成像,是通過給目標連續發送光脈衝,然後利用傳感器接收從物體返回的光,通過探測光脈衝的飛行時間來得到目標物的距離。TOF的深度精度不隨距離改變而變化,基本能穩定在CM級。

缺點:精確度低、空間解析度低運動模糊(motion blur 相機運動或目標運動) 

優點:TOF雖然目前精度在釐米級,比Leap Motion等毫米級要低,但目前的設備已經比Leap Motion等更小也更便宜,未來可以做到更小,能夠植入移動端。

TOF原理

飛行時間法深度測量基本原理示意圖

(來源:計算機視覺life)

飛行時間是從Time of Flight直譯過來的,簡稱TOF。其基本原理是通過連續發射光脈衝(一般為不可見光)到被觀測物體上,然後接收從物體反射回去的光脈衝,通過探測光脈衝的飛行(往返)時間來計算被測物體離相機的距離。TOF法根據調製方法的不同,一般可以分為兩種:脈衝調製(Pulsed Modulation)和連續波調製(Continuous Wave Modulation)。


脈衝調製

脈衝調製方案的原理比較簡單,它直接根據脈衝發射和接收的時間差來測算距離,如下圖所示。

光脈衝法工作原理示意圖

(來源:計算機視覺life)

脈衝調製方案的照射光源一般採用方波脈衝調製,這是因為它用數字電路來實現相對容易。接收端的每個像素都是由一個感光單元(如光電二極體)組成,它可以將入射光轉換為電流,感光單元連接著多個高頻轉換開關(下圖的G0,G1)可以把電流導入不同的可以儲存電荷(下圖S0,S1)的電容裡。

方波脈衝調製原理圖

(來源:計算機視覺life)

相機上的控制單元打開光源然後再關閉,發出一個光脈衝。在同一時刻,控制單元打開和關閉接收端的電子快門。接收端接收到的電荷S0被存儲在感光元件中。

然後,控制單元第二次打開並關閉光源。這次快門打開時間較晚,即在光源被關閉的時間點打開。新接收到的電荷S1也被存儲起來。具體過程如下圖所示。

光脈衝原理圖(來源:計算機視覺life)

因為單個光脈衝的持續時間非常短,此過程會重複幾千次,直到達到曝光時間。然後感光傳感器中的值會被讀出,實際距離可以根據這些值來計算。

脈衝調製的優點是測量方法簡單,響應較快;由於發射端能量較高,所以一定程度上降低了背景光的幹擾。但也存在缺點:發射端需要產生高頻高強度脈衝,對物理器件性能要求很高;對時間測量精度要求較高;環境散射光對測量結果有一定影響。


連續波調製

實際應用中,通常採用的是正弦波調製。由於接收端和發射端正弦波的相位偏移和物體距離攝像頭的距離成正比,因此可以利用相位偏移來測量距離。

連續波調製原理示意圖

(來源:計算機視覺life)

連續波調製的測量原理相對脈衝調製來說複雜一些。同樣具備優缺點,

優點:

相位偏移相對於脈衝調試法消除了由於測量器件或者環境光引起的固定偏差。

可以根據接收信號的振幅A和強度偏移B來間接的估算深度測量結果的精確程度(方差)。

不要求光源必須是短時高強度脈衝,可以採用不同類型的光源,運用不同的調製方法.

缺點:

微軟推出了兩款Kinect,Kinect一代(Kinect v1)是基於結構光原理的深度相機,Kinect二代(Kinect v2),正是基於TOF原理的深度相機。

紐豪斯認為,ToF既然是一種非常好的測距技術,那麼用於非人臉識別領域最適合不過了。相比較3D結構光方案,ToF還可以適用於室外場景,適用性得到大大的加強。


典型廠商:PICO-青島小鳥看看

Pico是新近成立的一家公司,總部位於青島(之前北京),公司成立於2017年,重點專注於3D視覺技術,最早(也不算很早)做VR眼鏡起步。提供ToF傳感模組、配套軟體,跨平臺開發工具的全套解決方案,發布了DCAM100、DCAM710、Air Camera等多款深度攝像頭平臺,與機器人、智慧物流、金融安防、新零售、消費娛樂、汽車電子、工業自動化、AR/V3D掃描等行業客戶展開緊密合作。

Pico的ToF模組和成品(紐豪斯拍攝)

(從上到下:DCAM100/DCAM710和air camera)

核心產品技術參數:

air camera ToF+RGB深度傳感一體機

- CPU:高通驍龍605

- RAM:3GB

- ROM:32GB

- 本機作業系統:Android 8.1

- 深度解析度:640*480@30FPS

- RGB傳感解析度:1920*1080@30FPS

- 視場角:69°(水平)51°(垂直)

DCAM100 TOF 傳感模組

- 深度解析度:640*480@30FPS

- 視場角:69°(水平)51°(垂直)

- 作業系統支持:Linux/Windows7/10

DCAM710 TOF+RGB 圖像傳感模組

- 深度解析度:640*480@30FPS

- RGB傳感解析度:1920*1080@30FPS

- 視場角:69°(水平)51°(垂直)

- 作業系統支持:Android/Linux/Windows7/8/10

Pico旗下的Pico Zense產品線提供定製開發,如在工作距離、鏡頭視場角(FOV)、接口、尺寸、幀率、產品形態(Depth only/RGBD/PCBA only/成套模組)等方面進行定製化開發。

Pico Zense深度成像的效果(3種)

Pico的背後,由高通Qualcomm提供5G和AI平臺、ADI提供3D深度引擎、Geoertek提供製造和供應鏈管理,當然核心還是ADI的ToF技術。


雷射雷達技術

雷射雷達測距技術通過雷射掃描的方式得到場景的三維信息。其基本原理是按照一定時間間隔向空間發射雷射,並記錄各個掃描點的信號從雷射雷達到被測場景中的物體,隨後又經過物體反射回到雷射雷達的相隔時間,據此推算出物體表面與雷射雷達之間的距離。

雷射雷達由於其測距範圍廣、測量精度高的特性被廣泛地用於室外三維空間感知的人工智慧系統中,例如自主車的避障導航、三維場景重建等應用雷射雷達所捕獲的三維信息體現在彩色圖像坐標系下是不均勻並且稀疏的。由於單位周期內,雷射掃描的點數是有限的,當把雷射雷達捕獲的三維點投射到彩色圖像坐標系下得到深度圖像時,其深度圖像的深度值以離散的點的形式呈現,深度圖像中許多區域的深度值是未知的。這也就意味著彩色圖像中的某些像素點並沒有對應的深度信息。

雷射雷達目前被廣泛應用於無人駕駛領域,當然也可以應用於安防領域,其典型的代表企業是鐳神智能。

基於雷射雷達的智能安防系統,旨在彌補監控技術、傳感器報警技術被動防禦的特性和智能圖像分析技術在環境應用中的局限性,通過雷射雷達主動防禦的特性結合高清視頻監控技術,對重點監測區域的目標進行定位跟蹤、放大、記錄目標的運動軌跡,通知上級單位進行處理。

典型廠商:鐳神智能

鐳神智能基於雷射雷達的智能安防系統是高成本人力守衛的創新替代方案,實現持續的周界自動監控,它非常適合機場監視、國家重要基礎設施和商業設施等應用。全天候的雷達系統檢測,跟蹤和識別任何威脅的確切位置。通過檢測周邊內外,可以在白天或晚上任何時間進入現場之前識別潛在的入侵者。作為一個全自動的系統,系統會在發生潛在的或實際外圍威脅時發出警告或者警報,在外線被攻破之前檢測到威脅,或者報告可疑行為,讓安全團隊在實踐發生之前防止這些威脅。

系統主要由雷達探測系統、射頻定位系統、聯動控制分系統、網絡傳輸及供電分系統、監控中心系統組成。同時可以根據需求提供多個反探測、可穿戴式的人員定位標籤(超寬帶無線射頻定位標籤)實現身份與告警關聯。

雷射雷達的核心技術在於雷射雷達點雲處理,主要包括:

搭建系統框架,建立與客戶端通信系統,包括點雲顯示、區域顯示、報警信息等。

可以獲取客戶端的區域設置參數,告警區內設置無效區的能力,具備繪製多個異形防區的能力。

可以將客戶端下發的區域參數保存,斷電上電後可以直接啟用。客戶端可以讀取雷達中設置的區域參數。

識別物體大小可設定,可根據障礙物的大小屏蔽較小的物體。

自動定位入侵物在預警區的位置,並根據雷達在世界坐標系的位置方位,計算入侵物在世界坐標系中的位置。

識別靜止、緩慢移動的物體和高速入侵的物體,並輸出物體的速度。

自動記錄報警信息,並輸出。

輸出報警燈(開關量,不少於四路)、客戶端控制雷達報警和消警。

雷達遮擋判別、前窗有汙染時報警、探測器非法旋轉或者探測角度發生改變時被激活。

雷達故障判別、探測器內部自檢錯誤時被激活。

可以在地圖中顯示障礙物運動的軌跡(客戶端後臺處理)。

設置所有的雷達區域可以構建一個地圖。

相比較3D結構光和ToF等三維解決方案,雷射雷達作為一種補充的方案也具備自己的優勢:

主動防禦、自動跟蹤。以目標定位為核心的全新安防理念,突出主動防禦性,雷射雷達提供目標的實時定位信息,根據系統設置條件自動觸發告警。

全天候、無漏報,雷射雷達,不受光照影響,在大霧、大雪、大雨等室外惡劣的環境下智能調節全天候不間斷工作。通過智能算法,有效區分車輛、動物雜草等幹擾目標,同事可以計算出障礙物移動的速度和距離,實現針對性探測。

精度高、範圍廣,雷射雷達掃描精度為釐米級,掃描解析度為0.18度,測量精度高。雷達扇形掃描,角度360度,半徑0-500m,防護區域大。

該系統可以實現最佳跟蹤,可以在平面視圖顯示器上顯示數百個對象,根據配置的規則和屬性(如大小、速度和方向)對其進行分類。雷達傳感器的快速更新速率可以實時更新其位置。所有的系統活動包括軌道、威脅和警報的運行歷史被寫入到單個的資料庫。

主要的缺點在於造價昂貴同時沒有直接生成RGB的視頻監控信號,不能作為視頻替代方案。

雷射雷達3D成像效果(來源:鐳神智能)

總結

RGB雙目攝像、結構光技術和ToF技術各有特點,對比如下表所示:

相機類型

RGB雙目

結構光

ToF

測距方式

被動式

主動式

主動式

工作原理

RGB圖像特徵點匹配三角測量間接計算

主動投射已知編碼團提升特徵匹配效果

根據光的飛行時間直接測量

測量精度

近距離可達毫米級精度

近距離內能夠達到高精度0.01mm-1mm

可達釐米級精度

測量範圍

由於基線限制,一般智能測量較近的距離,距離越遠,測距越不準確。一般為2米(基線10mm)以內

測量距離一般為10米以內

可測量教育安距離,一般為100米以內

影響因素

受光照變化和物體紋理影響很大,夜晚無法使用

不受光照變化和物體紋理影響,受反光影響

不受光照變化和物體紋理影響,受多重反射影響

戶外工作

無影響

有影響,和編碼圖案有關

功率小影響較大

從上表可以看出,TOF測量的精準度和穩定性較好,適用於室外環境;但結構光可以做得更小,功耗小,測量解析度也相對高,不適用於室外環境;雙目模擬了人眼結構,但它屬於被動光,無法適應暗光環境;而前兩者是主動光,可以適應暗光環境。

如果紐豪斯發現AI賦能安防的未來2大發展趨勢3D人臉識別和非人臉識別成立的話,從目前來看3D人臉識別的最佳技術是結構光技術,而非人臉識別最佳的技術當屬ToF技術,當然兩種技術互有交集,隨著技術的進步,而且的界限越來越模糊,不論怎樣,結構光和ToF技術都會成為未來的技術,現在關注都還不算太晚。


參考文獻:

深度相機技術對比,人人智能,王海增

雙目立體視覺的數學原理,沈子恆,https://blog.csdn.net/shenziheng1/article/details/52883536

深度相機原理揭秘--結構光,計算機視覺life,https://blog.csdn.net/electech6/article/details/78707839

深度相機原理揭秘--飛行時間(TOF),計算機視覺life,https://blog.csdn.net/electech6/article/details/78349107

3D ToF技術市場熱度高居不下,系統級解決方案引爆新一輪行業應用浪潮,MEMS,麥姆斯諮詢

-全文完-

版權說明:本文核心素材來自人人智能,部分素材來源於網際網路,凡能註明素材出處的儘可能都予以註明。本文內容禁止用於商業目的,如需轉載事先和AI智道聯繫獲取授權。

致謝:感謝人人智能王海增提供了基礎素材,感謝PICO小鳥看看、小覓智能、華捷艾米、奧比中光、的盧深視、鐳神智能提供的內容素材。

PS. 「AI深度(上) | 3D人臉識別和結構光」發布之後受到廣泛的關注,也收到了多個有益的建議,幾位專業人士提供了素材,用於彌補個人技術上的短板,看來需要狗尾續貂,追加一篇續篇:AI深度(續)|  3D人臉識別和雙目結構光慣導,敬請關注!

AI智道,賦能落地!


相關焦點

  • 基於深度學習的人臉識別技術全解
    這期間,對各種人臉識別影響因子的針對性處理也是那一階段的研究熱點,比如人臉光照歸一化、人臉姿態校正、人臉超分辨以及遮擋處理等。 也是在這一階段,研究者的關注點開始從受限場景下的人臉識別轉移到非受限環境下的人臉識別。
  • 人臉識別技術介紹和表情識別最新研究
    作者:夏初來源:公眾號|計算機視覺工坊(系投稿)一、人臉識別技術介紹人臉識別作為一種生物特徵識別技術,具有非侵擾性、非接觸性、友好性和便捷性等優點。獲取人臉後,人臉裁剪是根據實際需求,裁剪部分或整體的人臉,進一步精確化人臉圖像。為提高人臉識別準確率,人臉校正可以儘可能的降低由於姿態和表情導致的人臉變化,獲取正面或者平靜狀態下的人臉照片。特徵提取利用不同的特徵,對圖片進行相似度的衡量和評價。人臉識別主要包括一對一或者一對多的應用場景,對目標人臉進行識別和驗證。人臉表達模型主要分為2D,2.5D,3D。
  • 3D人臉識別:結構光還還是TOF?
    而3D人臉識別目前又主要有3D結構光和TOF兩類技術。2013年7月,英特爾又收購了手勢識別公司Omek,隨後宣布將推3D深度攝像頭的PC。2014年CES上,英特爾正式推出了首款集成了3D深度和2D鏡頭模塊的 RealSense 3D攝像頭(結構光+雙目立體成像),它能實現高度精確的手勢識別、面部特徵識別,可幫助機器理解人的動作和情感。
  • AI深度(續) | 3D人臉識別和雙目結構光慣導
    前言紐豪斯剛剛完成《AI深度(上) | 3D人臉識別和結構光》,發表到公眾號AI智道受到了廣泛的關注,讀者的反饋很多,有的讀者評價說「技術理論部分講的很清楚、趨勢判斷也很準確」,有的讀者評論關於雙目攝像機的典型代表選用的不正確,原因是「雙目攝像頭現在都是要求有瞳間距
  • 應用層下的人臉識別(三):人臉比對
    本文作者根據多年人臉識別項目經驗,總結了人臉識別技術在安防、商業領域應用及產品設計細節,匯總成應用層下的人臉識別系列文章。本文為系列文章的第三篇——介紹人臉比對相關內容。全文圍繞人類比對類型、人臉比對要素展開介紹。
  • 人臉識別主要依靠了基於圖像的空間邊緣檢測技術
    ai換臉技術引起很多人的擔憂,怕外貌損害。這次任性哥帶你回歸本源,用人臉識別,再現青澀年華,你也可以擁有金融界鼻祖級的辨識力。最近我們也在研究人臉識別這個方向,今天就針對這個做個簡單的介紹。什麼是人臉識別?
  • 人臉識別真的安全嗎?關於人臉識別技術發展的瞻望
    日前,清華大學電子工程系蘇光大教授就算法、系統、標準、應用四方面深度講解了人臉識別技術的發展態勢。該技術的發展主要是依靠深度學習、三維人臉識別、超低解析度人臉三個方面,」蘇教授介紹道。深度學習被認為是新世紀十大突破性技術之首,在人工智慧領域佔有極高地位,它不僅應用於人臉識別,還廣泛應用於指紋識別、語音識別、文字識別等,識別準確率相當高,達到99.7%,深度學習作為一項具有突破性進展技術,把人工智慧提升至一個新的高度。
  • 人臉識別技術風險的法律防範
    黨的十九大報告提出,要推進網際網路、大數據、人工智慧與實體經濟的深度融合。當前隨著信息化的迅猛發展,生物識別技術在警務實戰及個人財產保護中得到廣泛的應用。作為生物識別技術的一種,人臉識別技術以其獨特的優勢,利用人的個體面部特徵的區別,廣泛用於政府、軍隊、銀行、電子商務、安全防務等多重領域。
  • 支持微信人臉識別支付 vivo發布TOF 3D超感應技術
    6月26日,在2018世界移動通信大會上海站上,vivo推出了TOF(Time of Flight)3D超感應技術。官方介紹,這項技術利用傳感器測量目標物距離和輪廓,實現手機對高精度3D信息的採集和運算,具有有效深度信息高、工作距離遠、結構布局靈活、應用場景豐富等亮點。
  • 每周AI應用精選:虹膜識別解決方案;基於深度學習人臉識別方案等
    方案1:虹膜識別解決方案解決方案簡介:虹膜識別技術是基於眼睛中的虹膜進行身份精準識別,應用於對身份認證安全強需求或高度保密需求的場所。在虹膜檢測、活體虹膜判別、圖像質量評價、虹膜區域定位、歸一化、圖像增強、特徵表達和抽取、特徵匹配與分類器設計等各個環節也都進行了自主創新,突破了一批關鍵技術,建立了比較系統和完整的虹膜識別理論、技術和方法。中科虹霸的虹膜圖像資料庫已成為國際上最大規模的虹膜共享庫。截止目前已有 70 個國家和地區的 2000 多個研究機構申請使用,其中國外單位 1700 多個。
  • 結構光、TOF、紅外雙攝,哪個才是手機上最安全的人臉識別技術?
    那麼為何人臉識別在當下熱潮不再?今天我們就來聊一聊人臉識別技術。一款成熟的人臉識別模塊其工作流程大題有四個部分:人臉圖像檢測、人臉圖像預處理、人臉特徵提取、人臉匹配與識別。根據工作流程的不同,可以分為2D人臉識別和3D人臉識別。2D人臉識別通過普通的攝像頭即可實現。
  • 人臉識別技術原理與實現方式
    本文將為大家從人臉檢測、人臉定位、人臉校準以及人臉對比等方面詳細闡述人臉識別的原理與實現方式。   隨著計算機技術以及光學成像技術的發展,集成了人工智慧、機器學習、視頻圖像處理等技術的人臉識別技術也逐漸成熟。未來五年,我國人臉識別市場規模平均複合增長率將達到25%,到2021年人臉識別市場規模將達到51億元左右,具有巨大的市場需求與前景。
  • 人臉識別:AI產品經理需要了解的CV通識
    非專業人臉識別攝像頭常見規定的最小識別人臉像素為60*60或100*100以上。在規定的圖像大小內,算法更容易提升準確率和召回率。圖像大小反映在實際應用場景就是人臉離攝像頭的距離。2)圖像解析度:越低的圖像解析度越難識別。圖像大小綜合圖像解析度,直接影響攝像頭識別距離。現4K攝像頭看清人臉的最遠距離是10米,7K攝像頭是20米。
  • 【AI科普篇】有了人臉識別為什麼還需要指靜脈識別?
    在生物識別技術領域中,指紋識別技術是最早將高安全性與高便捷性結合得較好的技術,因此也率先獲得了最大程度的推廣應用。人臉識別非接觸性、可遠程抓取的特點使得其便捷程度最高,但安全性較低,長久以來,識別的精準率達不到商用級別。而指靜脈識別在眾多生物識別技術中以活體識別、特徵在指內、不可偽造的特點著稱,安全級別最高,過往無法大規模商用主要是受限於模塊體積大、功耗高等不足。
  • 人臉識別技術理論
    人臉識別,是基於人的臉部特徵信息進行身份識別的一種生物識別技術。用攝像機或攝像頭採集含有人臉的圖像或視頻流,並自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部識別的一系列相關技術,通常也叫做人像識別、面部識別。
  • 紅外人臉識別和3D結構光人臉識別有什麼區別
    導讀 人臉識別技術有靜態和動態人臉識別之分,也有2D和3D人臉識別之分,還有可見光和紅外光人臉識別之分。其中紅外人臉識別和3D人臉識別的結構光人臉識別的媒介是紅外光。
  • 人臉識別技術原理與工程實踐(10個月人臉識別領域實戰總結)
    1人臉識別應用場景(驗證)我們先來看看人臉識別的幾個應用。第一個是蘋果的FACE ID,自從蘋果推出FaceID後,業界對人臉識別的應用好像信心大增,各種人臉識別的應用從此開始「野蠻生長」。事實上,人臉識別技術在很多場景的應用確實可以提升認證效率,同時提升用戶體驗。
  • 3D人臉識別智能鎖成新風口 3D結構光、TOF、雙目立體視覺三種技術...
    近年來,智能鎖行業發生了許多變化,從全自動到一握即開、視頻鎖,再到如今火得一塌糊塗的3D人臉識別智能鎖。德施曼、凱迪仕、智家人、優點、櫻花、KFZ、科裕、曼亞等已紛紛推出了智3D人臉識別能鎖產品。 在人們的印象中,2D人臉識別技術雖然發展比較早,算法也比較多,穩定性也比較好。
  • 孫啟超:卷積神經網絡在人臉識別技術中的應用 | AI研習社第51期猿...
    隨著 iPhone X 的發布,Face ID 人臉識別技術開始進入人們的日常生活中,當我們拿起手機並看著它的時候就可以實現手機解鎖的功能。而人臉識別中的關鍵技術就是卷積神經網絡。近日,在雷鋒網 AI 研習社公開課上,法國蒙彼利埃大學孫啟超就講述了卷積神經網絡的基本原理以及人臉識別技術是如何運行的。
  • 警惕「連接一切」:人臉識別技術的自閉症效應
    餘盛峰,北京航空航天大學人文與社科研究院、法學院副教授人臉識別不是隱私的唯一敵人,甚至也不是最大的敵人。或者說,當代隱私的最大敵人已不是某項技術,而是數字社會本身對於數據的無限欲望,以及「連接一切」意識形態所帶來的自由幻覺。狹義的人臉識別只是固態機器的認證,而廣義的人臉識別,則涉及整個生存空間的數位化和監控化。