在現實生活中,越來越多的行業用到了攝像頭,像直播、監控等等,而在當下,因為某些物理原因,普通攝像頭已經不能夠滿足行業發展的需求。
不論是成像技術,亦或是三維感知,其實都屬於深度感知的範疇。雖然目前市場對於深度感知技術的需求呈井噴狀態,但是能夠提供成熟產品和方案的公司卻屈指可數,造成這一現象的核心原因就是技術門檻過高。
從三維感知的角度來看,AI人工智慧主要分為感知和認知兩個層面。
針對感知層而言,有一個裡程碑事件是深度傳感器的普及。2009年,微軟Kinect 誕生是當時的一個大事件,是人工智慧感知傳感器中的革命性的裡程碑,從此以後大家終於可以很方便和低成本地獲取3D信息了;另外,計算機視覺長期存在兩大難題:圖像理解和三維重建。
一直以來,求解3D都是人們的夢想,最初它需要拍兩張或多張照片,費很大的勁兒來重建。但今天有了sensor,人們直接可以測量3D,它一下就開啟了今天和未來的很多應用。
但是,Kinect V2是基於連續波間相法的ToF(Time-of-Flight)深度相機,它存在不能抗陽光,不能遠距離工作的缺陷。而另一種獲取三維數據的方式是通過機械掃描式雷射雷達,但它同樣存在無法解決的缺陷:產能受限成本高、數據稀疏空間解析度低,限制了它們的應用範圍。
現階段常見的深度感知解決方案,主要依靠深度攝像頭,在獲取平面圖像之外,還可以獲取圖像中的深度信息,比如說三維的位置以及尺寸等信息,這也就讓計算機獲得了環境和對象的三維立體數據。
從技術角度來細分的話,深度感知攝像頭目前有如下三種解決方案:
結構光:目前應用最廣泛的深度感知方案,基本原理是由結構光投射器向被測物體表面投射可控制的光點、光條或光面結構,並由圖像傳感器獲得圖像,通過系統幾何關係,利用三角原理計算得到物體的三維坐標。上文中提到的Kinect 1代就是使用的這項技術。
雙目視覺:只需安裝兩個攝像頭,利用雙目立體視覺成像原理,通過兩個攝像機來提取包括三維位置在內的信息進行深度感知。因為沒有涉及光學系統,所以雙目視覺解決方案的成本較低,但是該項技術對於硬體設備的要求又相對較高。
ToF:飛行時間(Time of Flight)技術的縮寫,基本原理是傳感器發出經調製的近紅外光,遇物體後反射,傳感器通過計算光線發射和反射時間差或相位差,來換算被拍攝景物的距離,以產生深度信息,此外再結合傳統的相機拍攝,就能將物體的三維輪廓以不同顏色代表不同距離的地形圖方式呈現出來。ToF是受環境影響最小的技術,不過由於其解析度不高,所以並不適用於高精度需求的應用場景。
目前全球範圍內感知深度的ToF傳感器有很多種,其中以光珀智能科技的ToF傳感器最具代表性。
杭州光珀智能科技有限公司(以下簡稱「光珀」)主要專注於全球新一代ToF傳感器技術的研發。光珀在基於PCT的專利保護下提出原理創新,使得他們的ToF傳感器和傳統的ToF深度相機(基於連續波間相法)相比,其遠距離及抗陽光的特性更類似傳統意義上的雷射雷達。同時也解決了機械掃描式雷射雷達產能受限成本高、數據稀疏空間解析度低的兩大缺陷。
光珀智能CEO白雲峰介紹說:「目前,我們已經推出了『光珀第一代ToF傳感器晶片』,並由此構建了三個固態面陣雷射雷達技術平臺,分別滿足不同距離下(近、中、遠)、強陽光下(100Klux)、大場景(70⁰)、高精度(<1%)、高空間解析度(0.06⁰H)等三維感知需求。這三個技術平臺可以服務於智能安防、機器人的導航與避障、無人駕駛的環境感知。特別是在無人駕駛領域,光珀的傳感器滿足了量產無人車對雷射雷達低成本、高空間解析度的兩大需要。
「光珀正和科研院校聯手創建大場景下的稠密三維數據集。而我們相信,這樣的數據集會對未來人工智慧的發展有著革命性的推動作用。」
現階段的深度感知技術還處於前期,雖然在硬體性能和算法程序上已經有所突破,但是依然面臨諸多限制,這也導致了很多應用場景還處於商業化探索階段。那麼,對於深度感知領域,還能有哪些突破?
如果你想得到答案,就一定不要錯過鎂客網7月9日在北京國家會議中心舉辦的「3E「硬紀元」AI+產業應用創新峰會」,峰會期間將會有眾多人工智慧、深度感知領域的大咖,分享他們的最新見解與洞察。所以,你還在猶豫什麼,趕緊點擊連結報名參加吧!
最後,記得關注微信公眾號:鎂客網(im2maker),更多乾貨在等你!