AI+3D,一項具有革命性改變的感知技術,正在慢慢向工業生產、硬體製造,以及人們日常生活滲入。
3D感知硬體能夠提供距離、深度等數據信息,但這並不是單純的數據,而是基於這些數據,通過不同的表達和理解方式,實現不同的應用。比如對三維場景進行數位化建模,或者繪製三維地圖,從而讓機器能夠實時感知自己在所處空間中的位置,以便在運動時及時避開障礙物等。
這需要根據深度信息生成深度圖像,並與RGB圖像,甚至是紅外圖像進行融合併完成大量計算。
而商湯科技向筆者表示,通過硬體感知信息生成的深度圖像,往往存在因硬體性能限制而產生瑕的疵。例如在細小或複雜交錯的物體之間,出現深度信息估計錯誤等問題。此外,精準度、魯棒性、實時性、效率等都是決定實際應用效果的關鍵。這些問題和應用效果都需要依靠額外的算法進行實時處理予以彌補和增強。
據悉,AI可通過對大量實際數據進行學習,自行總結其中的規律和特徵。這種方法可以在短時間內,完成傳統算法需要多年才能突破的問題,有效彌補硬體能力的不足。
3D硬體小型化,是3D視覺技術應用場景拓展和創新的硬體基礎,而AI技術則是真正的動力引擎,兩者密不可分。在商湯科技看來,AI+3D視覺技術拐點已至。
什麼是AI+3D?
初次接觸,可能很多人,對於AI+3D這項技術有些陌生。但實際上,了解之後便會發現,就如前文所說「AI+3D是一項最新的感知技術」。3D屬於成像技術,是靠人兩眼的視覺差產生的。基於攝像頭獲取的圖像信息,視覺技術可以搭配AI技術解決各種實際應用問題。
這些深度圖像信息則可以豐富AI圖像視覺技術,如同人眼一樣對場景深度進行感知。商湯科技向筆者稱:「對於AI來說,能像人類一樣獲得深度信息後的感知能力,是他們研究這項課題的想法。行業早些年研究結構光、ToF、雙攝等基於硬體設備技術都是為了帶來深度信息,搭配AI對3D圖像的感知能力,豐富不同領域的應用」。
同時,光鑑科技執行長朱力認為:「3D視覺技術的意義,是打開了更加廣闊的AI應用空間。無論是輔助駕駛,還是各種虛擬實境、增強現實技術的應用,這些前沿概念的落地都建立在信息交互基礎上。對正處於發展中的AI產業來說,3D視覺將幫助機器更好地「看」世界」。
據筆者了解,隨著硬體設備的小型化,AI+3D技術及其成熟的解決方案,可在手機應用、人臉識別、AR/VR領域、汽車、工業等具有相關性領域進行研發和場景落地。
例如:通用3D重建技術,從毛絨玩具、紙箱、書包、鞋子到雕塑,用戶只需拿手機沿著物體360度環繞掃描,就能將其掃描成數位化的模型。生成的模型文件可直接用於3D列印、3D/AR相冊預覽,也可應用於生成短視頻直播的內容並設置動畫,也可植入到AR養寵等遊戲、電商的商品展示或預覽等場景中。
除此,在汽車領域,AI+3D技術能夠實現更加精準的人、車、物識別和距離感知,從而有力推動自動駕駛發展。在工業領域,AI+3D將進一步優化工業生產流程,可為機械臂賦予3D感知能力,通過高精準的SLAM、物體重建和測量等技術,判斷立體物體所處的位置,以及相應尺寸、形狀和質量等信息,提升工業生產智能化能力。
目前,商湯科技已在人臉識別、汽車、工業、電商、手機等領域進行了深入研究。
AI+3D能否成為AI業又一「強心劑」
人工智慧作為第四次工業革命的產物之一,給社會、工業、人帶來的是一場人機互動變革。與此同時在該產業也誕生了許多新興企業,如:商湯科技、寒武紀、曠視科技、雲從科技、同盾科技等估值達到或超過10億美元的AI企業。
按照產業鏈,從底層硬體到上層的應用,整個AI+3D產業鏈可以分為四類廠商,在國內外均有企業在進行相應的開發:一、3D感知硬體設備的相關供應商,包括鏡頭、攝像頭模組、圖像傳感器,以及紅外光源等器件;二、基於3D感知的AI技術/算法提供商;三、手機廠商,將AI+3D軟硬體技術進行整合;四、應用開發商,開發基於AI+3D技術的應用。
很多AI企業則屬於第二類:基於3D感知的AI技術/算法提供商。
而本次AI+3D技術的應用和產業鏈延伸更是將AI行業發展推向高潮。國外調研機構QYResearch曾預測,全球3D技術市場規模2012年為796億美元,至2022年將達到3892億美元,年複合增長率為17.20%。
商湯科技認為,「ToF在智慧型手機上的加速應用,有助於3D視覺技術的廣泛普及化,會成為接下來10年中非常重要的科技趨勢。業內統計,2019年TOF新機出貨約0.5億臺,預估2020年將達到1.5億臺」。
在筆者看來,AI+3D技術所產生的價值則是對以往機器2D視覺認知的更新迭代或替代,可以讓機器通過視覺三維影像,更加智能化,對所處世界有一個較為全面且深刻的信息感知與理解。從人機互動、互動娛樂、內容創作、身份驗證、拍照、電商等層面激發大量的創新應用場景。改變傳統商業運作模式。
不過,目前除了商湯科技外,谷歌、微軟、曠視科技在AI+3D技術方面也有研究。據曠視科技雲事業部高級副總裁吳文昊介紹稱,「該技術已在手機領域有多種案例出來,但包含算法和模組的整體解決方案仍是缺位,公司正在嘗試一種從上往下的整合方案,從3D應用層往下依次至AI算法、解決方案,最後到攝像、傳感等硬體設備製造上」。
另有行業人士認為:「AI技術可以讓3D列印實現以機器製造機器人,這也是新一輪製造業革命的助推劑」。