曠視發布3D感知全棧解決方案!現在,AI+3D只差殺手級應用了

2021-02-07 量子位
李根 發自 凹非寺 
量子位 報導 | 公眾號 QbitAI

曠視者,大視覺之謂也,現在更能顯出這家AI獨角獸的抱負和野心了。

就在昨天(8月8日),曠視發起了一場「3D視覺產業先鋒研討會」,並正式對外推出了「軟硬一體」的移動端3D感知全棧解決方案。

從算法、應用開發、晶片、攝像硬體、傳感設備到解決方案,現在萬事俱備,只待AI加速下的3D視覺迎來殺手級應用的爆發。

自深度學習「開天闢地」以來,自2D圖像、視頻被AI結構化解析以來,視覺領域已有天翻地覆的變化。

但曠視雄心不止於此,新世界、新方向是什麼?

3D視覺。

 曠視移動端產品矩陣架構
全棧方案

在曠視推出的解決方案中,包含了3D視覺發展的一整套所需。

首先是算法

曠視會集中於識別和重建2個大類。

識別即機器感知、理解世界的能力,這是曠視的強項,基於曠視自研的MegBrain深度學習引擎,之前曠視在人臉識別、人體識別、活體檢測、注意力檢測追蹤及其他圖像識別的算法層面,已有業界公認的技術基礎。

重建是把識別出的物體進行三維重建,是開發針對人、針對物的3D視覺應用核心所在。曠視稱,目前已在人像3D建模、人體3D建模及物體幾何測量算法研發方面走在世界前列,並與Bellus 3D、Altizure等3D視覺企業開展了聯合研發合作。

其次是解決方案

毫無疑問,不同應用場景需要不同的3D視覺解決方案,基於此,曠視根據不同應用場景中對深度計算、深度修復、深度優化、標定、畸變校正等能力的需求,設計出了基於雙攝、三攝、深攝的解決方案,而且之前在整合結構光、TOF、雙目等不同的攝像、傳感系統架構上,都有成熟應用經驗。

第三是硬體模組

硬體製造處於移動端3D產業鏈最底層,包含攝像頭、傳感器、晶片等硬體模組的研發。

結構光、TOF和雙目方案涉及到高清攝像頭、IR投射器、IR接收器、雷射發光器等設備的搭配組合,曠視目前與艾邁斯半導體等3D硬體模組廠商展開合作。

此外,還將聯合主要晶片廠商合作研發算法適配性更強的晶片,進一步優化手機3D應用能力。

最後,基礎條件兼具,應用其實已如雨後春筍。

3D視覺究竟能做什麼?怎麼實現價值?曠視認為,目前曠視在3D人臉識別解鎖和3D人像光效應用方面,已經實現了大規模的應用,並且還開發出全面可用的安全支付、3D 美顏、3D 整形等應用。

下一步,AR遊戲、虛擬試穿等應用上,還能持續有3D賦能手機的更多應用。

所缺的是更多合作夥伴和開發者。

創新應用開發

整個研討會上,有種工具已齊備,但創新性應用還只是潛力初現之感。

作為此次「AI+3D」研討的召集人,曠視也請到了幾家合作夥伴及開發者,分享了具體實踐。

 Bellus 3D創始人Eric Chen

Bellus 3D,一家來自於矽谷的移動端3D面部掃描企業,其創始人Eric Chen是蘋果公司Quicktime VR 項目的創建者之一。

2015年,Eric Chen創建Bellus3D,專注於為手機等行動裝置提供高解析度的3D人臉掃描、建模技術和產品。

Eric Chen針對Bellus 3D的實踐分享是:「Bellus 3D 是最早採用『active stereo』(主動式立體)深度感測技術打造3D面部掃描相機的企業,通過將 Bellus3D研發的3D面部掃描相機與智慧型手機或平板電腦連接就可以檢測人臉上的50萬個3D點,在幾秒鐘內創建出高解析度和高精確度的面部模型,同時掃描後的面部模型可以進一步應用於人臉的識別、分析和動畫製作。」

Eric Chen認為,當前3D產業的技術和硬體研發進入快速發展期,研發3D掃描器不再像以前一樣昂貴、難做,3D應用或許現在還不能完整清晰的面貌,但未來人手一臺三維掃描器後每個人都將成為應用的開發者,可能性無限。

 Altizure聯合創始人兼CEO方天

Altizure,深圳珠科創新技術有限公司,是三維重建技術應用系統集成商和網絡解決方案提供商。

Altizure平臺主要通過計算機視覺技術來識別圖片中的信息,加以人工智慧以及深度學習技術來實現二維圖像到三維模型的建立工作。目前該平臺已擁有來自全球各地成千上萬個3D重建模型。通過一架無人機,就能實現某個建築、地點的3D模型繪製,打造的是一個眾包版的Google Earth.

Altizure聯合創始人兼CEO方天說:「自2015年上線以來,Altizure已經和眾多大型工程企業合作為其提供項目工程的三維建模服務,幫助提高建築效率和質量。今後Altizure將在戶外運動、旅遊、遊戲、影視、三維列印,自動駕駛、高精度地圖等領域,聯合行業合作夥伴一起繼續三維建模技術和應用的創新研發。」

 上海疊鏡數字科技CEO洪煦

還有一家匯集了虞晶怡、馬毅等機器視覺大牛的上海疊鏡數字科技,公司CEO洪煦分享說,目前在電商商品3D圖像構建、明星3D形象繪製方面,都開始進入了商業化應用。

而且底層晶片硬體方面,其實也已感知到了潮向。

此次現身研討會現場的傳感器解決方案提供商艾邁斯半導體透露,過去一年營收增長的70%都主要來自於手機市場,其中手機3D攝像模組的應用貢獻了巨大力量。

此外,艾邁斯半導體在中國的業務也實現了300%的增長,也是得益於中國手機市場對傳感模組的需求增長。

總之,AI+3D視覺,看起來路通橋建,渠也通暢。

但不意味著發展沒有挑戰。

缺組織者

最大的挑戰在於組織者缺乏。

在研討會現場,嘉賓們被問及AI+3D視覺的「殺手級」應用何時能到來。

曠視SVP吳文昊認為,最關鍵的問題不在技術準備層面,而在產品應用方面。

以3D視覺目前最廣為人知的「刷臉解鎖」為例,在iPhone X發布前,其實數家國內安卓廠商就已經向曠視提出了訴求。

但相比蘋果有整一套方案的上下遊構建能力,安卓陣營裡缺乏實際組織者,都是OEM廠商先主導提需求,再向行業不同參與方要方案,產品方案最後出爐需要耗費的時間和精力可想而知。

所以在陪OEM廠商完整推出3D視覺方案後,曠視開始意識到,這個生態平臺,需要一個承擔更多責任的組織者和號召者。

 曠視高級副總裁吳文昊

於是時也運也,曠視決定將「AI+3D」的生態平臺組織、維護和應用創新引導,攬責任於自身。

曠視想做的,就是在整個產業上下遊中,整合軟體、硬體、算法、應用,讓3D視覺從技術到產品的落地速度進一步提升。

說白了,3D視覺的終端應用,iOS陣營裡整合者是蘋果,那安卓陣營裡,是曠視。

所以這套3D感知全棧解決方案發布,也便自然而然。

可以肯定的是,這只是開始,如果曠視能團結更多產業上下遊公司加入,AI+3D視覺,會有更多應用,會出現在更多設備,也會造出一個更立體的世界。

你怎麼看曠視的這一步?

作者系網易新聞·網易號「各有態度」籤約作者


量子位AI社群19群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字「交流群」,獲取入群方式;


此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。


進專業群請在量子位公眾號(QbitAI)對話界面回復關鍵字「專業群」,獲取入群方式。(專業群審核較嚴,敬請諒解)

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。



相關焦點

  • 「AI+3D」強勢來襲,曠視發布3D感知全棧解決方案!
    繼續iPhone X Face ID技術推出後,3D+AI解決方案迅速進入手機領域,開闢了一條通向未來交互探索的快車道。近日,曠視發起了一場「3D視覺產業先鋒研討會」,並正式對外推出了「軟硬一體」的移動端3D感知全棧解決方案。
  • 曠視科技Face++舉辦3D視覺產業先鋒研討會 探索世界的深度
    其中,3D傳感模組在安卓手機上的應用將成為增長的強大推動力,市場份額將從2018年的700萬臺增長至2020年的 4.65 億臺。在研討會上,曠視基於對行業的深刻洞察和手機3D創新實踐,於業界首次發布曠視「軟硬一體」的移動端3D感知全棧解決方案,從算法創新、應用開發、設備製造到解決方案打造四個層面,闡釋曠視最新、最全面的「AI+3D」發展脈絡。
  • Altizure構建三維信息的平臺 開啟全民3D應用時代
    曠視發布移動端3D感知全棧解決方案在研討會上,曠視基於對行業的深刻洞察和手機3D創新實踐,於業界首次發布曠視「軟硬一體」的移動端3D感知全棧解決方案,從算法創新、應用開發、設備製造到解決方案打造四個層面,闡釋曠視最新、最全面的「AI+3D」發展脈絡。
  • 3D視覺成為CV新風口,曠視做了這些來搶佔賽道
    在這個過程中我們越來越深刻認識到,最後真正的落地一定是應用去驅動。拿刷臉支付舉例,應用場景決定了識別的精度、活體攻擊的能力防範等。所以算法和軟體商其實是這個價值鏈的最上端,他們可以從上往下去驅動很多細節。吳文昊介紹到,「手機3D視覺領域雖然已有多種類型的應用案例出來,但該領域包含算法和模組的軟硬一體整體解決方案仍是缺位的,曠視科技正在嘗試一種從上往下的整合方案。」
  • 連人都可以複製的殺手級AR應用!
    ,就比如下面這款殺手級的應用——這段視頻在前段時間被大家津津樂道。這個應用其實是來自Laan Labs公司發布的測試版app:3D Scanner Pro你只需要圍繞處於靜態的物品進行錄製,該應用就能夠快速創造出現實物體的3d模型,並能使用iMessage和電子郵件以及網頁分享給他人。當然,文件的格式是USDZ。
  • Verge3D 3.2 for Maya發布
    發布時間:2020年6月24日下載地址:https://verge3d.funjoy.tech/get-verge3dVerge3D for Maya的最新版本已經發布。我們計劃近期基於此應用創建一系列新的教程。
  • 雲XR是潛在5G殺手級應用,但我們還需要……
    「5G的殺手級應用是什麼?現在看來,5G雲XR可能是最接近的。」
  • Flow-3D 的 DC 鑄造模擬方案
    Flow-3D是一個老牌的CFD軟體,起源於美國阿拉莫斯實驗室(Los Alamos National Laboratory,LANL)。
  • 咪咕音樂首個5G數位音樂超高清音質標準;華為正式開放鯤鵬全棧、昇騰全棧;英特爾推出Atom處理器|​5GAI業界資訊早班車
    此前曾有消息傳出朱松純擬入職清華,現在來看,還是北大搶得了先機。   騰訊雲發布分布式存儲系統Ozone 1.0.0近日,由騰訊雲大數據團隊主導的Ozone 1.0.0版本在Apache Hadoop社區發布。
  • 全球首款石墨烯壓力觸控傳感器及3D觸控晶片解決方案發布
    ——石墨烯Z-Touch壓力觸控傳感器及3D觸控晶片解決方案新品發布會」在深圳隆重召開。此次發布會由常州二維碳素科技股份有限公司和深圳貝特萊電子科技股份有限公司聯合推出石墨烯Z-Touch壓力觸控傳感器及3D觸控晶片解決方案,把石墨烯應變感應傳感器和3D觸控晶片應用到壓力觸控領域,形成全球首款應用石墨烯應變感應原理的3D觸控解決方案。最終產品可以應用在多種移動智能終端上,包括手機、平板、智能手錶等。
  • 曠視的智能鎖解決方案如何保障自助存儲無人倉的安全?
    藉助AI技術,曠視智慧物流方案助力儲存易迷你倉集團(Store Friendly)在寸土寸金、人力成本高昂的新加坡打造了7X24小時自助存取、空間利用率提升2倍的無人倉。作為智慧物流領域密集存儲場景下的首個案例,曠視為Store Friendly新加坡倉提供了包括曠視搬運機器人、河圖作業系統、人臉識別(FaceID)、智能安全系統、智能電子鎖具等軟硬體一體化的完整解決方案,幫助Store Friendly實現倉儲自動化和服務體驗提升。
  • 谷歌AI良心開源:一部手機就能完成3D目標檢測,還是實時的那種
    現在,拿著一部手機就能做到,還是實時的那種。這就是谷歌AI今天發布的MediaPipe Objectron,一個可以實時3D目標檢測的pipeline。分開來看:MediaPipe是一個開源的跨平臺框架,用於構建pipeline來處理不同模式的感知數據。
  • Unity C# 版的HTML5 3D遊戲解決方案正式來了
    本次發布的Project Tiny預覽版主要圍繞Tiny Racing示例項目進行開發,目的是展示用戶可以使用Project Tiny構建的輕量內容。Tiny Racing是一個完整的遊戲示例,展示了包括:接收輸入、實現簡單AI、處理碰撞等在內的眾多元素。歡迎探索和遊玩Tiny Racing示例項目,體驗完全使用DOTS進行開發的感覺。
  • 淺談3d文字技術方案
    之前在群裡一直有粉絲對我做的3d文字感興趣,今天它來了,我是如何去做的。本篇文章可能不會講太多代碼層面的東西,主要是一個技術方案從選型到最終實現中的遇到的一些問題。主要是結合自己項目做的一些思考。希望能對你有所幫助,或者是開闊眼界。
  • Verge3D Maya正式版發布-創建交互式web3d內容的利器
    /3dweb/24/)。我們很高興地宣布,Autodesk Maya用戶現在可以使用Verge3D(一款對美術友好的創建可交互web3內容的工具 )!什麼是Verge3D?Verge3D允許設計師使用Blender、3ds Max和現在的Maya創建在線體驗。可以使用Verge3D的可視化腳本編輯器——拼圖添加交互腳本,並無需任何編程代碼。
  • 夏普曠視AQUOS 8K電視正式發布 你擔心的問題都有解決方案
    昨晚,「大開眼界 夏普全球8K生態首映禮」在上海隆重召開,此次活動除了夏普首款消費級8K電視——夏普曠視AQUOS 8K電視在中國上海、中國臺灣
  • CB Insights 2019人工智慧初創企業百強榜:曠視等6家中國企業入圍
    這些公司為人工智慧應用提供了硬體和數據基礎設施、優化了機器學習流程,並在許多行業中應用人工智慧。商湯、曠視連續兩年入選,依圖、地平線等公司新晉榜單 相比去年CB Insights發布的榜單,連續兩年登榜的企業包括:商湯科技(SenseTime):專攻計算機視覺和深度學習原創技術。2014年10月成立,2017年7月宣布4.1億美元B輪融資,目前總融資超過16億美元,估值超過1B美元。
  • 星環科技:大數據全棧解決方案平臺級公司
    ▍公司簡介:中國領先的大數據全棧解決方案廠商。星環科技成立於2013年6月,創始人孫元浩曾負責英特爾Hadoop發行版研發及產品化工作,主要從事基於Hadoop分布式引擎和數據分析算法研究。Hadoop奠定現代大數據分析架構,且公司核心解決方案同樣基於Hadoop生態。Hadoop定義了最基礎的分布式大數據批處理體系,打破了傳統資料庫一體化的模式,將計算與存儲分離,並聚焦於解決海量數據的低成本存儲與規模化處理。
  • 曠視科技全面升級,用數位化AIoT作業系統加速產業融合
    這也使得,外界強化了對應曠視科技即等於人臉識別算法廠商的認知。然而實際上,人臉識別只是機器視覺AI能力一項應用,現在的曠視科技也早已悄然的將其AI能力賦能到了各行各業。因此,在今年1月,曠視科技也正式將公司的LOGO改為了Megvii。而這也標誌著曠視的全面升級。
  • 飛騰重磅發布嵌入式領域全棧解決方案白皮書,全面賦能萬物互聯
    日前,飛騰攜手生態合作夥伴發布《嵌入式領域基於飛騰平臺的全棧解決方案白皮書》,通過為各型嵌入式設備提供算力支撐和技術支持