Untouch推移動端3D手勢交互 稱視覺AI是下一個風口

2021-01-18 雷鋒網

雷鋒網按:2017年7月5日,專注於智能視覺交互技術提供商未動科技(Untouch)正式發布4款3D視覺交互產品:3D手勢識別產品——黎曼平臺,3D人臉識別產品——歐拉平臺,SLAM產品——笛卡爾平臺,及場景重建產品——高斯平臺。


在發布會開始,Untouch CEO孫錚調侃道,「今天是7月5號,都快被命名為是中國或者世界AI日了,今天一天好幾個發布會了,上午是百度(2017百度AI開發者大會),下午是阿里(智能音響天貓精靈X1的發布會),晚上又是我們。」作為低頭研發剛剛露面的科技公司,趕在同一天與大佬們一起發布產品,可以說是趕上了AI浪潮,他們卻也擔心自己的產品能不能分得聚焦於大佬產品的目光。

今天的發布會是Untouch在媒體上的首次亮相,而其實公司成立已經有3年。未動科技有限公司成立於2014年,2015年完成數百萬人民幣天使輪融資,由英諾資本及大河資本領投,2016年底完成數百萬美元Pre-A輪融資,漢能創投獨家投資。在這3年時間裡他們一直致力於技術的研發,少有在媒體露面。未動科技專注於計算機3D視覺智能交互軟硬體方案,基於自主研發的智能3D視覺交互算法,例如3D手勢識別、3D人臉識別、運動追蹤(SLAM)、場景重構等,賦予新型消費級智能設備與人、與場景的視覺交互能力。

黎曼平臺——手機手勢交互產品

黎曼平臺基於深度圖,實現3D手勢交互功能,可以為智慧型手機、機器人/無人機、AR/VR等提供手部26自由度追蹤與識別。據介紹,傳統的手勢識別對每一幀的手勢圖像進行獨立分析,而Untouch採用曾成功應用於機器翻譯的深度學習算法LSTM(Long Short-Term Memory),把手勢動作當做一個時間序列來處理,提高了識別精度與運算效率。

另外,黎曼平臺考慮到移動端的功耗與運算性能等限制性因素,經過深度算法裁剪與大量工程優化,使得3D手勢識別可以流暢精準地運行在手機等行動裝置上。傳統手勢識別產品基於PC,黎曼平臺是一款基於深度攝像頭並可運行在手機等行動裝置上的手勢識別產品。

小型化、嵌入式的3D手勢識別產品使手勢交互植入行動裝置,這是目前顯而易見的一個大的趨勢。雷鋒網(公眾號:雷鋒網)了解到,蘋果正在測試iPhone8的手勢識別功能和3D人臉識別功能,這將引爆移動端的交互方式。

語音之後,視覺AI是下一個風口?

未動科技的3D視覺智能交互軟硬體方案不僅使得手勢交互從PC端轉移到了移動端,帶來行動裝置交互的更多可能,視覺智能還有更多可以發展和應用的方面。發布會還推出了另外三個3D視覺平臺,能實現3D人臉識別的歐拉平臺,其基於深度圖,實現人臉的實時建模與3D特徵識別,實現人臉3D表情的實時追蹤、識別與分析。除了身份識別驗證與表情分析,笛卡爾平臺還可以讓用戶建立自己的頭像,體驗更有趣、好玩的社交體驗。運動跟蹤(SLAM)的笛卡爾平臺實現空間計算與位置追蹤功能,可以為智慧型手機、機器人/無人機、AR/VR等提供6 DoF inside-out位置追蹤、路徑規劃軟硬體解決方案,釐米級別精度、低延遲、低功耗,為智能設備創造更多應用場景。場景重構的高斯平臺基於深度攝像頭與RGB攝像頭,實現實時的空間計算,重建與渲染出真實的物理場景結構,從而實現障礙物躲避、AR追蹤、三維重建等功能,為計算設備的判斷與決策提供三維場景信息。

這些都是依靠視覺AI來實現的。亞馬遜的Echo和阿里的天貓精靈X1智能音響做的都是語音AI,而未動科技的出發點是視覺交互。孫錚介紹道,「我們做這些3D視覺軟硬體產品都是想為設備提供視覺感知,現在的智能產品越來越像人,人的特點就是感知。AI一定要有感知,要跟Sensor結合。AI要麼是基於聽覺的,要麼是基於視覺的,是因為人有這些感知。這是為什麼我們這次和PMD合作,他是一個Sensor的晶片廠商。只有抓住了sensor,才能去生產大腦。」

聯合專注3D傳感器廠商PMD

PMD是一家無晶圓廠IC公司,公司位於德國西格根與美國聖何塞,是全球領先的基於CMOS的3D飛行時間數字圖像技術供應商。創立與2002年,公司擁有涉及ToF的應用程式、測量原理與實現方法的全球150個專利,PMD的3D傳感器的應用主要包括工業自動化、自動駕駛、以及廣闊的消費電子領域例如AR/VR。全球第一款Tango手機聯想Phab2上的深度傳感模塊就是PMD所提供。華碩最近推出的Tango&Daydream手機ZenFone的深度傳感技術也來自於PMD。

專注ToF深度傳感器廠商PMD宣布,選擇Untouch的黎曼平臺作為中間件為客戶提供非接觸式的交互方案,雙方深度合作,推出了完整的手勢識別軟硬體一體方案。PMD總裁 Bernd Buxbaum表示:「我們非常激動能夠與Untouch緊密合作,有了Untouch提供的先進3D手勢識別技術,我們可以為移動終端設備提供直觀的、非接觸式的交互體驗。我們堅信,通過兩個公司的緊密合作,能夠加速手勢交互的大規模普及。」

新的交互方式帶來新的交互體驗。在《數位化生存》一書中,尼葛洛龐帝指了我們的數位化生活的發展趨勢,並不是更豐富的數據,更清晰的圖像,而是更自然的人機互動。例如,他認為,電視所要追求的並不是更高的清晰度,數位化電視引起的電視生產和消費的模式的變化才是更值得追求的。在「虛擬實境」這一章,他認為圖像的更新速度比圖像的解析度更為重要,我們對於圖像的感知不僅僅是視覺的,還與其他感官緊密相連,我們的運動神經會影響圖像的感知。目前,「計算機對人的存在的感覺真是遲鈍……很可能在不久的將來,計算機就能看到你「。他認為,未來的個性化界面能識別人的聲音,表情,手勢,還能追蹤人的眼球。對於各類消費電子來說,智能視覺交互技術會帶來更加自然友好的體驗。

數學家團隊

雷鋒網注意到,Untouch的核心團隊裡不少數學家。他們發布的幾個3D視覺平臺的名字:歐拉、笛卡爾、高斯這些都是著名數學家的名字。CEO孫錚有跨國高科技企業17年工作經驗,歷任微軟中國移動事業部總經理,中興芬蘭分公司總經理,中興西歐區副總經理,愛立信瑞典高級系統工程師,瑞典計算機研究所研究員,曾帶領中興西歐銷售團隊在4年間實現從0到10億歐元銷售額的突破。他也是全國數學奧林匹克競賽獲獎者,發現的數學定理被國際數學權威著作命名為「孫氏定理」。團隊其他成員由世界頂尖的計算機視覺、深度學習、嵌入式系統領域的專家組成,來自於微軟、中科院、清華、北大等公司或研究機構。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • Untouch聯合廠商PMD全球推廣移動端3D手勢交互
    Untouch聯合廠商PMD全球推廣移動端3D手勢交互 2017-07-06 11:50:16來源:中國新聞網作者:${中新記者姓名}
  • 國內AI創業公司Untouch聯合德國PMD發布移動端3D視覺...
    日前,彭博社和蘋果供應商臺積電透露稱,蘋果正在測試iPhone8的手勢識別功能和3D人臉識別功能。而手勢識別(Gesture recognition)作為滑鼠、鍵盤、觸控螢幕之後極具想像力的人機互動方式,有望成為VR/AR、機器人等新一代終端的必須之選。
  • 未動科技Untouch牽手PMD 發布全棧智能3D視覺解決方案
    2017年7月5日,國際領先的智能視覺交互技術提供商Untouch(未動科技)正式發布4款3D視覺交互產品:3D手勢識別產品——黎曼平臺,3D人臉識別產品——歐拉平臺,SLAM產品——笛卡爾平臺,及場景重建產品——高斯平臺。
  • 未動科技獲英諾天使等數百萬美元投資 致力3D視覺交互
    此次3D手勢交互軟硬體方案的推出,必將促進自然人機互動的快速發展。PMD總裁Bernd Buxbaum表示:「我們非常激動能夠與Untouch(未動科技)緊密合作,有了Untouch(未動科技)提供的先進3D手勢識別技術,我們可以為移動終端設備提供直觀的、非接觸式的交互體驗。我們堅信,通過兩個公司的緊密合作,能夠加速手勢交互的大規模普及。」
  • 本周大新聞|Niantic要打造3D世界地圖,首個手勢FPS VR遊戲
    VR方面,德國VDC實測多款VR頭顯FOV,測試結果與官方宣城差距較大;SuperData報告,Quest 1在本季度銷量達16.1萬臺;Facebook VR辦公應用Infinite Office或推遲到明年;Oculus發布開發者檢查工具;微軟發布WMR設備視覺提升更新;bHaptics推出消費者版VR體感背心;首個基於手勢的FPS VR遊戲《Finger
  • 新商業NEO100|凌感科技費越:自然手勢交互好比iphone的自然觸摸,正...
    在當下正在發生的汽車產業變革中,費越相信凌感科技的自然手勢交互可以幫助下一代汽車具有劃時代的信息娛樂能力,從而徹底實現「信息就在指尖之上」的自由體驗。他始終認為,人類是生活在一個三維的世界中,人類和世界最自然的交互是三維的,因此人類與電子世界最自然的交互,也應該是三維的,所以「未來手勢將會是三維人機互動中的不可缺少的一部分」。基於這樣的相信,在整個大勢爆發之前,他和凌感科技願意最早跳到時代的洪流中,去推動這些事情的發生。當初基於何種判斷,創立了uSens凌感科技?
  • 這就是未來三大AI交互技術!
    而科技話題繞不開人工智慧,智能家居、自動駕駛、智能安防……它革新了人機互動方式,升級了人機互動體驗,重構一個"人、工具、場景"的新世界,敲開了物聯網時代的大門。
  • 深蘭科技創始人陳海波:新零售的下一個風口就是移動零售
    他指出,做零售就是讓場景無限趨近於人,且新零售的下一個風口就是「移動零售」。陳海波介紹稱,深蘭機器人在常州擁有幾十萬的工廠,零售升級做了幾個領域,包括教育、智慧城市、安防、視覺,根據車流實時調整紅綠燈的時間,這些都是深蘭目前在做的。同時,陳海波還表示,深蘭去年殺入新零售,零售的場景很大,用機器視覺識別商品、識別人,深蘭已經成為零售領域的行業軍火商。
  • 4米以內實現遠程手勢控制!谷歌AI新研究讓你拋掉鍵鼠操控屏幕
    在行動裝置上實時、同步地感知人體姿勢、臉部標記和手勢跟蹤等可以實現各種有趣的應用,例如健身和運動分析、姿態控制和手語識別、擴增實境效果等等。谷歌的MediaPipe 是一個開源框架,專門為複雜的感知管道設計,利用加速推理(例如 GPU 或 CPU) 等已經為這些任務提供了快速、準確、獨立的解決方案。
  • 從風口引領者變成AI跟隨者:小米在雪崩時代的技術攀爬
    而在AI這個風口,小米的加入明顯是要慢一拍的。榮耀在2016年推出概念性「未來手機」榮耀magic,實驗主動服務與智能交互模式之後,又在2017年推出了搭載AI專項處理器NPU的榮耀V10。由於移動晶片等核心技術的難以複製性,很多評論者認為,收穫華為龐大的技術研發體系紅利的榮耀,已經在AI領域甩開了網際網路手機產業半年的時間差。
  • 愛奇藝智能推出新一代VR產品奇遇3 發布國內首個CV頭手6DoF VR交互...
    1 月 6 日,愛奇藝旗下獨立運營的科技企業愛奇藝智能推出了新一代 VR 產品 「奇遇 3」,並發布了國內首個 CV(計算機視覺)頭手 6DoF VR 交互方案。同時,愛奇藝智能還宣布開啟一個全球 VR 開發者招募計劃 「哥倫布計劃」,以募集全球開發者,發力遊戲內容。
  • 十點讀書林少:錯過了這個風口就抓住下一個
    尤其在微信平臺的賦能下,公眾號閱讀已經從一個小眾產品衍生成眾多IP企業的孵化器。而公眾號閱讀平臺就是林少早期抓住的第一個風口,十點讀書公眾號應運而生。隨後,在2016年,林少搭上了知識付費的順風車;2018年,十點讀書在廈門開了第一家線下書店。從微信公眾號增長到知識付費、電商、線下書店、2020年又新增了聽書會員,林少都是在緊抓風口,借勢而為。然而,「臨風而立」的林少,也有錯過新風口的時候。
  • 擁抱手勢驅動的界面設計 | 網際網路數據資訊網-199IT | 中文網際網路...
    作為一名移動產品的視覺或用戶體驗設計師,你也許覺得Apple發布iPhone仿若昨日。iPhone無疑為最個人、最私密的設備開啟了一個全新以觸控螢幕為中心的交互時代,是當之無愧的遊戲規則創建者。
  • 《樂比成長記》推「虛擬形象3D直播」 動漫童星小樂比即將出道
    隨著智慧型手機逐漸普及、移動數據流量消費成本降低等諸多因素作用下,網際網路移動端應運而生,從而衍生出的電商平臺、團購平臺、支付平臺、各類APP進入了快速發展階段。尤其是2020年特殊的開年方式,讓風靡全球的網絡直播成為了人們生活中不可或缺的一部分。
  • 花椒直播推互動手偶虛擬3D玩法再進一步
    過去幾年裡,花椒直播逐步建立了移動視頻直播的全新交互模式,以深厚的技術儲備和產品研發作為基礎,對內容進行持續創新,在泛娛樂直播界保持領跑者的地位。  個性手偶玩法上線,加強互動體驗  花椒直播的手偶功能由AI視覺技術驅動,有多重動畫形象可供選擇。主播可以在直播過程中,選擇美化-手勢魔法選項,點擊第三行的萌寵按鍵,打開手偶功能。
  • 〔Part 3〕Oculus Quest手部交互指南之互動設計
    1. 5系統控制選項抽象手勢:抽象手勢是特定的手勢動作,可用於導航系統和操縱對象。你可能已經從科幻影視作品中看過未來版本。儘管它們對於提供抽象功能非常有用,但抽象手勢存在一定的缺點:抽象手勢難以學習,記憶和跟蹤選擇用戶不會意外執行的手勢可能非常困難,並可能會導致意外觸發請務必注意手勢在不同文化背景中的含義,以免出現不當或褻瀆行為。我們建議你謹慎使用抽象手勢,並轉而應使用模擬控制項來操縱大多數虛擬界面和對象及與之交互。
  • iPad Pro交互新徵程:初探妙控鍵盤觸控板帶來的手勢新體驗
    外媒MacRumors在最新上傳的視頻中,將運行iPadOS 13.4的iPad Pro和蘋果的Magic Trackpad 2附件進行了配對,提前體驗了下觸控板新功能。可以通過iPad上「設置」應用程式的「藍牙」部分將藍牙觸控板或滑鼠配對,其中有一些設置需要調整,例如調整光標速度和啟用「tap to click」。
  • YOLO-v4目標檢測實時手機實現,全自動實時移動端AI框架
    讀者可點擊以下連結,觀看手機端實現的更多 AI 任務展示:官方網站:https://www.cocopie.ai/B 站:https://space.bilibili.com/573588276接下來,我們來看論文的詳細內容。
  • 百度世界2020 百度語音首席架構師賈磊詳解端到端語音交互技術
    在語音識別層面,百度推出端到端信號聲學一體化建模的技術,語音合成方面,最新的Meitron和單人千面合成個性化技術亮相。同時交出了百度語音技術最新成績單:日均調用量超過155億次,廣泛應用在移動端、智能家居、和語音IoT等場景,智能語音產業化成果豐碩。
  • CVPR 2020 | 京東AI研究院對視覺與語言的思考:從自洽,交互到共生
    這裡每一種文化最初的進化都是自洽的,即獨立地演化形成一套完備的視覺理解或語言建模體系;演化至今,我們當前所迎來的則是兩種文化間的交互,自此視覺理解和語言建模不再是簡單串聯的兩個模塊,而是通過互相的信息傳遞成為共同促進的一個整體;對於視覺與語言的未來,則一定是聚焦於兩者更為本質和緊密的共生,它所渴望的,將是掙脫開數據標註的桎梏,在海量的弱監督甚至於無監督數據上找尋兩者間最為本質的聯繫,並以之為起源,如