AR屬不屬於人工智慧?看完本文你就懂了

2020-12-06 千家智客

[導讀]AR和人工智慧之間到底是什麼關係?AR屬不屬於當下我們認知中的人工智慧?

  AR/VR常作為孿生兄弟被相提並論,被普遍認為為應用層新技術或者說是「智能可穿戴設備」,相比人工智慧相對的「算法」標籤,顯得不夠有深度有內涵高大上,那AR和人工智慧之間到底是什麼關係?AR屬不屬於當下我們認知中的人工智慧?

  2018年3月,上海市經濟和信息化委員會公示了2018年第一批本市人工智慧創新發展專項擬支持項目。「一共有19家創新企業入圍,亮風臺作為AR公司也入圍此次支持項目」亮風臺工作人員告訴青亭網,這不是AR企業第一次被劃歸到人工智慧,但這種歸類方式也並不常見。據了解此專項由經信委與市財政局聯合開展,擬支持金額超過1億。

  簡單梳理下AR的核心技術

  AR(Augmented Reality),是在現實世界中疊加虛擬信息,也即給現實做「增強」,這種增強可以是來自視覺、聽覺乃至觸覺,主要的目的均是在感官上讓現實的世界和虛擬的世界融合在一起。

  其中,對現實世界的認知主要體現在視覺上,這需要通過攝像機來幫助獲取信息,以圖像和視頻的形式反饋。通過視頻分析,實現對三維世界環境的感知理解,比如場景的3D結構,裡面有什麼物體,在空間中的什麼地方。而3D交互理解的目的是告知系統要「增強」的內容。

  圖.典型AR流程

  這其中有幾個關鍵點:

  首先是3D環境理解。要理解看到的東西,主要依靠物體/場景的識別和定位技術。識別主要是用來觸發AR響應,而定位則是知道在什麼地方疊加AR內容。定位根據精度的不同也可以分為粗定位和細定位,粗定位就是給出一個大致的方位,比如區域和趨勢。而細定位可能需要精確到點,比如3D坐標系下的XYZ坐標、物體的角度。根據應用環境的不同,兩種維度的定位在AR中都有應用需求。在AR領域,常見的檢測和識別任務有人臉檢測、行人檢測、車輛檢測、手勢識別、生物識別、情感識別、自然場景識別等。

  在感知現實3D世界並和虛擬內容融合後,需要以一定方式將這種虛實融合信息呈現出來,這裡面需要的就是AR中的第二個關鍵技術:顯示技術, 目前大多數的AR系統採用透視式頭盔顯示器,這其中又分為視頻透視和光學透視,其他的代表有光場技術(主要因Magic Leap而顯名)、全息投影(在科幻影視劇作品中常出現)等。

  AR中的第三個關鍵技術在於人機互動,用以讓人和疊加後的虛擬信息互動,AR追求在觸摸按鍵之外自然的人機互動方式,比如語音、手勢、姿態、人臉等,用的比較多的語音跟手勢。

  人工智慧和AR的技術關聯

  在人工智慧領域有幾個概念常被提及,如深度學習(DL)、機器學習(ML),在學術領域包括人工智慧(AI)在內幾大領域均有自己的研究界限,而在普遍意義上,我們常說的是泛意的人工智慧,涵括所有「讓機器像人一樣」的技術的應用方向。

  從這張圖也可以簡單一窺三者的關係,深度學習是實現機器學習的一種技術方式,而機器學習是為了讓機器變得智能,去達到人工智慧。可以說人工智慧是最終目標,而機器學習是為了實現這個目標延伸出的一個技術方向。在這其中,還有另一個重要概念為計算機視覺(CV),主要來研究如何讓機器像人去「看」,是目前人工智慧概念中的一個重要分支,這也是因為人類獲取信息最主要的方式之一就是視覺,目前計算機視覺已經在商業市場發揮價值,比如人臉識別;自動駕駛中讀取交通信號和注意行人以導航;工業機器人用來檢測問題控制過程;三維環境的重建圖像的處理等等。這些概念既有區分也有一定範圍的重疊。

  其中,2006年開始,Hinton引發的深度學習熱潮開始蔓延,在一定程度上帶動了AI的又一次崛起,十年中,在包括語音識別、計算機視覺、自然語言處理在內的多個領域取得重大突破,並向應用領域延伸,正發展的如火如荼。

  在AR的核心技術中,3D環境理解、3D交互理解和計算機視覺、深度學習都有著緊密的聯繫。3D環境理解在學術界裡主要對應的是計算機視覺領域,而近年來深度學習在計算機視覺中得到廣泛應用。交互方面,更趨自然的交互方式如手勢和語音在硬體終端的使用,得益於近幾年深度學習在相關領域的突破。也可以說,深度學習在AR中應用主要在視覺關鍵技術。

  目前,AR最常見的形式是2D圖片掃描識別,如騰訊QQ-AR火炬活動、支付寶五福等多數AR營銷中所見,用手機掃描識別圖出現疊加的內容,但主要的研發方向還在3D物體識別和3D場景建模。

  現實的物體是以3D形態存在的,有不同的角度和空間方位。所以一個自然的擴展就是從2D圖片識別到3D物體識別,識別物體的類別和姿態,深度學習可以用在這裡。以水果識別為例,識別不同類別的水果,並且給出定位區域,即集成了物體識別與檢測的功能。

  3D場景建模,從識別3D物體擴大到更大更複雜的3D區域。比如識別場景裡面有哪些東西、它們的空間位置和相互關係等等,這就是3D場景建模,是AR比較核心的技術。這其中涉及目前熱門的SLAM(實時定位與地圖構建)。通過掃描某個場景,然後在上面疊加虛擬戰場等三維虛擬內容。如果只是基於普通2D圖像識別就需要有特定的圖片,而在圖片不可見時會識別失敗。而在SLAM技術裡面,即使特定平面不存在,但是空間定位依然非常精確,就是因為有周圍3D環境的幫助。

  這裡想探討下深度學習和SLAM技術的融合,計算機視覺大體上可以分兩個流派,一種基於學習的思路,例如特徵提取-特徵分析-分類,目前深度學習技術在這一路線上取得了主導性的地位。另外一種路線是基於幾何的視覺,從線條、邊緣、3D形狀推出物體的空間結構信息,代表性的技術就是SFM/SLAM。基於學習的方向上深度學習基本上一統天下,但是在基於幾何視覺的領域,目前相關的進展還很少。從學術界而言,深度學習技術的研究進展可以說日新月異,而SLAM技術最新十年的進展相對較少。在國際視覺頂級會議ICCV 2015年度組織的SLAM技術專題討論會上,基於近年深度學習在視覺其它領域的快速發展,有與會專家曾提出SLAM中採用深度學習的可能性,但是目前還沒有成熟的思路。總體而言,短期內將深度學習和SLAM融合是一個值得研究的方向,長遠來看聯合語義和幾何信息是一個非常有價值的趨勢。因此,SLAM+DL值得期待。

  在交互方式方面,主要的包括語音識別和手勢識別,語音識別在目前已經取得了較大進展,國內如百度、科大訊飛、雲知聲等都是其中的佼佼者,AR公司更想突破的是手勢識別的成熟商業化。

  「亮風臺展示過的一款基於深度學習的手勢識別系統,主要定義了上下左右、順時針、逆時針六種手勢」亮風臺工作人員告訴青亭網,先實現人手的檢測和定位,然後通過識別相應的手勢軌跡來實現對人手勢的識別。雖然人臉識別等其他人工智慧熱門領域在AR中也有使用,但不是AR公司重要的研發方向。

  以上不難看出,AR的底層技術或者說基礎部分是計算機視覺以及關聯領域的融合,而當下熱門的深度學習和AR的結合,也是算法工程師們的努力方向。這也是AR為計算機視覺與人機互動的交叉學科,AR的基礎是人工智慧和計算機視覺等說法的依據。

  圖:計算機視覺與AR流程關聯

  在去年今日頭條發布的《人工智慧影響力報告》中也簡單統計了人工智慧科學家的分布情況,這其中包括人臉識別、語音識別、機器人、AR、晶片等領域的公司與大型研發機構,高端研發人員的分布也說明了AI領域的細分方向。

  那AR究竟是不是人工智慧?

  對AR從業者來說,理想的狀態是用更智能的AR終端去取代智慧型手機,所以對於用戶來說接觸使用AR首先受影響的是內容,其次是終端,AR產業鏈可以粗略劃分為技術提供商、智能終端研發公司,以及AR內容提供商。在這其中,AR設備提供商不可避免關注硬體技術,如底層的晶片、電池、光學鏡片等,以及硬體本身的性能優化,而內容提供商更傾向於在現有技術基礎上優化內容及表現。所以我們可以說AR技術提供商,或者說在底層算法研發上有一定成績的AR公司是人工智慧公司。

  對公司來說,特別是創企會把底層技術轉化為成熟的產品或服務,這可能是如無人機、AR智能終端、機器人等,也可能是行業解決方案,以達到商業目的,並且這已經成為在沸騰聲音之後,媒體、企業以及大眾對AI企業的期待和要求。近期,人工智慧產業發展聯盟(AIIA)出版的圖書《人工智慧浪潮:科技改變生活的100個前沿AI應用》將對外發布,以及涵括了目前巨頭公司以及創企在商業化上的前沿成果,也直接反映了AI目前的主要商業化方向。

  作為技術驅動的商業領域,無論是AR還是人工智慧的其他多數方向,技術距離完全成熟還有很長的路程要走,在整個產業鏈逐漸繁榮,關注商業化實現的同時,也需要有更多公司機構去不斷拓展技術邊界,建立核心競爭力,讓行業爆發更大的價值與潛力,如此,AI時代中國彎道超車當可期。

相關焦點

  • 【討論】AR你懂我的意思吧 一起來捉妖
    而在pokemon go遊戲熱爆全球的時候,ar遊戲也開始進入新的紀元,開發這個遊戲的公司也因此賺得滿盆頗豐,ar遊戲市場還是很有潛力的。接下來小編就來給大家盤點ar遊戲,好玩又有趣。Pokemon Go:點開手機上的《Pokemon Go》,手機攝像頭實時拍攝的現實畫面中,便會出現皮卡丘、小火龍、比比鳥、傑尼龜等寵物小精靈形象。
  • 顯卡天梯圖2018年5月 版 看完秒懂顯卡
    顯卡天梯圖2018年5月 版 看完秒懂顯卡時間:2018-05-07 09:38   來源:電腦百事網   責任編輯:沫朵 川北在線核心提示:原標題:顯卡天梯圖2018年5月 版 看完秒懂顯卡 每月本站都會帶來CPU和顯卡天梯圖,由於新顯卡的誕生和顯卡性能優化,使得每月更新天梯圖顯得非常重要。
  • 九寨溝的湖水為何是藍色的,看完原因,你懂了嗎?
    九寨溝的湖水為何是藍色的,看完原因,你懂了嗎?秋天它的風景是無限美麗的,它的色彩給我們印象很醉人,如果說哪個季節的風景是最為美麗,小編覺得,沒有人遇到過比九寨溝更美麗、更讓人沉醉的地方。這裡,我們來看看九寨溝看水一些奧秘吧。
  • 看完謝安然的lo裝你就懂了
    其實,看完謝安然的lo裝你就懂了。有的萌新可能不太了解謝安然是誰,她是一個歌手,曾在今年參加了女團的選秀節目《創造營2020》,但更是洛麗塔圈內一位比較著名的模特,非常多的小姐姐都是看了她的高質量洛麗塔照片後才紛紛入「坑」的,從另一個角度來說,她也為洛麗塔在中國的發展做出來一定程度的貢獻,讓很多女生都知道了洛麗塔這種精緻又好看的服飾。
  • 天才華裔數學家陶哲軒的邏輯難題,看本文你也能懂
    天天科幻大片裡人類被人工智慧消滅幾百遍,是不是讓你惶惶不得終日?我這裡有一個好消息要告訴你,人類目前能製造出的計算機在邏輯上存在先天缺陷,無論算力怎麼強大都不可產生意識。因為它的運算規則是建立在自然數的基礎之上的,這個數學體系叫「一階謂詞邏輯」,而這個邏輯是不完備的,於是它不能解決自己體系內的全部問題,自然就不能擴展向高階,而人類的意識就是一個高階系統。
  • 看完這篇文章你就懂了!
    最近第五人格官方終於公布了新求生者勘探員的技能介紹,這個角色主要的功能就是使用天外隕石製作的磁鐵來攻擊和躲避監管者的,不過說實話官方對於新角色技能的描述每次基本都是一樣的,玩家單獨看每一個字都能看明白,但是這些字連到一起就完全不知道是什麼意思了。
  • 看完本文就全懂了!
    (4)作葉面肥用:複合肥按比例溶化後,取上清液在下午4點後噴灑在葉子的正反面,24小時就能吸收完,隔5~7天噴一次見效快。 7、肥料混合施用需要注意哪些問題 (1)肥料混合後,肥料的物理性狀不能變壞,為的是便於施用。
  • 看完《攻殼機動隊》來聊聊人工智慧的發展
    我們不禁要問:劇中半人半機器的「智能生命體」與我們日常提到的人工智慧究竟有哪些差距?人工智慧到底是個啥?到底它距離我們還有多遠?接下來,就讓我們一起來聊聊關於人工智慧AI那些事兒。黑科技or噱頭?看'攻殼機動隊'聊人工智慧●腦子是個好東西:連機器也需要一直以來,關於人類大腦的探索就沒有停止過,比如人腦細胞是不是真的有140——160億?
  • 明日方舟:雪雉強不強 看完這個你就懂了
    明日方舟:雪雉強不強 看完這個你就懂了 來源:www.18183.com 作者:曉鏑 時間:2020-02-07 明日方舟雪雉怎麼樣
  • 看完你就懂了
    看完你就懂了現在呢,隨著日常生活水平的提高,然後呢,每家每戶都有了一輛屬於自己的小汽車,汽車多了,車禍也多了,而造成車禍的原因呢,也是各種各樣的,據說最大的原因就是超速了,於是全國上下的交管部門都現在針對汽車超速進行了專項嚴打。很多交管部門開始給各種公路進行了限速的管理,一般高速公路通常限速就是100~120千米,而一些高級的公路限速就是60~80千米每小時。
  • 古力搭檔AlphaGo最怕看不懂 人工智慧讓職業棋手變少
    古力表示:和AlphaGo搭檔比賽,最怕看不懂搭檔的招法,而在人工智慧的影響下,未來職業棋手的數量一定會變少。  ——有關配對賽。  ——「把自己定位成一個學生的態度會比較好一點,有些招我怕我會看不懂它,因此一定會有點微調,否則就被帶到溝裡去了。我們對AlphaGo的了解還是太少,就希望它下棋我能看懂,那就可以了。
  • 有幾部關於人工智慧的電影推薦給你看
    究竟未來人工智慧會發展成什麼樣,譯言菌為大家特意挑選出10部與人工智慧相關的電影,影片中有的將人工智慧描述為令人畏懼的殺手,有的則是呆萌可愛的人類助手。雖然差異頗大,但它們都無一例外都是導演們對人工智慧的發展進行了大膽設想,當然有些甚至已經部分地成為了現實。
  • 10年經驗老師傅教你看懂房屋施工圖,看完就懂
    一頭霧水……這裡不用擔心,10年經驗老師傅教會你怎麼看房屋施工圖,看完秒懂,這裡就跟著樓主一起學習吧!具體如下:三、房屋施工看圖步驟1、先看首頁設計說明,了解整個施工概況2、在看建築施工圖,結構施工圖,設備施工圖。3、對照圖樣的圖標、文字、圖形、尺寸依次進行4、先平、立、剖面圖,後詳圖5、先基礎施工圖、結構平面圖,後構件詳圖。
  • Spark AR 統整特效發布
    本文轉載自【Facebook開發者】公眾號,無論您想增加下載量、提升用戶留存,還是想讓應用程式變現,Facebook 平臺都有能助您一臂之力的工具和解決方案,歡迎大家關注。
  • 今日起,有關AI/AR/VR/MR的知識你一定要知道
    無論你現在從事什麼行業,做著什麼工作,有關於AI/AR/VR/MR這幾個黑科技名詞,你一定要好好弄清楚,因為前沿科技越來越受到我們的關注和熱議,可別在跟朋友聊天時因為分不清AI/AR/VR/MR到底是什麼內容而出糗,那就真的尷尬了…… 下面我們就來好好科普一下這幾個縮寫名詞AI/AR/VR/
  • 有人不了解,看完懂了,你會吃石榴籽嗎
    有人不了解,看完懂了,你會吃石榴籽嗎金秋十月,正是吃石榴的季節,你知道石榴的來歷嗎?石榴本是西域的水果,後來在漢朝進貢時傳入中國,說來也有2000年的歷史了。石榴汁水甘甜,略帶酸味,富含維生素和多種微量元素,美味與營養價值並存,是飽受人們喜愛的水果。
  • 你家小汽車為什麼開著會飄?虛擬風洞完全圖解繞流機理,看完就懂
    不,是你不還夠快。本文將針對典型小汽車的氣動外形就行虛擬風洞吹風試驗,完全圖解汽車行駛過程中的氣流繞車身流動情況,讀完本文,你將可以從專業角度解釋諸多汽車行駛現象,乾貨滿滿,敬請收藏轉發。模擬風洞完全圖解,看完就懂}那麼,實際上汽車在高速前行時候,繞車身的氣流流動速度是怎麼變化的呢?請看流場速度圖。車身繞流的漩渦運動在氣動研究中,工程師們更關注的是漩渦運動。
  • 看完吹風機演示你就懂了
    看完吹風機演示你就懂了。其實這主要跟飛機的結構設計有關。今天介紹的景點有沒有讓你感到心動呢?是不是迫不及待就想現在收拾行李出發了。不感興趣的也請評論一下想看的內容吧,說不定下期就是你想看的內容呢!好了,本期節目就到這裡了,我們下期內容不見不散!
  • 看完才懂了
    看完才懂了 2020-11-20 12:31 來源:科技看天下看完才懂了 返回搜狐,查看更多 責任編輯: 聲明:該文觀點僅代表作者本人,搜狐號系信息發布平臺,搜狐僅提供信息存儲空間服務。
  • 電解電容極性接錯會爆炸,如何避免,看完這篇文章你就懂了
    電解電容極性接錯就會發生爆炸,如何避免正負極接錯,看完這篇文章你就懂了。避免一:電解電容正負極判斷(1)外觀辨別首先拿出一個電解電容,第一種方法是看電解電容膠管,膠管一端印有負極的標示。另外一端正極則不表示。第二種方法是看電解電容引腳。