如果用負責表達和獲取信息的眼耳口鼻來比喻「語音技術」,那麼「語義技術」就相當於人的核心大腦,在整個學術界乃至可預見的未來,語義理解技術都將以「多模態化」走下去。
文丨獵雲網 ID:ilieyun
作者丨奇點 編輯丨輕音如果用負責表達和獲取信息的眼耳口鼻來比喻「語音技術」,那麼「語義技術」就相當於人的核心大腦,在整個學術界乃至可預見的未來,語義理解技術都將以「多模態化」走下去。在人機互動技術方面,目前業界仍在進行多方面的探索和嘗試,在人機互動的技術分類中包括:基本交互技術、圖形交互技術、語音交互技術及體感交互技術等。其中語音交互技術不僅在AI中是重中之重,在智能語音上也扮演者重要的角色。目前智能語音在個人市場、行業領域的應用場景也得到了快速擴展,用戶對相關語音產品使用時長及粘性也明顯提升。其主要領域涵蓋了教育、汽車、醫療、家居、客服、手機、個人語音助手等多個領域。而個人語音助手被產業界視為潛在的用戶流量入口,包括科技巨頭、新興廠商均全力布局於此,但就及整個智能語音技術來說,其自身也面臨著難以突破的技術瓶頸:語義理解技術。從語言的本質來講,語言的開放性使得計算機難以準確理解人類語言所表達的真實意圖,這也造成了相應的落地產品在應對需要邏輯驅動的功能層面表現較為乏力。而在人機互動領域中,不乏許多以垂直領域和細分場景為突破口的後起之秀,據獵雲網了解,深思考人工智慧機器人科技有限公司(簡稱:深思考)便是其中一個值得借鑑的案例。深思考是一家專注於類腦人工智慧與深度學習核心科技的AI公司,核心團隊由來自中科院、清華的一線AI科學家與領域業務專家組成。公司核心技術聚焦於「多模態深度語義理解與人機互動技術」,目前在中文語義理解、多輪人機互動和機器閱讀理解方面均取得突破。同時近日華為旗下的哈勃科技投資有限公司也向深思考「拋出繡球」,據天眼查顯示:華為旗下哈勃科技投資有限公司投資了深思考。能夠吸引到華為這種「大廠」的青睞,一方面,說明華為的人工智慧生態正在逐步構建;另一方面,也說明深思考在人工智慧的某一領域應該擁有著絕對核心競爭力。就目前從整個AI產業界來看,最早實現產業化的是語音識別,接著是視覺、圖像識別,最後才到語義理解,在語義理解技術中,同行的大部分友商基本還停留在單模態化——即圖像、文本、語音不能同時兼顧的技術狀態下。而在這方面,深思考將全部的力量集聚在「多模態深度語義理解」上,此引擎技術可讓機器能夠同時理解文本、圖像視覺等多模態非結構化數據背後的深度語義。如果用負責表達和獲取信息的眼耳口鼻來比喻「語音技術」,那麼「語義技術」就相當於人的核心大腦。對於多模態深度語義理解技術,深思考將其視為傳統語音、圖像識別的進一步理解和融合。在整個學術界乃至可預見的未來,語義理解技術都將以「多模態化」走下去,深思考此次也正是走在了語義理解發展的最前沿道路上。一方面,深思考不斷打磨多模態語義理解技術的多場景落地,整體戰略布局緊扣人、車、家三大模塊,研發了智慧醫療、智慧汽車、智慧生活、智慧型手機等解決方案,涉及從AI醫療到智能家居等多個應用場景。據深思考創始人&CEO楊志明透露:「一個能讓AI真正落地的場景,其實是貼近了我們的日常生活」。事實上,若只用App去遙控開窗簾、關燈,這種傳統的智能家居並未能解決人們的剛需,也並不是每一個家庭都需要一個智能音箱,家庭中真正需要的是一個虛擬的「中央語義理解大腦」。傳統的人機互動在對話體驗感上是遠遠不夠的,是因為這種簡單的語音指令只能「聽的見」,由於在語義理解上的缺失,還未能做到真正理解特定場景下用戶的意圖。但深思考通過多模態深度語義理解技術,在智能家居場景下,通過與用戶進行「人性化的交互」,真正可以理解用戶在家庭中的語義娛樂、生活健康、膳食營養等實際需要,這好比一個家庭中央的AI服務。另一方面,深思考將深度語義理解技術應用於智慧醫療領域,開發iDeepWise.AI4.0宮頸癌輔助篩查系統,實現了大規模醫療篩查場景中AI的落地應用。宮頸癌篩查的重點是在數量繁多、形態各異的細胞中識別出具有診斷意義的異常細胞,深思考通過「多模態深度語義理解」,綜合分析單個細胞特徵和細胞間的關聯性,有效提升了異常細胞的識別準確率。據獵雲網了解,楊志明曾在「2019WISE超級進化者」大會上表示:「這就是語義理解,就是我能看懂這句話及這個圖像背後的含義。其次,他在汽車領域也打造了一個「智能場景」,為汽車配置了一個深度語義理解的大腦。推出了基於AI多模態深度語義理解引擎打造的智能交互機器人。將車內車外場景相融合,為用戶提供一站式出行生活服務。其中,AI多模態深度語義理解技術在車內應用有著四大特點:1、AI引擎與RPA(機器人流程自動化)結合大大減少了用戶在簡單工作上消耗的時間,提升了車內人機互動體驗。例如當AI通過場景理解,識別到用戶正在上班途中,即可為主人自動播報工作安排,並實現自動預訂會議室,會餐地點、機票酒店等安排。具體到訂餐場景時,深思考的解決方案通過機器人自動調用餐廳的預訂接口完成預定,避免了中間人工預訂可能會產生的誤解和麻煩,從而實現了一站式的服務。2、車輛與智能家居信息融合同步。深思考通過車載系統與智能家居的連結,實現了對智能家居的遠程控制,同時,在用戶日程安排上,該公司的產品也能夠通過語音進行提醒,並為用戶提供適合的建議或決策。3、關聯意圖的推薦和理解。對於出行過程中的場景,深思考的智能交互機器人會進行主動的識別與理解,並對下一個場景進行推測。當抵達某一地點時,AI會自動判斷下一個目的地是停車場還是酒店等場景,並根據V2X的信息為用戶進行智能導航和推薦。4、車路協同、車車協同智能交互。對於行駛過程中前方的路況以及周圍車輛的駕駛行為,深思考的解決方案也會進行實時的感知和理解。當前方發生交通事故,擁堵緩行或是周圍車輛存在變道傾向時,AI會通過語音的方式對用戶進行提醒,以防止意外的發生。深思考在基於智能車聯網的數字座艙場景下,通過車內攝像頭和語音傳感器,實現了多模態非結構化信息的深度語義,而且具備自由跨域上下文理解和多輪對話交互的能力。這相當於賦予了汽車一個智能語義理解的大腦,使得你的數字座艙會更加智能、更加懂你。同時,多模態語義理解也可以用來賦能汽車的營銷,它會將用戶的對話信息、線上諮詢等綜合起來做多模態語義理解,最後再對用戶進行建檔、數據分析,以幫助汽車廠商擴大用戶的流量入口,以便他們可以更好的去了解用戶畫像和利用AI幫助主機廠商提高銷售轉化率。目前深思考已為奇瑞捷途提供技術支持,今年還將有幾家大品牌廠商、及數千家4S店會應用到深思考的落地產品及解決方案。在人機互動系統中,類似「siri」這種人機助手的交互形式大都以「單輪問答」——即一問一答模式進行。但深思考在人機互動方面已經做到機器與人之間的「多輪問答」人機互動:意圖的準確識別、上下文的精準理解、個性化特徵的深入提取,從而在抓住用戶真正意圖的同時,實現多輪人機互動。同時據獵雲網深入了解,深思考在人機互動上最大的特點是能夠實現「自由跨域」——即對用戶的「大白話」進行意圖理解,讓機器更具人性化:根據不同用戶的個性化特點,提供不同的交互流程。在這個過程中,不斷的對「交互對象」進行了解,以達到「越交互越了解」的程度。深思考獨特的「自由跨域」技術實現離不開其團隊研發的內核級技術——多輪對話管理引擎。這套引擎旨能夠對「對話過程」進行監督、管理、追蹤,通過模擬人的記憶方式,採用深度學習的一些算法模型去設計,確保機器的長短時記憶。就算法來看,行業內很多做語義理解的友商還在用基於統計學的機器學習算法來做語義理解,深思考在這裡已經是「長輩」了,目前深思考團隊聚焦最為前沿的語義理解技術,諸如:BERT、XLNET、ALBERT,進行商業化落地。目前深思考整個公司主要聚焦於ToB,就目前針對手機終端應用場景,與手機廠商做深度戰略合作,未來也可能會利用這些場景在ToC端做一些探索。楊志明說:「當下整個AI發展的現狀就像一部不受青睞的電影:矚目的導演拍出了一部巨作,但看的人往往寥寥無幾。因為現在一個真正的AI公司,其核心團隊往往來自學術界,而學術界幾乎都發源於『實驗室』的場景下,這也會導致許多公司在初期不太注重產業化落地。」而深思考則在創立之初就保持了技術投入和商業落地並駕齊驅的狀態。AI不同於其他行業,在一個團隊中,「核心人才」是關鍵。深思考不僅具有精良的技術團隊,同時具有強大的商業化基因和對應用場景的理解力其核心團隊主要來自於國內的核心AI發源地:內部成員由來自中科院自動化所、軟體所、計算所、微電子所等中科院院所、清華大學及海外知名大學人工智慧方向的一線AI科學家與領域業務專家組成,多人曾在AI領域內連續創業,在商業化產業落地的腳步上從未停止,這一路走來也收穫了滿滿的經驗。團隊的重心都一直是人工智慧領域中一線前沿的科學家,且他們在深度語義理解、計算機視覺和深度學習處理器等方面擁有多項發明專利,具備深厚的技術積累。楊志明表示:「實際上,我們在人工智慧領域中已經深耕了十多年,包括此前多次的創業經歷,這為我們積累了很多的場景化語料和數據,這使得我們的技術不斷迭代進化,商業落地的考量也更加成熟。」不可否認,楊志明和其團隊歷經十多年的技術沉澱,憑藉「多模態深度語義理解與人機互動」技術,深思考的確構建起了堅固的技術壁壘,如今可謂是厚積薄發,十年磨一劍。據獵雲網從深思考側面了解:在深思考成立之前,楊志明在AI路上已經歷了三次創業,從第一次創業將AI與信息安全相結合的嘗試到將AI用於法律垂直行業的第三次創業,中間還穿插了一部AI加廣告推薦的插曲。楊志明曾說:「多次的創業經歷讓我充分的意識到了技術必須要實現到具體產品的落地,所以一直也都在將技術積累和領域業務相結合去創業」。直到2015年,楊志明的第四次創業——成立了深思考人工智慧機器人有限公司,那時的AI剛在國內悄然興起,可謂生正逢時。從時間的長度及領域的寬度來講,楊志明的創業經歷從一定程度上橫跨了國內AI的發展歷程,這使得他更懂得如何將將AI規模化、產業化的實現落地。AI在發展過程中一定是從感知到認知,亦或者是從感知到理解,隨著5G、物聯網的發展,無論是從落地還是技術、數據壁壘、算力布局上講,深思考在人工智慧領域的未來都值得令人期待。
☞2019,CEO成了高危職業
☞中國2.4億單身群體中,你「單身經濟」了嗎?
☞染病喪命,巨頭被查,電子菸迎來至暗時刻?
☞GP與LP「開撕」,錢到底進了誰的口袋?
☞從零到IPO:深入解讀創企生命周期三階段
☞剖切線上娃娃機:一個風口的消散,滅火造富的遊戲
*識別上方二維碼,快速申請項目路演,與投資人零距離交流。
*點擊「閱讀原文」,可快速申請參加教育產業峰會中的項目路演,與投資人零距離交流。