Rokid副總裁向文杰:人機互動的終極形態是腦機交互

2020-12-22 讀創

12月18日-20日,2020網易未來大會在杭州舉行。大會以「洞覺 未見」為主題,匯聚了全球最強大腦,期盼以遠見超越未見,去尋找打開未來的鑰匙。

大會上,Rokid副總裁、產品技術中心總經理向文杰做了《下一代的人機互動》主題演講。

從第一臺PC出現,比爾蓋茨讓每個人辦公桌上有了一臺PC。接下來Smart Phone,賈伯斯推動了手機普及,接下來是什麼呢?

向文杰認為,當手機再往前演進的時候,下一代的產品一定不是一個更大屏幕的手機,這是不可能的。

Rokid公司生產了智能音響的鼻祖,但是當時向文杰並沒有把它理解成是一個音響,因為它是最簡單、最自然的人機互動的方式。那未來會是智能音箱,還是一個什麼樣的設備呢?向文杰說,這就是他們一直探索的方向,「做出讓更多人更容易使用的東西,我們理解的未來是這樣的」。

向文杰認為,當人跟機器交互的時候,需要輸入法嗎?需要了解各個應用怎麼用嗎?實際上不需要,只要了解它需要聽懂你的話。所以語音能力就要很強,就會變成它基礎的配置。

未來的交互更多是通過語音,通過手勢,更多通過更自然、更直接的方式交互。

帶著自家公司量產的最新款AI眼鏡亮相,向文杰仿佛已經實現了走向未來的基礎操作。

據他介紹,這款AR眼鏡,年初已經量產推向全球。到今天為止,在全世界50多個國家進行了推廣,並且已經在當地開始售賣。國內各個省份,包括浙江省,包括浙大,包括良渚博物院,包括浙江省公安廳,也都開始推廣。

他說,未來已經開始了,新產品接下來會越來越多的來到我們身邊。

以下為向文杰演講的部分內容:

大家好!

剛才聽了一個非常燒腦的演講,雖然沒有太聽懂,但感覺這一定是代表未來的。我接下來做一個相對簡單、也比較有趣的演講。

大家可以看到我現在戴的這副眼鏡,我其實戴的這副眼鏡是已經量產的AI眼鏡。我們過去這4年時間裡一直在探索AI和AR這兩個方向,並且不斷打磨產品。這4年過程中我們發現一個有意思的事情,接下來我們面臨的新時代快來了。就像今天「洞見」大會上講的一樣,未來十年一定會到來的。今天很多同學,很多行業還對這樣一個新的產品,新的領域,只是聽說過,沒有了解過,所以今天我做一個簡單小小的分享,讓大家對這個行業有所了解。

實際上在現階段很多的人對一個概念是分不清楚的,就是什麼叫VR,什麼叫AR,這個東西到底是幹嘛的。我其實在演講之前簡單介紹一下,VR的話,大家現在已經非常普及了,接下來一年的出貨量1000多萬套,在遊戲領域裡、培訓領域裡非常普及。AR剛剛開始,AR已經進入了很長時間,但現在才剛剛開始。剛剛開始意味著什麼,這個行業還沒有被大眾所普及,也沒有被大眾所認知,但是它現在已經被很多行業裡開始利用起來了。我們現在所了解的,很多業內人士了解的是微軟的AR,但在國內AR是蓬勃發展。

簡單介紹一下我們這款AR眼鏡,今年年初正式量產推向全球。到今天為止,它已經在全世界50多個國家進行了推廣,並且當地渠道商、經銷商已經開始售賣了。然後在我們國內各個省份,包括浙江省,包括浙大,包括良渚博物院,包括浙江省公安廳,其實全面都開始推廣這樣一款眼鏡,它已經開始了,只是它接下來會越來越多地來到我們身邊。

我舉個簡單的例子,我今天帶了這個產品的小配件上來。這是我們獨立研發的一款紅外測溫的模組,今年疫情之年,大家習慣用一個很大的設備放在門口來進行防疫測溫。但當我們這個產品剛剛推出時,我們把紅外測溫模組小型化,在全世界範圍內給了很多公司、很多國家帶來很多幫助。包括新加坡、俄羅斯、德國,他們都大批採購這樣的眼鏡,用來幹什麼?用來在移動場景下實時檢測檢疫,做人體溫度的測試。在我們國家更是,包括良渚博物院都已經大量採購。其實這樣一個AI的時代已經開始了。

我接下來開始演講,好像我們講的是AR產品,Rokid公司追求的是人機互動。

我們擁有很好的技術,當我們拿著這個技術的時候,我們希望給到行業什麼東西。

今天我從很多大拿的演講當中學到很多點,我們給到行業裡面不止是效率、不止是創新,還有很多人文關懷,這是Rokid公司很大內核的點。我們需要用科技的變革給行業更好的效率,更好的人機互動體驗,所以我們更強調體驗,更強調互動設計。

當第一臺PC出現的時候,比爾蓋茨講過一句話,讓每個人辦公桌上有一臺PC,他做到了。從我們的角度來看,不僅是科學技術的進步,不僅是通訊的進步,裡面帶來一個點,覆蓋的人群越來越廣。

一開始的時候,小型機只有少量人用,當有了個人PC的時候,很多家庭裡面有了一臺PC。當它有了最早手機的時候,早期雖然做不到人手一臺,到現在為止全世界範圍之內,基本上可以做到人手一臺設備。

接下來叫Smart Phone,大家看到的Smart Speaker這是我們公司2016年推出來的,大家可以叫智能音響,也可以叫智慧機器人。我們為什麼做它?我們相當於是一個智能音響的鼻祖,但是我們並沒有把它理解成是一個音響,因為它是最簡單、最自然的人機互動的方式。就是因為有了它,我們才能做出未來讓更多人使用、更容易使用的東西,這是我們最追求的方向和目標,我們理解的未來是這樣的。

剛才講演進的趨勢有兩個點,第一個點是獲取信息的效率,移動網際網路一定比網際網路獲取效率高,傳統的PC一定比更早的電報、電話這種獲取信息效率高,再往前是什麼?手機現在屏幕已經不可能變大了,現在有5G、6G,對應的載體是什麼?有什麼特點?是更大屏幕的手機嗎?還是一個什麼樣的設備?這就是我們一直在探索的方向。

我們認為未來的設備有一個很大的特點,一定是便攜的,像手機在身上隨時可以用。當便攜再往前一步的時候就是隨身設備,應該沒有一個設備比眼睛是更隨身的設備,可以隨時隨地擴展眼睛的能力,現在很多手環、手錶,可攜式設備可以很快擴展個人的想像和能力,它可以快速獲取信息。相比手機而言,雖然不可能取代手機,這個是不可能的,像手機也取代不了電腦。但是會產生一個情況,極大地擴展人類的想像空間和可能性。

第二,更友好的交互。現在講交互相對少一點,可能設計師講的多一些,因為我們是產品公司,更多會強調交互。剛才給大家看到的Smart Speaker有什麼好處?在我們整個用戶場景裡面最大的好處是小朋友可以使用,沒有文化的老人也可以使用,所有的人都可以用。為什麼?因為它用的是最自然的交互手段,人和人之間肯定用最自然的手段交流,文字可能都不是最自然的,最自然的可能就是講話。人機互動,語音一定是最自然的,手勢一定是最自然的,還有更多自然的交互方式,以前這些都不成熟。

大家知道AR這個行業不是現在產生的,50年前已經有了,為什麼現在越來越成熟了?越來越敢暢想10年以後讓AR普及,就是AI助力。我們結合AI能力、AR能力,打造更好更自然的交互。

我們這裡提出來一個論斷,這是我們公司共同認同的點,當手機再往前演進的時候,下一代的產品一定不是一個更大屏幕的手機,這是不可能的。當到某一天大家戴上這幅眼鏡的時候,今天沒有機會讓每個人體驗一下,但是打個廣告,大家可以去良渚博物院體驗這款眼鏡,我們通過這款眼鏡讓博物院各種各樣的文物有更豐富的體驗。帶來的好處是當人機互動往前走的時候,手機不再是唯一。而當你跟它交互的時候,你需要輸入法嗎?需要了解各個應用怎麼用嗎?實際上不需要,你只要了解它需要聽懂你的話,所以語音能力就會很強,就會變成它基礎的配置。未來的交互更多是通過語音,通過手勢,更多通過更自然、更直接的方式交互。這樣的交互是老人和小孩都會用的,只有這樣才不會讓科技把任何人拋下。

今天大會剛開始的時候,我聽到一句話,可能是丁磊講的,我們的科技不僅僅是提升效率,更重要的是關注人文。這是我們想做的,希望把更好的科技,AI、AR的科技,這些能力集成到一個更好的產品裡面,但是最終給到用戶的應該是一個最好的交互。我們希望用最簡單、最自然的交互,讓所有人使用它。

當這點實現的時候,人機互動的終極形態,再往前走一步就是腦機交互了,不是我們今天探討的。在這個行業裡面,科技的高速進步不斷湧入,未來10年,非常值得期待。

到目前為止,AR眼鏡在C端大家看到的非常少,這也是經常有人問我,你們說MR、VR、AR是什麼區別。在產業網際網路裡面是非常流行的,包括大家看到的第一個就是良渚博物院。目前我們跟全國100多家博物館開展了讓博物館現在所有展品變成信息化,變成可互動的,變成讓所有小朋友到博物館以後能get更多信息,不需要你有很強的操作能力,不需要有很強的理解能力,因為AR可以讓你更容易理解它,理解這些沉睡在地下的文物,目前這件事情已經陸續開展了。接下來大家都能看到。

現在的兩會報導,很多媒體報導還是採用傳統的手機、直播方式,未來的制博會是另外一種主流。在外貿裡面變得越來越流行了。

工業領域,Rokid AR眼鏡現在在德國是最主要的出口地,德國是工業4.0的提出國。AR設備作為工業4.0產業網際網路核心的器件,現在正在被各個行業所接受,現在我們這款眼鏡在德國出口量最大,因為他們的工業網際網路需要這樣的終端,需要一個終端,除了能夠讓他實時看到操作過程中的步驟,裡面所具備的AI能夠可以輔助這個工人看看他做的對不對,是不是有更好的策略,並且把整個過程記錄下來進行AI分析,最後反饋給他,你可以做得更好。其實這件事情在德國開始了,在國內也開始了,我們跟中國石油、跟國家電網、跟國內很多大型汽車廠商都已經開始陸續合作。

接下來在這些產業裡面,AI會成為一個標配,成為產業工人的標配,會打造未來工業網際網路時代超級工人必備的武器,這就是接下來這個行業裡馬上會發生的。

最後就是公共服務。剛才講到防疫,講到包括大型活動的安保,包括烏鎮網際網路大會,包括阿里巴巴年會,都會採購這樣的眼鏡,作為現場安保重要的安保工具。為什麼?它的AI能力讓每一個現場的服務人員火眼金睛,具備識別問題的能力,實時保持前端和後臺通信的能力。遠遠不僅限於上面四個領域,在很多行業都已經迅速普及。

Rokid公司在杭州是AI和AR方面的獨角獸,我們為什麼會做AI?本質還是回到最早講的交互。因為AR能很大程度上改善人的交互,讓所有剛才講的小孩、老人,所有人都可以利用這個科技,而不是對科技產生排斥。

AI在這個裡面幹什麼?降低很多複雜操作,你不需要做,用最自然的方式跟他交流、溝通就可以了。

分享之前,我看到有一位同學分享數字人,這也是我們在追求的方向。雖然我們還沒有這個技術,但是我們完全可以合作,數字人也是基於AI技術實現了,AI技術無所不在。我們會把所有跟交互相關的AI技術整合到我們這個設備裡面,讓全世界所有人都能使用,它可以聽得懂16種語言,這是因為AI技術的原因,這就是為什麼AR發展了40多年沒有落地,現在高速落地了,因為AI在發展,AI的發展賦予它更好的交互能力、更好的體積、更輕便、更強的能力,所以說是AI讓AR開始落地了,AI讓AR在未來10年裡能夠從不能落地,到工業裡面、產業裡面落地,最後再到C端消費者這邊落地,這是接下來的趨勢。

它能夠做到我剛剛講到的,AI更懂你,「懂你」意味著你很多事情不用做了,你講話就好。可以把你流程優化掉,然後顯示在你眼前,你跟它可進行實時互動,我們目前為止把它們兩個結合得還是比較好,未來有很多的挑戰。

這就是我們想要做的事情,很多同學對這個概念不是很了解,如果大家關注到普通人在使用高科技產品的時候感受的時候,大家應該能感受的。我們當時在做智能音箱時非常明顯感受到,非常多的人對智能產品不敢用,躲得遠遠的,會對高科技隔離起來,包括電子支付也是一樣。我們能做的事情是讓這些複雜的東西簡單,讓它出現在你的眼前,讓它以最自然的交互進行交互。讓小孩、老人所有人,國內外所有人都可以快速進行交流,快速實現它的功能,這就是我們想通過這個眼鏡來實現的事情。就像剛才講的,這是我們的使命,這是我們想要做的事情,讓每個人都能享受科技。

謝謝大家!

來源:網易科技

審讀:孫世建

相關焦點

  • 下一場革命性的人機互動方式會是什麼?
    今晚這堂課咱們來講一講近幾年大火的人機互動技術,以及未來可能會出現的革命性人機互動新方式。,接下來的內容我們來講下未來可能會出現的人機互動新方式。03 腦機交互「腦機交互」從字面上來講,就是把人類的大腦和計算機連起來,然後進行交互。
  • 前景專業|人機互動(HCI)
    人機互動(HCI)的興起20世紀70年代,隨著個人計算機的出現,人機互動領域也浮現出來。由於計算機尺寸縮小且價格降低,對於計算機操作不夠熟練的普通用戶,就需要一種簡單有效的人機互動方式。後來,人機互動的重心擴展到遊戲、學習教育、商業、健康與醫療應用、應急規劃與響應,以及協作與社區支持系統等領域。如今,人機互動的跨學科性體現在計算機科學與行為科學的交叉領域。人機互動的目標是創建一套易於用戶操作的安全有效系統,這個概念看似並不複雜,但卻需要綜合計算機科學、認知科學及人因工程學等領域的技術。人機互動領域的研究員通常做些什麼事?
  • 腦機交互:一個月的真實課堂實驗
    為此,團隊基於腦際交互技術做了大膽的嘗試。來看看團隊是如何進行嘗試的,結果又如何!在智能學習系統中運用腦機交互技術,能較準確地採集學習過程中學習者的腦電波信號,並通過認知心理來解釋學生的心理狀態。研究者通過觀測其腦波信號和心理狀態,從而給予幹預。我們基於X大學在線英語學習系統,針對大學生普遍感覺困難的「聽力課程」,開發了基於腦機交互技術的注意力監控與促進系統。
  • 視聽整合:人機互動界面的新方向
    在實現人工智慧的道路上,人機互動必不可少。人機互動指人與計算機之間使用某種對話語言,以一定的交互方式,為完成確定任務的人與計算機之間的信息交換過程,包括人通過輸入設備給計算機輸入信息、計算機經過運算再通過輸出設備給人提供信息反饋等方面內容。
  • 人機互動的內容有哪些_人機互動主要研究什麼
    人機互動的內容有哪些   機交互界面表示模型與設計方法(Model and Methodology)   一個交互界面的好壞,直接影響到軟體開發的成敗。友好人機互動界面的開發離不開好的交互模型與設計方法。因此,研究人機互動界面的表示模型與設計方法,是人機互動的重要研究內容之一。   可用性分析與評估(Usability and Evaluation)   可用性是人機互動系統的重要內容,它關係到人機互動能否達到用戶期待的目標,以及實現這一目標的效率與便捷性。
  • 腦機交互開啟「賽博朋克」時代,實現刀劍神域還需要多久?
    理論上如果能採集大腦活動時所有電信號,並執行且回執相應的電信號,即可實現真正意義上的腦機交互。 我們先分析腦機互連目前已知的方法(本篇不討論現實技術對人體生理,心理的影響。亦不考慮是否違背道德倫理的問題)。
  • 人機互動簡述,一起來了解人機互動的世界!
    一、HCI綜述HCI(WIKI)是一門研究系統和用戶之間交互的學問。系統可以是各種各樣的不同的機器,也可以是計算機化的系統和軟體。人機互動界面通常是指用戶可見的部分。用戶通過人機互動界面與系統交流,並進行操作。通俗的講就是研究各種通過交互系統、交互體驗的學科。Physical的交互界面比如收音機的播放按鍵,virtual的界面比如網站、app界面。
  • 嵌入式人機互動界面研究與實現
    目前,嵌入式人機互動界面開發可以選擇作業系統主要分為WinCE和Linux兩大陣營,隨著2012年底微軟公司宣布Wince停止更新,越來越多的開發人員在選擇作業系統時轉而選擇Linux以及Linux衍生出的Android等作業系統。
  • 這就是未來三大AI交互技術!
    而科技話題繞不開人工智慧,智能家居、自動駕駛、智能安防……它革新了人機互動方式,升級了人機互動體驗,重構一個"人、工具、場景"的新世界,敲開了物聯網時代的大門。
  • 人工智慧推動人機互動創新 三星Bixby中文(普通話)版發布
    Bixby與市面上其他語音助手截然不同,它包含語音,視覺,主頁,提醒四大功能,帶給用戶不同於以往的人工智慧多模交互體驗。  在前不久的公測活動中,Bixby中文(普通話)版已經收穫了眾多消費者的好評,而在三星Bixby中國發布會現場三星電子大中華區總裁權桂賢先生表示:「三星一直把中國市場視為最重要的戰略市場之一,我們的目標是為中國消費者提供最具創新性的移動體驗。如今人工智慧產業將成為推動國家發展的新增長點。
  • 軟硬兼施領跑人機互動 驀然認知多維度解決交互難題
    「AI正在從感知向認知進階,感知有賴於硬體,認知則依賴算法,而AI一定是軟硬體統一的結果。我們正好就是可以做到軟硬體結合,讓AI技術落地。」目前,驀然認知推出「信號處理+語音識別+語義理解+服務自動對接」的一站式智能交互及決策引擎Mor,驅動設備與人交流近而逐步智能化。驀然認知提出「對話即應用」的產品理念,重新定義應用形態。
  • 智能經濟時代人機互動三大趨勢
    演講中,沈抖提出智能人機互動將有三個趨勢:未來智能終端將會指數級增長;人和終端的交互將會多模態,語音、圖像交互將會成為主流;信息和服務將會場景化。  人工智慧正在催生越來越多樣化的智能終端。除了PC、智慧型手機外,汽車、智能音箱、可穿戴設備、服務機器人甚至是無法直接看見的傳感器,都能成為人機互動的終端。每種終端會在不同場景扮演關鍵角色。  智能終端變化帶來交互方式的變革,語音、圖像、視頻、手勢等多模態的交互將成為未來交互的主流方式。網際網路企業應該廣泛利用人工智慧技術,實現交互的革新升級,從而在產品、內容、服務等多個維度不斷適應用戶的新需求和新習慣。
  • 深度學習大數據系列(2):腦機交互促進學習有效發生的路徑及實驗研究
    因此,我們認為腦機接口作為一項新興技術在教育中的應用,稱為「腦機交互」更為適切,其包含了技術和教育應用兩個層面,英文仍用 BCI 進行表達。當然,腦機交互作為教育領域研究中的一個新興點陣,還存在著腦科學成果向教育領域轉化的問題,在腦科學與智能技術融合方面也有諸多需要探索的問題。
  • 哈佛華人企業BrainCo發布腦機接口作業系統,實現了「讀心術...
    據了解,腦機接口這一技術最早於 1973 年由美國加州大學洛杉磯分校的威達爾教授提出,卻因當時計算機發展水平仍較為初級等原因,未能吸引較多關注。隨著計算機行業迅速發展,用戶對於人機互動有了更高效率的追求。
  • 人機互動院校選擇篇:喬治亞理工大學
    今天世畢盟給大家帶來的是喬治亞理工的人機互動設計項目。隨著VR、AR、AI、大數據等時代前沿科技的高速發展,「互動設計」成為了近幾年最熱門的留學專業之一。「人機互動Human Computer Interaction (HCI)」主要研究人與人造物之間的關係,以及如何更好的設計出為人類服務的產品與體驗的設計類學科。
  • 「人機互動」到「人人交互」 360瀏覽器引領行業轉型風向標
    360瀏覽器 「人機互動」向「人人交互」的平臺化轉型加入了一鍵直播功能的360安全瀏覽器是國內首款支持直播的瀏覽器產品。圖1:一鍵直播功能的加入讓360瀏覽器邁出人人交互平臺化轉型的第一步360安全瀏覽器產品負責人表示:「一鍵直播」功能的加入顛覆了瀏覽器作為單一工具或平臺的傳統模式。
  • 新興+潛力:卡內基梅隆大學人機互動設計專業
    卡內基梅隆大學人機互動專業排名全美第一,是該專業最具代表性的院校,開設在大名鼎鼎的計算機學院之下,不僅就業前景好,而且未來發展潛力巨大,下面託普仕為大家詳細介紹。卡內基梅隆大學人機互動碩士簡介:卡內基梅隆大學人機互動碩士簡稱為MHCI,是世界上最早開設互動設計課程的項目,開設時間是1996年,開設的初衷是為了畢業生可以為設計和指導人與技術交互的未來做好準備。
  • 人機互動作品集,一定要展現技術嗎?
    一句話裡甚至連一個「one of」都沒有,展現了CMU作為人機互動專業世界頭把交椅的豪氣和自信。隨著互動設計變得越來越被人們熟知,互動設計相關的行業待遇又極其誘人,近年來申請與科技行業關係密切的HCI人機互動的小夥伴也越來越多了,不僅僅是來自計算機技術專業和設計專業背景的同學,包括本科為心理學、商科、理工科等的同學也越來越多。
  • 可穿戴設備的七大關鍵交互技術
    因此在人機互動方面與一般的計算設備,或者說智能設備不同,是一種人機直接無縫、充分連接的交互方式,其主要特點包括單(雙)手釋放、語音交互、感知增強、觸覺交互、意識交互等。隨著可穿戴設備,尤其是智能眼鏡的出現,這項技術開始被應用與可穿戴設備的人機互動中。眼動跟蹤交互技術的主要原理是,當人的眼睛看向不同方向時,眼部會有細微的變化,這些變化會產生可以提取的特徵,計算機可以通過圖像捕捉或掃描提取這些特徵,從而實時追蹤眼睛的變化,預測用戶的狀態和需求,並進行響應,達到用眼睛控制設備的目的。
  • 深度學習人機互動相關資源推薦來啦
    雷鋒網(公眾號:雷鋒網) AI 科技評論按,目前,深度學習和人機互動的學習資源很多近日,bwang514 在 github 上做了一個「深度學習人機互動相關資源大列表」。上面有一些很棒的關於智能用戶界面和人機互動的課程資源。