向文杰:人機互動的終極形態是腦機交互

2020-12-22 杭網原創

杭州網訊 12月18日-20日,2020網易未來大會在杭州盛大舉行。大會以「洞覺 未見」為主題,匯聚了全球最強大腦,期盼以遠見超越未見,去尋找打開未來的鑰匙。

大會上,Rokid副總裁、產品技術中心總經理向文杰做了《下一代的人機互動》主題演講。

從第一臺PC出現,比爾蓋茨讓每個人辦公桌上有了一臺PC。接下來Smart Phone,賈伯斯推動了手機普及,接下來是什麼呢?

向文杰認為,當手機再往前演進的時候,下一代的產品一定不是一個更大屏幕的手機,這是不可能的。

Rokid公司生產了智能音響的鼻祖,但是當時向文杰並沒有把它理解成是一個音響,因為它是最簡單、最自然的人機互動的方式。那未來會是智能音箱,還是一個什麼樣的設備呢?向文杰說,這就是他們一直探索的方向,「做出讓更多人更容易使用的東西,我們理解的未來是這樣的」。

向文杰認為,當人跟機器交互的時候,需要輸入法嗎?需要了解各個應用怎麼用嗎?實際上不需要,只要了解它需要聽懂你的話。所以語音能力就要很強,就會變成它基礎的配置。

未來的交互更多是通過語音,通過手勢,更多通過更自然、更直接的方式交互。

帶著自家公司量產的最新款AI眼鏡亮相,向文杰仿佛已經實現了走向未來的基礎操作。

據他介紹,這款AR眼鏡,年初已經量產推向全球。到今天為止,在全世界50多個國家進行了推廣,並且已經在當地開始售賣。國內各個省份,包括浙江省,包括浙大,包括良渚博物院,包括浙江省公安廳,也都開始推廣。

他說,未來已經開始了,新產品接下來會越來越多的來到我們身邊。

以下為向文杰演講的部分內容:

大家好!

剛才聽了一個非常燒腦的演講,雖然沒有太聽懂,但感覺這一定是代表未來的。我接下來跟一個相對簡單,也比較有趣的演講。

大家可以看到我現在戴的這副眼鏡,我其實戴的這副眼鏡是已經量產的AI眼鏡。我們過去這4年時間裡一直在探索AI和AR這兩個方向,並且不斷打磨產品。這4年過程中我們發現一個有意思的事情,接下來我們面臨的新時代快來了。就像今天「洞見」大會上講的一樣,未來十年一定會到來的。今天很多同學,很多行業還對這樣一個新的產品,新的領域,只是聽說過,沒有了解過,所以今天我做一個簡單小小的分享,讓大家對這個行業有所了解。

實際上在現階段很多的人對一個概念是分不清楚的,就是什麼叫VR,什麼叫AR,這個東西到底是幹嗎的。我其實在演講之前簡單介紹一下,VR的話,大家現在已經非常普及了,接下來一年的出貨量1千多萬套,在遊戲領域裡、培訓領域裡非常普及。AR剛剛開始,AR已經進入了很長時間,但現在才剛剛開始。剛剛開始意味著什麼,這個行業還沒有被大眾所普及,也沒有被大眾所認知,但是它現在已經被很多行業裡開始利用起來了。我們現在所了解的,很多業內人士了解的是微軟的AR,但在國內AR是蓬勃發展。

簡單介紹一下我們這款AR眼鏡,今年年初正式量產推向全球。到今天為止,它已經在全世界50多個國家都進行了推廣,並且當地渠道商、經銷商已經在當地開始售賣了。然後在我們國內各個省份,包括浙江省,包括浙大,包括良渚博物院,包括浙江省公安廳,其實全面都開始推廣這樣一款眼鏡,它已經開始了,只是它接下來會越來越多的來到我們身邊。

我舉個簡單的例子,我今天帶了這個產品的小配件上來。這是我們獨立研發的一款紅外測溫的模組,今年疫情之年,大家習慣的是用一個很大的設備放在門口來進行防疫測溫。但當我們這個產品剛剛推出時,我們把紅外測溫模組小型化,在全世界範圍內給了很多公司、很多國家帶來很多幫助。包括像新加坡、俄羅斯、德國,他們都大批採購這樣的眼鏡,用來幹什麼?用來在移動場景下實時檢測檢疫,做人體溫度的測試。在我們國家更是,包括良渚博物院都已經大量採購。其實這樣一個AI的時代已經開始了。

我接下來開始演講,好像我們講的是AR產品,Rokid公司追求的是人機互動。

我們擁有很好的技術,當我們拿著這個技術的時候,我們希望給到行業是什麼東西。

今天我從很多大拿的演講當中學到很多點,我們給到行業裡面不止是效率、不止是創新,還有很多人文關懷,這是Rokid公司很大內核的點。我們需要用科技的變革給行業更好的效率,更好的人機互動體驗,所以我們更強調體驗,更強調互動設計。

這張圖大家在無數地方看過,今天我用另外一個方式給大家解讀一下。

當第一臺PC出現的時候,比爾蓋茨講過一句話,讓每個人辦公桌上有一臺PC,他做到了。從我們的角度來看,不僅是科學技術的進步,不僅是通訊的進步,裡面帶來一個點,覆蓋的人群越來越廣。

一開始的時候,小型機只有少量人用,當有了個人PC的時候,很多家庭裡面有了一臺PC。當它有了最早手機的時候,早期雖然做不到人手一臺,到現在為止全世界範圍之內,基本上可以做到人手一臺設備。

接下來叫Smart Phone,大家看到的Smart Speaker這是我們公司2016年推出來的,大家可以叫智能音響,也可以叫智慧機器人。我們為什麼做它?我們相當於是一個智能音響的鼻祖,但是我們並沒有把它理解成是一個音響,因為它是最簡單、最自然的人機互動的方式。就是因為有了它,我們才能做出來未來讓更多人使用,而且讓更多人更容易使用的東西,這是我們最追求的方向和目標,我們理解的未來是這樣的。

剛才講演進的趨勢有兩個點,第一個點是獲取信息的效率,移動網際網路一定比網際網路獲取效率高,傳統的PC一定比更產生的電報、電話這種獲取信息效率高,再往前是什麼?手機現在屏幕已經不可能變大了,現在有5G、6G,對應的載體是什麼?有什麼特點?是更大屏幕的手機嗎?還是一個什麼樣的設備?這就是我們一直在探索的方向。

我們認為未來的設備有一個很大的特點,一定是便攜的,像手機在身上隨時可以用。當便攜再往前一步的時候就是隨身設備,應該沒有一個設備比眼睛是更隨身的設備,可以隨時隨地擴展眼睛的能力,現在很多手環、手錶,可攜式設備可以很快擴展個人的想像和能力,它可以快速獲取信息。相比手機而言,雖然不可能取代手機,這個是不可能的,像手機也取代不了電腦。但是會產生一個情況,極大可能的擴展人類的想像空間和可能性。

第二,更友好的交互。現在講交互相對少一點,可能設計師講的多一些,因為我們是產品公司,更多會強調交互。剛才給大家看到的Smart Speaker有什麼好處?在我們整個用戶場景裡面最大的好處是小朋友可以使用,沒有文化的老人也可以使用,所有的人都可以用。為什麼?因為它用的是最自然的交互手段,人和人之間肯定用最自然的手段交流,文字可能都不是最自然的,最自然的可能就是講話。人機互動,語音一定是最自然的,手勢一定是最自然的,還有更多自然的交互方式,以前的時候這些都不成熟。

大家知道AR這個行業不是現在產生的,50年已經有了,為什麼現在越來越成熟了?越來越敢暢想10年以後讓AR普及,就是AI助力。我們結合AI能力、AR能力,打造更好更自然的交互。

我們這裡提出來一個論斷,這是我們公司共同認同的點,當手機再往前演進的時候,下一代的產品一定不是一個更大屏幕的手機,這是不可能的。當到某一天大家戴上這幅眼鏡的時候,今天沒有機會讓每個人體驗一下,但是打個廣告,大家可以去良渚博物院體驗這款眼鏡,我們通過這款眼鏡讓博物院各種各樣的文物有更豐富的體驗。帶來的好處是當人機互動往前走的時候,不是唯一是手機的時候,是什麼?讓視野變得更寬闊,可以讓空間裡面隨時隨地顯示你所需要的信息。當你跟它交互的時候,你需要輸入法嗎?需要了解各個應用怎麼用嗎?實際上不需要,你只要了解它需要聽懂你的話,所以語音能力就會很強,就會變成它基礎的配置。未來的交互更多是通過語音,通過手勢,更多通過更自然、更直接的方式交互。這樣的交互才是小孩子會用的,老人會用的,所有人都會用的,只有這樣才會不讓科技把任何人拋下,讓每個人享受科技,讓每個人感受科技帶來的樂趣。

今天大會剛開始的時候,我聽到一句話,可能是丁磊講的,我們的科技不僅僅是提升效率,另外更重要的是關注人文。這是我們想做的,希望把更好的科技,AI、AR的科技,這些能力集成到一個更好的產品裡面,但是最終給到用戶的應該是一個最好的交互,關注它,讓他不用避免高科技帶來的不會用,我很慌,我想避開它,這個東西太複雜了,我們希望用最簡單、最自然的交互,讓所有人使用它。

當這點實現的時候,人機互動的終極形態,再往前走一步就是腦機交互了,不是我們今天探討的。從過去探索的4年來,在這個行業裡面,科技的高速進步不斷湧入,未來10年,非常值得期待。

到目前為止,AR眼鏡在C端大家看到的非常少,這也是經常有人問我,你們說MR、VR、AR是什麼區別。在產業網際網路裡面是非常流行的,包括大家看到的第一個就是良渚博物院。目前我們跟全國100多家博物館開展了讓博物館現在所有展品變成信息化,變成可互動的,變成讓所有小朋友到博物館以後能get更多信息,不需要你有很強的操作能力,不需要有很強的理解能力,因為AR可以讓你更容易理解它,理解這些沉睡在地下的文物,目前這件事情已經陸續開展了。接下來大家都能看到。

這是兩會報導,現在很多媒體報導還是採用傳統的手機、直播方式,未來的制博會是另外一種主流。在外貿裡面變得越來越流行了。

工業領域,Rokid AR眼鏡現在在德國是最主要的出口地,德國是工業4.0的提出國。AR設備作為工業4.0產業網際網路核心的器件,現在正在被各個行業所接受,現在我們這款眼鏡在德國出口量最大,因為他們的工業網際網路需要這樣的終端,需要一個終端,除了能夠讓他實時看到操作過程中的步驟,裡面所具備的AI能夠可以輔助這個工人看看他做的對不對,是不是有更好的策略,並且把整個過程記錄下來進行AI分析,最後反饋給他,你可以做得更好。其實這件事情在德國開始了,在國內也開始了,我們跟中國石油、跟國家電網、跟國內很多大型汽車廠商都已經開始陸續合作了。

接下來在這些產業裡面,AI會成為一個標配,成為產業工人的標配,會打造未來工業網際網路時代超級工人必備的武器,這就是接下來這個行業裡面馬上會發生的。

最後就是公共服務。剛才講到防疫,講到包括大型活動的安保,包括烏鎮網際網路大會,包括阿里巴巴年會,都會採購這樣的眼鏡,作為現場安保重要的安保工具。為什麼?它的AI能力讓每一個現場的服務人員火眼金睛,具備識別問題的能力,實時保持前端和後臺通信的能力。遠遠不僅限於上面四個領域,在很多行業都已經迅速普及。

我們為什麼做AI,Rokid公司在杭州是AI和AR方面的獨角獸,為什麼會做AI?本質還是回到最早講的交互。因為AR能很大程度上改善人的交互,讓所有剛才講的小孩、老人,所有人都可以利用這個科技,而不是對科技產生排斥。

AI在這個裡面幹什麼?降低很多複雜操作,你不需要做了,用最自然的方式跟他交流、溝通就可以了。

分享之前,我看到有一位同學分享數字人,這也是我們在追求的方向。雖然我們還沒有這個技術,但是我們完全可以合作起來,數字人也是基於AI技術實現了,AI技術無所不在。我們會把所有跟交互相關的AI技術整合到我們這個設備裡面,讓全世界所有人,各個語言的人,它可以聽得懂16種語言的,這是因為AI技術的原因,這就是為什麼AR發展了40多年沒有落地,現在高速落地了,因為AI在發展,AI的發賦予它更好的交互能力、更好的體積、更輕便、更強的能力,所以說這就是AI讓AR開始落地了,AI讓AR在未來10年裡面能夠從不能落地,到工業裡面、產業裡面落地,最後再到C端消費者這邊落地,這是接下來的趨勢。

它能夠做到我剛剛講到的,AI更懂你,「懂你」意味著你很多事情不用做了,你講話就好。可以把你流程優化掉,然後顯示在你眼前,你跟它進行實時互動,我們現在做的事情,我們目前為止把它們兩個結合得還是比較好,未來有很多的挑戰。

這就是我們想要做的事情,很多同學對這個概念不是很了解,如果大家關注到普通人在使用高科技產品的時候感受的時候,大家應該能感受的。我們當時在做智能音箱時非常明顯感受到,非常多的人對智能產品不敢用,躲的遠遠的,會對高科技隔離起來,包括電子支付也是一樣。我們能做的事情是讓這些複雜的東西簡單,讓它出現在你的眼前,讓它以最自然的交互進行交互。讓小孩、老人所有人,國內外所有人都可以快速進行交流,快速實現它的功能,這就是我們想通過這個眼鏡來實現的事情。就像剛才講的,這是我們的使命,這是我們想要做的事情,讓每個人都能享受科技。

謝謝大家!

2020網易未來大會由杭州市人民政府和網易公司聯合主辦,杭州市商務局、杭州市經濟和信息化局、杭州市濱江區人民政府、北京網易傳媒有限公司以及網易(杭州)網絡有限公司承辦,中國移動總冠名。大會將進行三天的頭腦風暴、涵蓋了預見未來、新基建、人工智慧、區塊鏈、潮商業、UP生活以及和文化等論壇。

相關焦點

  • Rokid副總裁向文杰:人機互動的終極形態是腦機交互
    大會上,Rokid副總裁、產品技術中心總經理向文杰做了《下一代的人機互動》主題演講。從第一臺PC出現,比爾蓋茨讓每個人辦公桌上有了一臺PC。接下來Smart Phone,賈伯斯推動了手機普及,接下來是什麼呢?
  • 向文杰:人機互動的終極形態是AR
    從第一臺PC出現,比爾蓋茨讓每個人辦公桌上有了一臺PC。向文杰認為,當手機再往前演進的時候,下一代的產品一定不是一個更大屏幕的手機,這是不可能的。Rokid公司生產了智能音響的鼻祖,但是當時向文杰並沒有把它理解成是一個音響,因為它是最簡單、最自然的人機互動的方式。那未來會是智能音箱,還是一個什麼樣的設備呢?向文杰說,這就是他們一直探索的方向,「做出讓更多人更容易使用的東西,我們理解的未來是這樣的」。
  • 馬斯克將更新腦機接口進展 人機互動成市場焦點(股)
    來源:金融界網站日前,SpaceX和特斯拉創始人馬斯克在推特發布消息稱,將會在8月28日發布腦機接口初創公司Neuralink的項目進展情況。Neuralink由馬斯克在2017年創立,以腦機接口為主要研究方向,目標是實現人腦與人工智慧軟體互聯。據彭博社報導,Neuralink已募集資金超1.5億美元,其中至少有1億美元來自馬斯克。 此前Neuralink發布了一項可擴展的高帶寬腦機接口系統。
  • 人機互動專業好就業嗎_人機互動在生活中的應用
    人機互動專業好就業嗎   人機互動是一個學術領域,是計算機和心理學的交叉學科,也可以看作計算機的一個分支學科。   人機互動主要研究人的認知模型和信息處理過程與人的交互行為之間的關係,研究如何依據用戶的任務和活動來進行交互式計算系統的設計、實現和評估。由於計算技術是信息化產品的基礎技術,因此,人機互動的模式往往對於人與產品交互的模式有著決定性的影響。   人機互動專業作為一個多學科交叉的工程應用學科,其畢業生就業主要有以下三大方向。(1)硬體設備開發。
  • 馬斯克發布腦機接口,人機互動,腦機相連,你看到壞處了嗎
    北京時間8月29日,馬斯克進行了腦機接口新設備的現場直播!藉助小豬格特魯德的實時神經元活動演示,馬斯克向人們介紹了Neuralink最新設備的進展。Neuralink 由馬斯克於 2016 年創立,總部位於舊金山,主要從事馬斯克所謂的「神經織網」(neural lace)技術開發,研發電腦與人腦融合技術,向人腦植入也許未來能夠上傳下載思想的微型電極。
  • 人機互動的內容有哪些_人機互動主要研究什麼
    人機互動的內容有哪些   機交互界面表示模型與設計方法(Model and Methodology)   一個交互界面的好壞,直接影響到軟體開發的成敗。友好人機互動界面的開發離不開好的交互模型與設計方法。因此,研究人機互動界面的表示模型與設計方法,是人機互動的重要研究內容之一。   可用性分析與評估(Usability and Evaluation)   可用性是人機互動系統的重要內容,它關係到人機互動能否達到用戶期待的目標,以及實現這一目標的效率與便捷性。
  • 腦機交互開啟「賽博朋克」時代,實現刀劍神域還需要多久?
    理論上如果能採集大腦活動時所有電信號,並執行且回執相應的電信號,即可實現真正意義上的腦機交互。 我們先分析腦機互連目前已知的方法(本篇不討論現實技術對人體生理,心理的影響。亦不考慮是否違背道德倫理的問題)。
  • 集成腦機接口連接AR眼鏡,微美全息開拓全息AR交互應用領域
    關於AR/VR的交互,一直都是討論的焦點,而目前業界最看好的方向就是:腦機接口。 其中,對於非侵入式腦機接口而言,目前的訓練成果更多集中在特定領域。正是這些前沿的探索,讓腦機接口的應用和AR眼鏡發展十分類似,可以在特定領域發揮更大的功效。 Cognixion ONE就是一款集成腦機接口的AR眼鏡。
  • 首屆智能人機互動高峰論壇在福建泉州舉辦
    11月26日至27日,由國防科技創新研究院、中國電子學會、泉州市人民政府、新興際華集團有限公司等單位共同主辦的「首屆智能人機互動高峰論壇」在福建泉州舉辦。會上,與會專家共話「智能人機互動的前沿趨勢與政策導向」,並圍繞「智能人機互動技術發展」與「智能人機互動產業發展」兩大主題進行深入探討和交流。論壇主席由中國載人航天工程副總設計師陳善廣擔任。
  • 天貓精靈發布AliGenie5.0人機互動系統 可通過唇動、揮手喚醒,人機...
    來源:金融界網站9月17日,天貓精靈在雲棲大會發布了首個全場景人機互動系統AliGenie5.0,將視覺、語音、觸覺等多種形態的交互方式融合在一起,能更精準地感知物理世界,深入理解使用者的意圖。天貓精靈事業部總經理庫偉表示,從AliGenie5.0開始,天貓精靈將開始以服務為中心,應用微內核、多模態交互等技術,構建全場景智能化。據悉,該系統同步面向開發者、智能家居合作夥伴開放。此前,多模態交互技術多停留在學術層面,阿里是業內首個把「多模態喚醒」技術大規模應用在消費電子產品上的公司。
  • 人機互動作品集,一定要展現技術嗎?
    一句話裡甚至連一個「one of」都沒有,展現了CMU作為人機互動專業世界頭把交椅的豪氣和自信。隨著互動設計變得越來越被人們熟知,互動設計相關的行業待遇又極其誘人,近年來申請與科技行業關係密切的HCI人機互動的小夥伴也越來越多了,不僅僅是來自計算機技術專業和設計專業背景的同學,包括本科為心理學、商科、理工科等的同學也越來越多。
  • 智能人機互動讓服務數智化邁向新高度
    而作為數字經濟的重要技術驅動力——人工智慧技術,尤其是多模態智能對話與交互技術的應用與革新,為服務數智化升級帶來了巨大機會。以京東6.18、京東11.11等零售大促舉例,作為京東集團的技術基石,京東智聯雲基於自研的智能人機互動平臺,在內容創作、營銷促進、售前諮詢及售中後服務方面為全球客戶提供了全新的購物體驗。
  • 極星發布人機互動(HMI)的未來理念
    攜手谷歌,極星將繼續提升未來人機互動的體驗更創新、更智能的個人專屬化設定,以及人機互動和安全功能的整合,為用戶提供無縫互聯的車內數字體驗,更便捷,更安全,更順暢極星即將發布全新設計理念,展示未來智能互聯科技和創新環保內飾
  • 華安鑫創:人機互動圖形設計業務獲得較快發展
    華安鑫創的軟體系統開發業務主要是根據客戶需求提供定製化的開發服務,其中,人機互動圖形設計項目的交付成果一般為能夠匹配產品硬體結構、底層和中間層軟體系統以及應用層人機互動軟體的全套視覺設計方案、圖紙,部分項目僅涉及樣機效果圖或概念圖。該類項目的工作量和收費與客戶要求的設計量、設計套數有關。
  • 天貓精靈發布AliGenie5.0人機互動系統,推出「多模態喚醒」模式
    9月17日,天貓精靈在雲棲大會發布了首個全場景人機互動系統AliGenie5.0,將視覺、語音、觸覺等多種形態的交互方式融合在一起,能更精準地感知物理世界,深入理解使用者的意圖。天貓精靈事業部總經理庫偉表示,從AliGenie5.0開始,天貓精靈將開始以服務為中心,應用微內核、多模態交互等技術,構建全場景智能化。據悉,該系統同步面向開發者、智能家居合作夥伴開放。此前,多模態交互技術多停留在學術層面,阿里是業內首個把「多模態喚醒」技術大規模應用在消費電子產品上的公司。
  • 極星Polestar品牌發布新一代人機互動界面
    作者:小魔沃爾沃旗下的高性能品牌極星Polestar最近發布了其新一代人機互動界面,而該界面仍然是與谷歌合作開發而來。這家瑞典公司還表示,新的人機互動界面還將在車輛停車和充電期間為駕乘人員提供來自流行應用的視頻流服務。全新的車載系統還有一項令人印象深刻的功能,那就是當用戶花太多時間觀看中控屏而不是前方路況時,其系統會自動發出警告。這項技術基於先進的眼球追蹤和近距離傳感器,以「可控的方式」提供信息。
  • 天貓精靈發布AliGenie5.0人機互動系統 業內首創「多模態喚醒」
    (記者文雪梅)天貓精靈17日在雲棲大會發布了首個全場景人機互動系統AliGenie5.0,將視覺、語音、觸覺等多種形態的交互方式融合在一起,能更精準地感知物理世界,深入理解使用者的意圖。天貓精靈事業部總經理庫偉表示,從AliGenie5.0開始,天貓精靈將開始以服務為中心,應用微內核、多模態交互等技術,構建全場景智能化。據悉,該系統同步面向開發者、智能家居合作夥伴開放。此前,多模態交互技術多停留在學術層面,阿里是業內首個把「多模態喚醒」技術大規模應用在消費電子產品上的公司。
  • 什麼叫「鮮活」的人機互動?OriginOS給出的答案很標準
    眾所周知,智慧型手機與功能手機最大的區別,並不是外觀設計和核心硬體的搭載,而是最基礎的作業系統,它不僅決定了產品的性能和功能發揮,也影響著消費者的交互體驗。所以在硬體發展不斷成熟的今天,作業系統無疑成為了各大手機廠商立足長遠發展的重要一環,這也是為什麼我們可以看到市面上各種定製OS的原因所在。
  • 天貓精靈發布AliGenie5.0人機互動系統 支持唇動、揮手等多模態...
    鳳凰網科技訊 9月17日消息 在阿里巴巴的雲棲大會上,天貓精靈事業部發布了首個全場景人機互動系統AliGenie5.0,融合了視覺、語音、觸覺等多種形態的交互方式。同時也發布的三款新產品——配備了10吋智能屏及大容量電池的天貓精靈CC10電池版、4吋智能屏產品天貓精靈CC MINI,以及第二代IN糖都搭載了該交互系統。
  • 虛擬實境VR人機互動中的輸入和輸出技術探討
    近年來計算機的發展趨勢之一是形態的多樣化與應用情境的複雜化,自然交互(natural interaction)日益成為人機互動的重要發展方向之一。虛擬實境(Virtual Reality,VR)是新興計算機形態之一,是自然交互的重要組成部分。