向文杰:人機互動的終極形態是腦機交互

2020-12-22 杭州網

杭州網訊 12月18日-20日,2020網易未來大會在杭州盛大舉行。大會以「洞覺 未見」為主題,匯聚了全球最強大腦,期盼以遠見超越未見,去尋找打開未來的鑰匙。

大會上,Rokid副總裁、產品技術中心總經理向文杰做了《下一代的人機互動》主題演講。

從第一臺PC出現,比爾蓋茨讓每個人辦公桌上有了一臺PC。接下來Smart Phone,賈伯斯推動了手機普及,接下來是什麼呢?

向文杰認為,當手機再往前演進的時候,下一代的產品一定不是一個更大屏幕的手機,這是不可能的。

Rokid公司生產了智能音響的鼻祖,但是當時向文杰並沒有把它理解成是一個音響,因為它是最簡單、最自然的人機互動的方式。那未來會是智能音箱,還是一個什麼樣的設備呢?向文杰說,這就是他們一直探索的方向,「做出讓更多人更容易使用的東西,我們理解的未來是這樣的」。

向文杰認為,當人跟機器交互的時候,需要輸入法嗎?需要了解各個應用怎麼用嗎?實際上不需要,只要了解它需要聽懂你的話。所以語音能力就要很強,就會變成它基礎的配置。

未來的交互更多是通過語音,通過手勢,更多通過更自然、更直接的方式交互。

帶著自家公司量產的最新款AI眼鏡亮相,向文杰仿佛已經實現了走向未來的基礎操作。

據他介紹,這款AR眼鏡,年初已經量產推向全球。到今天為止,在全世界50多個國家進行了推廣,並且已經在當地開始售賣。國內各個省份,包括浙江省,包括浙大,包括良渚博物院,包括浙江省公安廳,也都開始推廣。

他說,未來已經開始了,新產品接下來會越來越多的來到我們身邊。

以下為向文杰演講的部分內容:

大家好!

剛才聽了一個非常燒腦的演講,雖然沒有太聽懂,但感覺這一定是代表未來的。我接下來跟一個相對簡單,也比較有趣的演講。

大家可以看到我現在戴的這副眼鏡,我其實戴的這副眼鏡是已經量產的AI眼鏡。我們過去這4年時間裡一直在探索AI和AR這兩個方向,並且不斷打磨產品。這4年過程中我們發現一個有意思的事情,接下來我們面臨的新時代快來了。就像今天「洞見」大會上講的一樣,未來十年一定會到來的。今天很多同學,很多行業還對這樣一個新的產品,新的領域,只是聽說過,沒有了解過,所以今天我做一個簡單小小的分享,讓大家對這個行業有所了解。

實際上在現階段很多的人對一個概念是分不清楚的,就是什麼叫VR,什麼叫AR,這個東西到底是幹嗎的。我其實在演講之前簡單介紹一下,VR的話,大家現在已經非常普及了,接下來一年的出貨量1千多萬套,在遊戲領域裡、培訓領域裡非常普及。AR剛剛開始,AR已經進入了很長時間,但現在才剛剛開始。剛剛開始意味著什麼,這個行業還沒有被大眾所普及,也沒有被大眾所認知,但是它現在已經被很多行業裡開始利用起來了。我們現在所了解的,很多業內人士了解的是微軟的AR,但在國內AR是蓬勃發展。

簡單介紹一下我們這款AR眼鏡,今年年初正式量產推向全球。到今天為止,它已經在全世界50多個國家都進行了推廣,並且當地渠道商、經銷商已經在當地開始售賣了。然後在我們國內各個省份,包括浙江省,包括浙大,包括良渚博物院,包括浙江省公安廳,其實全面都開始推廣這樣一款眼鏡,它已經開始了,只是它接下來會越來越多的來到我們身邊。

我舉個簡單的例子,我今天帶了這個產品的小配件上來。這是我們獨立研發的一款紅外測溫的模組,今年疫情之年,大家習慣的是用一個很大的設備放在門口來進行防疫測溫。但當我們這個產品剛剛推出時,我們把紅外測溫模組小型化,在全世界範圍內給了很多公司、很多國家帶來很多幫助。包括像新加坡、俄羅斯、德國,他們都大批採購這樣的眼鏡,用來幹什麼?用來在移動場景下實時檢測檢疫,做人體溫度的測試。在我們國家更是,包括良渚博物院都已經大量採購。其實這樣一個AI的時代已經開始了。

我接下來開始演講,好像我們講的是AR產品,Rokid公司追求的是人機互動。

我們擁有很好的技術,當我們拿著這個技術的時候,我們希望給到行業是什麼東西。

今天我從很多大拿的演講當中學到很多點,我們給到行業裡面不止是效率、不止是創新,還有很多人文關懷,這是Rokid公司很大內核的點。我們需要用科技的變革給行業更好的效率,更好的人機互動體驗,所以我們更強調體驗,更強調互動設計。

這張圖大家在無數地方看過,今天我用另外一個方式給大家解讀一下。

當第一臺PC出現的時候,比爾蓋茨講過一句話,讓每個人辦公桌上有一臺PC,他做到了。從我們的角度來看,不僅是科學技術的進步,不僅是通訊的進步,裡面帶來一個點,覆蓋的人群越來越廣。

一開始的時候,小型機只有少量人用,當有了個人PC的時候,很多家庭裡面有了一臺PC。當它有了最早手機的時候,早期雖然做不到人手一臺,到現在為止全世界範圍之內,基本上可以做到人手一臺設備。

接下來叫Smart Phone,大家看到的Smart Speaker這是我們公司2016年推出來的,大家可以叫智能音響,也可以叫智慧機器人。我們為什麼做它?我們相當於是一個智能音響的鼻祖,但是我們並沒有把它理解成是一個音響,因為它是最簡單、最自然的人機互動的方式。就是因為有了它,我們才能做出來未來讓更多人使用,而且讓更多人更容易使用的東西,這是我們最追求的方向和目標,我們理解的未來是這樣的。

剛才講演進的趨勢有兩個點,第一個點是獲取信息的效率,移動網際網路一定比網際網路獲取效率高,傳統的PC一定比更產生的電報、電話這種獲取信息效率高,再往前是什麼?手機現在屏幕已經不可能變大了,現在有5G、6G,對應的載體是什麼?有什麼特點?是更大屏幕的手機嗎?還是一個什麼樣的設備?這就是我們一直在探索的方向。

我們認為未來的設備有一個很大的特點,一定是便攜的,像手機在身上隨時可以用。當便攜再往前一步的時候就是隨身設備,應該沒有一個設備比眼睛是更隨身的設備,可以隨時隨地擴展眼睛的能力,現在很多手環、手錶,可攜式設備可以很快擴展個人的想像和能力,它可以快速獲取信息。相比手機而言,雖然不可能取代手機,這個是不可能的,像手機也取代不了電腦。但是會產生一個情況,極大可能的擴展人類的想像空間和可能性。

第二,更友好的交互。現在講交互相對少一點,可能設計師講的多一些,因為我們是產品公司,更多會強調交互。剛才給大家看到的Smart Speaker有什麼好處?在我們整個用戶場景裡面最大的好處是小朋友可以使用,沒有文化的老人也可以使用,所有的人都可以用。為什麼?因為它用的是最自然的交互手段,人和人之間肯定用最自然的手段交流,文字可能都不是最自然的,最自然的可能就是講話。人機互動,語音一定是最自然的,手勢一定是最自然的,還有更多自然的交互方式,以前的時候這些都不成熟。

大家知道AR這個行業不是現在產生的,50年已經有了,為什麼現在越來越成熟了?越來越敢暢想10年以後讓AR普及,就是AI助力。我們結合AI能力、AR能力,打造更好更自然的交互。

我們這裡提出來一個論斷,這是我們公司共同認同的點,當手機再往前演進的時候,下一代的產品一定不是一個更大屏幕的手機,這是不可能的。當到某一天大家戴上這幅眼鏡的時候,今天沒有機會讓每個人體驗一下,但是打個廣告,大家可以去良渚博物院體驗這款眼鏡,我們通過這款眼鏡讓博物院各種各樣的文物有更豐富的體驗。帶來的好處是當人機互動往前走的時候,不是唯一是手機的時候,是什麼?讓視野變得更寬闊,可以讓空間裡面隨時隨地顯示你所需要的信息。當你跟它交互的時候,你需要輸入法嗎?需要了解各個應用怎麼用嗎?實際上不需要,你只要了解它需要聽懂你的話,所以語音能力就會很強,就會變成它基礎的配置。未來的交互更多是通過語音,通過手勢,更多通過更自然、更直接的方式交互。這樣的交互才是小孩子會用的,老人會用的,所有人都會用的,只有這樣才會不讓科技把任何人拋下,讓每個人享受科技,讓每個人感受科技帶來的樂趣。

今天大會剛開始的時候,我聽到一句話,可能是丁磊講的,我們的科技不僅僅是提升效率,另外更重要的是關注人文。這是我們想做的,希望把更好的科技,AI、AR的科技,這些能力集成到一個更好的產品裡面,但是最終給到用戶的應該是一個最好的交互,關注它,讓他不用避免高科技帶來的不會用,我很慌,我想避開它,這個東西太複雜了,我們希望用最簡單、最自然的交互,讓所有人使用它。

當這點實現的時候,人機互動的終極形態,再往前走一步就是腦機交互了,不是我們今天探討的。從過去探索的4年來,在這個行業裡面,科技的高速進步不斷湧入,未來10年,非常值得期待。

到目前為止,AR眼鏡在C端大家看到的非常少,這也是經常有人問我,你們說MR、VR、AR是什麼區別。在產業網際網路裡面是非常流行的,包括大家看到的第一個就是良渚博物院。目前我們跟全國100多家博物館開展了讓博物館現在所有展品變成信息化,變成可互動的,變成讓所有小朋友到博物館以後能get更多信息,不需要你有很強的操作能力,不需要有很強的理解能力,因為AR可以讓你更容易理解它,理解這些沉睡在地下的文物,目前這件事情已經陸續開展了。接下來大家都能看到。

這是兩會報導,現在很多媒體報導還是採用傳統的手機、直播方式,未來的制博會是另外一種主流。在外貿裡面變得越來越流行了。

工業領域,Rokid AR眼鏡現在在德國是最主要的出口地,德國是工業4.0的提出國。AR設備作為工業4.0產業網際網路核心的器件,現在正在被各個行業所接受,現在我們這款眼鏡在德國出口量最大,因為他們的工業網際網路需要這樣的終端,需要一個終端,除了能夠讓他實時看到操作過程中的步驟,裡面所具備的AI能夠可以輔助這個工人看看他做的對不對,是不是有更好的策略,並且把整個過程記錄下來進行AI分析,最後反饋給他,你可以做得更好。其實這件事情在德國開始了,在國內也開始了,我們跟中國石油、跟國家電網、跟國內很多大型汽車廠商都已經開始陸續合作了。

接下來在這些產業裡面,AI會成為一個標配,成為產業工人的標配,會打造未來工業網際網路時代超級工人必備的武器,這就是接下來這個行業裡面馬上會發生的。

最後就是公共服務。剛才講到防疫,講到包括大型活動的安保,包括烏鎮網際網路大會,包括阿里巴巴年會,都會採購這樣的眼鏡,作為現場安保重要的安保工具。為什麼?它的AI能力讓每一個現場的服務人員火眼金睛,具備識別問題的能力,實時保持前端和後臺通信的能力。遠遠不僅限於上面四個領域,在很多行業都已經迅速普及。

我們為什麼做AI,Rokid公司在杭州是AI和AR方面的獨角獸,為什麼會做AI?本質還是回到最早講的交互。因為AR能很大程度上改善人的交互,讓所有剛才講的小孩、老人,所有人都可以利用這個科技,而不是對科技產生排斥。

AI在這個裡面幹什麼?降低很多複雜操作,你不需要做了,用最自然的方式跟他交流、溝通就可以了。

分享之前,我看到有一位同學分享數字人,這也是我們在追求的方向。雖然我們還沒有這個技術,但是我們完全可以合作起來,數字人也是基於AI技術實現了,AI技術無所不在。我們會把所有跟交互相關的AI技術整合到我們這個設備裡面,讓全世界所有人,各個語言的人,它可以聽得懂16種語言的,這是因為AI技術的原因,這就是為什麼AR發展了40多年沒有落地,現在高速落地了,因為AI在發展,AI的發賦予它更好的交互能力、更好的體積、更輕便、更強的能力,所以說這就是AI讓AR開始落地了,AI讓AR在未來10年裡面能夠從不能落地,到工業裡面、產業裡面落地,最後再到C端消費者這邊落地,這是接下來的趨勢。

它能夠做到我剛剛講到的,AI更懂你,「懂你」意味著你很多事情不用做了,你講話就好。可以把你流程優化掉,然後顯示在你眼前,你跟它進行實時互動,我們現在做的事情,我們目前為止把它們兩個結合得還是比較好,未來有很多的挑戰。

這就是我們想要做的事情,很多同學對這個概念不是很了解,如果大家關注到普通人在使用高科技產品的時候感受的時候,大家應該能感受的。我們當時在做智能音箱時非常明顯感受到,非常多的人對智能產品不敢用,躲的遠遠的,會對高科技隔離起來,包括電子支付也是一樣。我們能做的事情是讓這些複雜的東西簡單,讓它出現在你的眼前,讓它以最自然的交互進行交互。讓小孩、老人所有人,國內外所有人都可以快速進行交流,快速實現它的功能,這就是我們想通過這個眼鏡來實現的事情。就像剛才講的,這是我們的使命,這是我們想要做的事情,讓每個人都能享受科技。

謝謝大家!

2020網易未來大會由杭州市人民政府和網易公司聯合主辦,杭州市商務局、杭州市經濟和信息化局、杭州市濱江區人民政府、北京網易傳媒有限公司以及網易(杭州)網絡有限公司承辦,中國移動總冠名。大會將進行三天的頭腦風暴、涵蓋了預見未來、新基建、人工智慧、區塊鏈、潮商業、UP生活以及和文化等論壇。

相關焦點

  • Rokid副總裁向文杰:人機互動的終極形態是腦機交互
    大會上,Rokid副總裁、產品技術中心總經理向文杰做了《下一代的人機互動》主題演講。從第一臺PC出現,比爾蓋茨讓每個人辦公桌上有了一臺PC。接下來Smart Phone,賈伯斯推動了手機普及,接下來是什麼呢?
  • 36氪獨家|國產腦機交互從概念到現實,「腦陸科技」獲得近億元融資
    36氪獲悉,腦機交互企業「腦陸科技」近日完成近億元融資,投資方為濟南生技醫療產業發展母基金,及多家市場投資機構。腦陸科技是36氪持續關注的基於神經網絡算法的腦機交互頭部企業。該平臺由清華大學人工智慧研究院院長張鈸院士擔任首席技術專家,在使用過程中獲得清華大學人機互動研究國際知名學者史元春教授和劉永進教授的重視與推廣。特別值得強調的是,在張鈸院士的指導下,腦陸科技主導研發的腦數據計算平臺,是一個對下遊企業免費的開放平臺。以往,國內腦電研發方面嚴重依賴進口,上遊技術領域被進口產品壟斷。
  • 極星發布人機互動(HMI)的未來理念
    攜手谷歌,極星將繼續提升未來人機互動的體驗更創新、更智能的個人專屬化設定,以及人機互動和安全功能的整合,為用戶提供無縫互聯的車內數字體驗,更便捷,更安全,更順暢極星即將發布全新設計理念,展示未來智能互聯科技和創新環保內飾
  • 華安鑫創:人機互動圖形設計業務獲得較快發展
    華安鑫創的軟體系統開發業務主要是根據客戶需求提供定製化的開發服務,其中,人機互動圖形設計項目的交付成果一般為能夠匹配產品硬體結構、底層和中間層軟體系統以及應用層人機互動軟體的全套視覺設計方案、圖紙,部分項目僅涉及樣機效果圖或概念圖。該類項目的工作量和收費與客戶要求的設計量、設計套數有關。
  • 什麼叫「鮮活」的人機互動?OriginOS給出的答案很標準
    眾所周知,智慧型手機與功能手機最大的區別,並不是外觀設計和核心硬體的搭載,而是最基礎的作業系統,它不僅決定了產品的性能和功能發揮,也影響著消費者的交互體驗。對於國產巨頭vivo來說,FuntouchOS近幾年來雖然也保持著不錯的升級,但在UI設計、交互體驗等方面,卻顯得有點保守,與vivo強勢創新的品牌形象有點「不匹配」。鑑於這種情況,vivo於11月18日,正式推出了全新的作業系統OriginOS,為消費者開啟了人機互動體驗的「新窗口」。
  • 安全為先價值為重 汽車人機互動醞釀超級進化
    在自動駕駛時代,無論車內空間還是汽車與周圍環境的人機互動(HMI),都將迎來顛覆性改變。屆時,汽車底盤很可能實現通用化,製造將主要依靠機器人,而交互體驗仍離不開人的設計。在此前舉行的「芯創杯」高校未來汽車人機互動設計大賽(以下簡稱「『芯創杯』」大賽)全國總決賽上,參賽選手就通過一個個腦洞大開的作品,描繪出令人心馳神往的自動駕駛時代HMI 圖景。比如,汽車座椅形態是相對固定的,北京理工大學伍睡團隊的作品則將座椅變成了一張床。
  • 柔宇發布RoWrite 2(柔記2)、智能音箱 人機互動技術更進一步
    人機互動技術更進一步,柔性技術未來可期  兩款新產品的落地,意味著人機互動技術的更進一步。自計算機誕生以來,人們便在不斷思考如何與計算機更好的交互,以至於計算機的發展歷史一度被認為是交互模式的變革史。
  • 「觸摸」未來:人機互動HMI為我們搭建通向新時代的橋梁
    而作為機器與人類之間「溝通」的橋梁,人機互動HMI在當下所扮演的角色正變得日益複雜起來。隨著智能化技術逐漸滲透到各行各業,大到社會層面的工業生產、醫療衛生,小到個人層面的工作生活、交通出行,處處我們都不難發現人機互動的影子。
  • 腦控萬物,BrainCo 發布腦機接口人類智能作業系統 BrainOS
    美國東部時間 8 月 26 日晚上 10 點,哈佛創新實驗室的華人腦機接口創業企業 BrainCo 在位於美國波士頓的哈佛大學展示了 BrainOS 人類大腦智能作業系統的初步成果,這一發布,宣告了人機互動領域進入到了一種裡程碑式的新階段。
  • 人機互動:為何我們在同一個地方搞砸了兩次?
    交互的黎明沒有機器,就沒有人機互動可言。駕駛汽車、飛機需要交互,從一個自動售貨機或者ATM裡買飲料、取錢也需要交互,這些暫且不談。上述一切和計算機的人機互動都離不開手的精細操作,為什麼呢?簡單的事實是因為除了手我們沒得選。皮質小人是將人身體各部分比例按照神經區域佔比大小所繪製的人體模型,看起來有些誇張和滑稽的模型透露出一個簡單的事實:手和手指背後對應的腦部感官和運動神經區域面積巨大。
  • 34歲海歸博士攻克人機互動反饋難題,發明「皮膚VR」
    針對產品的外在形態,于欣格給出了兩種解決方案:一種是類皮膚形態,可以舒適地貼附在身體各個部位,低模量的軟矽膠可用於封裝和提供與皮膚間的粘附力,不藉助膠帶或綁帶就能自由穿戴在身上;另一種是通過織物形式做成我們日常生活中穿戴的輕薄外衣,隨時穿戴在身上。  「只要有需要,皮膚 VR 可以是任何形態。」 于欣格表示。
  • 可穿戴的舌頭滑鼠,催生「黏膩」人機互動的新想像?
    這一點正是未來人機互動、「人機人」交互應該有的模樣:顯然,清晰逼真的視覺、如假包換的聽覺模擬已經不能滿足人們對於人機互動的需求,能模擬出觸覺等體感信息,才能真正讓人們獲得相隔千裡又身臨其境的感覺。這還不夠。佛家講「眼耳鼻舌身意」六根有情通道,顯然我們的感覺器官還有可挖掘的地方。
  • 智能語音在人機互動中的應用
    人機互動是指人與計算機的信息交換,包括計算機通過輸出或顯示設備給人提供信息,以及人通過輸入設備向計算機輸入有關信息。人機互動的目的就是討論如何使設計的計算機能夠幫助人們更加安全可靠,更加有效率地完成所要完成的任務。從以上概念可以看出,人機互動是指用戶和機器之間相互交換信息。
  • ...BrainCo發布腦機接口作業系統,實現了「讀心術」、「隔空打字」
    據了解,腦機接口這一技術最早於 1973 年由美國加州大學洛杉磯分校的威達爾教授提出,卻因當時計算機發展水平仍較為初級等原因,未能吸引較多關注。隨著計算機行業迅速發展,用戶對於人機互動有了更高效率的追求。
  • 不一樣的「注意力」:人機互動注意力的測量指標與利用
    在這裡,我們談到的注意力與大家非常熟悉的機器學習中的注意力模型(Attention Model,AM)不同,本文討論的是人機互動中的注意力問題。人機互動中的這種注意力也被稱為是用戶的關注焦點(User's focus Of Attention)。
  • 可穿戴的「舌頭滑鼠」,催生「黏膩」人機互動的新想像?
    這一點正是未來人機互動、「人機人」交互應該有的模樣:顯然,清晰逼真的視覺、如假包換的聽覺模擬已經不能滿足人們對於人機互動的需求,能模擬出觸覺等體感信息,才能真正讓人們獲得相隔千裡又身臨其境的感覺。這還不夠。佛家講「眼耳鼻舌身意」六根有情通道,顯然我們的感覺器官還有可挖掘的地方。除了視覺、聽覺、鼻子的嗅覺和身體皮膚的觸覺之外,我們還有舌頭的味覺以及觸覺。
  • 聽聲辨位、手勢交互等,長安UNI-K這些智能交互亮點很牛!
    前幾日,長安汽車應粉絲的要求,首次向大家展示了UNI-K的動態表現,讓大家感受到了其寬適、靜謐的大空間。而今日(1月15日),長安汽車未來美好之旅再度開啟,而這一次的主題是智能人機互動。無障礙人機溝通,無疑讓更多消費者對UNI-K更具好感。
  • 科技早聞:天貓精靈發布AliGenie5.0人機互動系統,微信上線粵語語音...
    一、天貓精靈發布AliGenie5.0人機互動系統9月17日,天貓精靈在雲棲大會發布了首個全場景人機互動系統AliGenie5.0。據了解,AliGenie5.0首次將唇動、手勢、語音語義等多種形態的信息輸入融合在一起,可通過多模態感知的方式理解人類的交流意圖,並直接給出反饋。
  • 用上觸控板的 iPad Pro,是蘋果對人機互動的一次妥協 | 愛範兒
    用上觸控板的 iPad Pro,是蘋果對人機互動的一次妥協 iPad 作為平板電腦誕生,至今已有十個年頭。
  • 交互專業就業好薪酬高?未來萬物皆可交互!
    互動設計專業作為國內新興起的熱門專業在選擇學習互動設計專業的時候常常會感到困惑和迷茫:交互的應用範圍這麼廣,該學習哪些課程?這個專業未來的發展前景會是什麼?「什麼是互動設計?」交互(each other),即交流互動。