12月18日-20日,2020網易未來大會在杭州舉行。大會以「洞覺 未見」為主題,匯聚了全球最強大腦,期盼以遠見超越未見,去尋找打開未來的鑰匙。
大會上,Rokid副總裁、產品技術中心總經理向文杰做了《下一代的人機互動》主題演講。
從第一臺PC出現,比爾蓋茨讓每個人辦公桌上有了一臺PC。接下來Smart Phone,賈伯斯推動了手機普及,接下來是什麼呢?
向文杰認為,當手機再往前演進的時候,下一代的產品一定不是一個更大屏幕的手機,這是不可能的。
Rokid公司生產了智能音響的鼻祖,但是當時向文杰並沒有把它理解成是一個音響,因為它是最簡單、最自然的人機互動的方式。那未來會是智能音箱,還是一個什麼樣的設備呢?向文杰說,這就是他們一直探索的方向,「做出讓更多人更容易使用的東西,我們理解的未來是這樣的」。
向文杰認為,當人跟機器交互的時候,需要輸入法嗎?需要了解各個應用怎麼用嗎?實際上不需要,只要了解它需要聽懂你的話。所以語音能力就要很強,就會變成它基礎的配置。
未來的交互更多是通過語音,通過手勢,更多通過更自然、更直接的方式交互。
帶著自家公司量產的最新款AI眼鏡亮相,向文杰仿佛已經實現了走向未來的基礎操作。
據他介紹,這款AR眼鏡,年初已經量產推向全球。到今天為止,在全世界50多個國家進行了推廣,並且已經在當地開始售賣。國內各個省份,包括浙江省,包括浙大,包括良渚博物院,包括浙江省公安廳,也都開始推廣。
他說,未來已經開始了,新產品接下來會越來越多的來到我們身邊。
以下為向文杰演講的部分內容:
大家好!
剛才聽了一個非常燒腦的演講,雖然沒有太聽懂,但感覺這一定是代表未來的。我接下來做一個相對簡單、也比較有趣的演講。
大家可以看到我現在戴的這副眼鏡,我其實戴的這副眼鏡是已經量產的AI眼鏡。我們過去這4年時間裡一直在探索AI和AR這兩個方向,並且不斷打磨產品。這4年過程中我們發現一個有意思的事情,接下來我們面臨的新時代快來了。就像今天「洞見」大會上講的一樣,未來十年一定會到來的。今天很多同學,很多行業還對這樣一個新的產品,新的領域,只是聽說過,沒有了解過,所以今天我做一個簡單小小的分享,讓大家對這個行業有所了解。
實際上在現階段很多的人對一個概念是分不清楚的,就是什麼叫VR,什麼叫AR,這個東西到底是幹嘛的。我其實在演講之前簡單介紹一下,VR的話,大家現在已經非常普及了,接下來一年的出貨量1000多萬套,在遊戲領域裡、培訓領域裡非常普及。AR剛剛開始,AR已經進入了很長時間,但現在才剛剛開始。剛剛開始意味著什麼,這個行業還沒有被大眾所普及,也沒有被大眾所認知,但是它現在已經被很多行業裡開始利用起來了。我們現在所了解的,很多業內人士了解的是微軟的AR,但在國內AR是蓬勃發展。
簡單介紹一下我們這款AR眼鏡,今年年初正式量產推向全球。到今天為止,它已經在全世界50多個國家進行了推廣,並且當地渠道商、經銷商已經開始售賣了。然後在我們國內各個省份,包括浙江省,包括浙大,包括良渚博物院,包括浙江省公安廳,其實全面都開始推廣這樣一款眼鏡,它已經開始了,只是它接下來會越來越多地來到我們身邊。
我舉個簡單的例子,我今天帶了這個產品的小配件上來。這是我們獨立研發的一款紅外測溫的模組,今年疫情之年,大家習慣用一個很大的設備放在門口來進行防疫測溫。但當我們這個產品剛剛推出時,我們把紅外測溫模組小型化,在全世界範圍內給了很多公司、很多國家帶來很多幫助。包括新加坡、俄羅斯、德國,他們都大批採購這樣的眼鏡,用來幹什麼?用來在移動場景下實時檢測檢疫,做人體溫度的測試。在我們國家更是,包括良渚博物院都已經大量採購。其實這樣一個AI的時代已經開始了。
我接下來開始演講,好像我們講的是AR產品,Rokid公司追求的是人機互動。
我們擁有很好的技術,當我們拿著這個技術的時候,我們希望給到行業什麼東西。
今天我從很多大拿的演講當中學到很多點,我們給到行業裡面不止是效率、不止是創新,還有很多人文關懷,這是Rokid公司很大內核的點。我們需要用科技的變革給行業更好的效率,更好的人機互動體驗,所以我們更強調體驗,更強調互動設計。
當第一臺PC出現的時候,比爾蓋茨講過一句話,讓每個人辦公桌上有一臺PC,他做到了。從我們的角度來看,不僅是科學技術的進步,不僅是通訊的進步,裡面帶來一個點,覆蓋的人群越來越廣。
一開始的時候,小型機只有少量人用,當有了個人PC的時候,很多家庭裡面有了一臺PC。當它有了最早手機的時候,早期雖然做不到人手一臺,到現在為止全世界範圍之內,基本上可以做到人手一臺設備。
接下來叫Smart Phone,大家看到的Smart Speaker這是我們公司2016年推出來的,大家可以叫智能音響,也可以叫智慧機器人。我們為什麼做它?我們相當於是一個智能音響的鼻祖,但是我們並沒有把它理解成是一個音響,因為它是最簡單、最自然的人機互動的方式。就是因為有了它,我們才能做出未來讓更多人使用、更容易使用的東西,這是我們最追求的方向和目標,我們理解的未來是這樣的。
剛才講演進的趨勢有兩個點,第一個點是獲取信息的效率,移動網際網路一定比網際網路獲取效率高,傳統的PC一定比更早的電報、電話這種獲取信息效率高,再往前是什麼?手機現在屏幕已經不可能變大了,現在有5G、6G,對應的載體是什麼?有什麼特點?是更大屏幕的手機嗎?還是一個什麼樣的設備?這就是我們一直在探索的方向。
我們認為未來的設備有一個很大的特點,一定是便攜的,像手機在身上隨時可以用。當便攜再往前一步的時候就是隨身設備,應該沒有一個設備比眼睛是更隨身的設備,可以隨時隨地擴展眼睛的能力,現在很多手環、手錶,可攜式設備可以很快擴展個人的想像和能力,它可以快速獲取信息。相比手機而言,雖然不可能取代手機,這個是不可能的,像手機也取代不了電腦。但是會產生一個情況,極大地擴展人類的想像空間和可能性。
第二,更友好的交互。現在講交互相對少一點,可能設計師講的多一些,因為我們是產品公司,更多會強調交互。剛才給大家看到的Smart Speaker有什麼好處?在我們整個用戶場景裡面最大的好處是小朋友可以使用,沒有文化的老人也可以使用,所有的人都可以用。為什麼?因為它用的是最自然的交互手段,人和人之間肯定用最自然的手段交流,文字可能都不是最自然的,最自然的可能就是講話。人機互動,語音一定是最自然的,手勢一定是最自然的,還有更多自然的交互方式,以前這些都不成熟。
大家知道AR這個行業不是現在產生的,50年前已經有了,為什麼現在越來越成熟了?越來越敢暢想10年以後讓AR普及,就是AI助力。我們結合AI能力、AR能力,打造更好更自然的交互。
我們這裡提出來一個論斷,這是我們公司共同認同的點,當手機再往前演進的時候,下一代的產品一定不是一個更大屏幕的手機,這是不可能的。當到某一天大家戴上這幅眼鏡的時候,今天沒有機會讓每個人體驗一下,但是打個廣告,大家可以去良渚博物院體驗這款眼鏡,我們通過這款眼鏡讓博物院各種各樣的文物有更豐富的體驗。帶來的好處是當人機互動往前走的時候,手機不再是唯一。而當你跟它交互的時候,你需要輸入法嗎?需要了解各個應用怎麼用嗎?實際上不需要,你只要了解它需要聽懂你的話,所以語音能力就會很強,就會變成它基礎的配置。未來的交互更多是通過語音,通過手勢,更多通過更自然、更直接的方式交互。這樣的交互是老人和小孩都會用的,只有這樣才不會讓科技把任何人拋下。
今天大會剛開始的時候,我聽到一句話,可能是丁磊講的,我們的科技不僅僅是提升效率,更重要的是關注人文。這是我們想做的,希望把更好的科技,AI、AR的科技,這些能力集成到一個更好的產品裡面,但是最終給到用戶的應該是一個最好的交互。我們希望用最簡單、最自然的交互,讓所有人使用它。
當這點實現的時候,人機互動的終極形態,再往前走一步就是腦機交互了,不是我們今天探討的。在這個行業裡面,科技的高速進步不斷湧入,未來10年,非常值得期待。
到目前為止,AR眼鏡在C端大家看到的非常少,這也是經常有人問我,你們說MR、VR、AR是什麼區別。在產業網際網路裡面是非常流行的,包括大家看到的第一個就是良渚博物院。目前我們跟全國100多家博物館開展了讓博物館現在所有展品變成信息化,變成可互動的,變成讓所有小朋友到博物館以後能get更多信息,不需要你有很強的操作能力,不需要有很強的理解能力,因為AR可以讓你更容易理解它,理解這些沉睡在地下的文物,目前這件事情已經陸續開展了。接下來大家都能看到。
現在的兩會報導,很多媒體報導還是採用傳統的手機、直播方式,未來的制博會是另外一種主流。在外貿裡面變得越來越流行了。
工業領域,Rokid AR眼鏡現在在德國是最主要的出口地,德國是工業4.0的提出國。AR設備作為工業4.0產業網際網路核心的器件,現在正在被各個行業所接受,現在我們這款眼鏡在德國出口量最大,因為他們的工業網際網路需要這樣的終端,需要一個終端,除了能夠讓他實時看到操作過程中的步驟,裡面所具備的AI能夠可以輔助這個工人看看他做的對不對,是不是有更好的策略,並且把整個過程記錄下來進行AI分析,最後反饋給他,你可以做得更好。其實這件事情在德國開始了,在國內也開始了,我們跟中國石油、跟國家電網、跟國內很多大型汽車廠商都已經開始陸續合作。
接下來在這些產業裡面,AI會成為一個標配,成為產業工人的標配,會打造未來工業網際網路時代超級工人必備的武器,這就是接下來這個行業裡馬上會發生的。
最後就是公共服務。剛才講到防疫,講到包括大型活動的安保,包括烏鎮網際網路大會,包括阿里巴巴年會,都會採購這樣的眼鏡,作為現場安保重要的安保工具。為什麼?它的AI能力讓每一個現場的服務人員火眼金睛,具備識別問題的能力,實時保持前端和後臺通信的能力。遠遠不僅限於上面四個領域,在很多行業都已經迅速普及。
Rokid公司在杭州是AI和AR方面的獨角獸,我們為什麼會做AI?本質還是回到最早講的交互。因為AR能很大程度上改善人的交互,讓所有剛才講的小孩、老人,所有人都可以利用這個科技,而不是對科技產生排斥。
AI在這個裡面幹什麼?降低很多複雜操作,你不需要做,用最自然的方式跟他交流、溝通就可以了。
分享之前,我看到有一位同學分享數字人,這也是我們在追求的方向。雖然我們還沒有這個技術,但是我們完全可以合作,數字人也是基於AI技術實現了,AI技術無所不在。我們會把所有跟交互相關的AI技術整合到我們這個設備裡面,讓全世界所有人都能使用,它可以聽得懂16種語言,這是因為AI技術的原因,這就是為什麼AR發展了40多年沒有落地,現在高速落地了,因為AI在發展,AI的發展賦予它更好的交互能力、更好的體積、更輕便、更強的能力,所以說是AI讓AR開始落地了,AI讓AR在未來10年裡能夠從不能落地,到工業裡面、產業裡面落地,最後再到C端消費者這邊落地,這是接下來的趨勢。
它能夠做到我剛剛講到的,AI更懂你,「懂你」意味著你很多事情不用做了,你講話就好。可以把你流程優化掉,然後顯示在你眼前,你跟它可進行實時互動,我們目前為止把它們兩個結合得還是比較好,未來有很多的挑戰。
這就是我們想要做的事情,很多同學對這個概念不是很了解,如果大家關注到普通人在使用高科技產品的時候感受的時候,大家應該能感受的。我們當時在做智能音箱時非常明顯感受到,非常多的人對智能產品不敢用,躲得遠遠的,會對高科技隔離起來,包括電子支付也是一樣。我們能做的事情是讓這些複雜的東西簡單,讓它出現在你的眼前,讓它以最自然的交互進行交互。讓小孩、老人所有人,國內外所有人都可以快速進行交流,快速實現它的功能,這就是我們想通過這個眼鏡來實現的事情。就像剛才講的,這是我們的使命,這是我們想要做的事情,讓每個人都能享受科技。
謝謝大家!
來源:網易科技
審讀:孫世建