Rokid發布第二代智能語音機器人,這次它的遠景目標是「讓AI無處不在」
2017-06-13 10:11 rokid 智能音箱
智能語音設備終端已經成為科技巨頭競爭的新戰場。日前蘋果的HomePod刷遍了朋友圈,在此之前,微軟聯手哈曼卡頓推出了基於Cortana語音助理的音箱invoke,與亞馬遜Echo和Google Home,展開了同臺競爭。
國內的智能語音交互終端,也早已加入了這場角逐。
6月8日,Rokid在北京宣布,其第二代智能語音機器人「若琪•月石」全渠道上市。同時,Rokid推出了個性化聲紋識別。「若琪」能夠識別20個人以內的聲紋,它會知道當前在下達指令的是「誰」,從而保證使用的安全性和私密性。藉助遠場識音算法,它還能在嘈雜環境下準確分辨出聲音來源,識別距離最遠可達10米。在記住了每個人之後,「若琪」還會記住你的使用習慣進行個性化推薦。
「我們的目標是最終打造『無處不在的AI』。」Rokid創始人Misa說。對於媒體而言,Misa相對而言是個極其低調的創始人,這也是他少數出來面對媒體的活動之一。而這次,他除了談到若琪的技術亮點之外,更是公開了rokid在未來的研發計劃。
也許,一個智能音箱的風口,真的要來到了。
智能語音機器人「若琪•月石」
亞馬遜曾經表示,智能音箱,可以被看作是語音微交互界面的新型計算設備。Gartner也曾預測,到2018年,有30%的人機互動都將通過自然語言完成。智能語音交互的家用終端,以其下一代交互的技術入口,以及其覆蓋了硬體和內容等生態系統的廣度,成為各大巨頭的必爭之地。而對於創業公司而言,若想在其中立足,競爭難度也是巨大的。
相比Google Home和Amazon Echo以及市面上大部分採用第三方語音技術的同類產品,據Rokid北京A-Lab負責人高鵬介紹,Rokid的核心AI語音交互技術均為自主研發。對此,Misa說:「Rokid並不反對用別人的技術,我們也有一些跟其他人合作的東西,但前提是它必須滿足我們對產品的定義。」據Misa介紹,Rokid目前有兩個實驗室,北京的A-lab主要負責AI算法,在美國的R-lab主要負責計算機視覺以及機器人方面的研發。在Rokid團隊中有諸多來自中科院自動化所多年從事語音技術研究的博士,具備足夠的技術積累。
Rokid對自身產品的定位也在目前上市的「若琪•月石」中得到了體現。它的能力包括音樂播放、智能家電控制、講故事、播報新聞、日程提醒、天氣預報、實時翻譯、計算等。但和Echo以及Google Home相比,Rokid產品負責人向文杰表示,他們更希望,若琪是一款「帶有性格」的產品。同時,Misa也表示,若琪和用戶之間,正在建立起自己的「情感」。
「聲紋識別」是若琪本次產品最值得關注的亮點之一。在滑鼠、觸屏之後,語音交互被認為是下一代新的交互方式,而聲紋識別將會提供給機器「認識你」的功能。若琪可以記錄幾十個家庭成員的聲音並進行識別,只要和它說過話,下次打開「若琪」,它都能認出是誰,並且還能準確識別說話的人是在哪個方向。聲紋識別的功能,讓「若琪」可以在多人場景下選擇主人的指令進行完成。「若琪」會知道當前在下達指令的是你而不是別人,因此安全性和私密性要比同類產品高。
同時,該功能也可讓「若琪」完成對家庭各成員的精準服務。認識了你之後,作為具備學習功能的智慧機器人,「若琪」還會在日常接觸中逐步記住你的喜好習慣並形成後臺數據收集整理,在之後的使用中,它會針對性地向你推送內容以及個性化服務。Misa表示,聲紋識別成果近期也將升級給所有若琪用戶。
藉助遠場識音算法,「若琪」還能在嘈雜環境下準確分辨出聲音來源,識別距離最遠可達10米,常見的家庭住宅都在這個範圍之內。
對於智能音箱而言,之所以吸引了巨頭們的目光,主要還在於它開啟了更廣闊的智能家居生態市場的大門。智能語音助手可以控制家居設備,成為各種家用設備的控制中樞入口;以及獲取更多用戶數據,搭載不同的內容、電商、生活類應用,成為新的應用平臺。
Misa表示,若琪現在已聯通絕大部分國內主流廠商的上百種智能家電設備,而且針對目前IOT設備品牌眾多,接口不一的情況,Rokid可以用一套API接口直接打通,實現更多智能家居品牌的跨廠商兼容。據透露,Rokid目前已經跟LifeSmart、歐瑞博、broadlink、小米等達成了合作協議。
同時,除了家電外,Rokid正在打通與「餓了麼」、「滴滴出行」等服務平臺的連接,未來「若琪」將能提供多元化的服務,比如處理叫外賣、叫車等日常瑣事。
而另外值得一提的是,Rokid在音樂內容上下的功夫。據介紹,「若琪•月石」上擁有正版授權的320K品質、6百萬首音樂和其他音頻內容。「全部由我們付費,用戶收聽。」Misa說。
「若琪•月石」現在已經在天貓、京東等線上商城、全國重點省份城市的500多家門店以及國內潮品、機場高鐵等線下店面全渠道上線,定價為1399元人民幣。
但在Misa看來,消費級AI產品,在三年之內,還將有一個更大的升級:從感知到認知,從單設備到多設備互動,以及AI大腦的雲端化。屆時,一個「無處不在的AI」,將是Rokid要去打造的未來。
Rokid創始人Misa
以下為Misa的分享,經黑智編輯整理:
Rokid是一家AI公司,我們主要做兩件事情:AI的大腦,以及AI的交互。現在關於AI的話題已經非常多了,但實際上,AI能做的事情還沒那麼多。它現在主要能做的,第一是幫你做決策,第二則是提升你的各方面體驗。在今天,AI還是偏工具性的。
Rokid成立已經三年多了,差不多同時候,亞馬遜推出了Echo,讓市場開始對語音交互的信心增強了。剛才高鵬也講到了,我們對語音識別不陌生,但是在家庭場景裡面,遠場,有混響,我們能不能做到很好的體驗?很多人心裡沒底,包括我們也探索了很長時間。我們在第一代產品推出的時候,其實也是要給大家一個信心,我們自己也發現,用戶對這個產品接受度開始變得很高。那麼,三年後的今天,Rokid又會怎麼去思考它?
AI的全面升級
1、AI開始從感知到認知的全面升級:個體認知——環境認知——事務認知或意圖認知
我能聽得到你的聲音,同時知道你在講什麼,這屬於感知。認知是什麼概念呢?比如聲紋識別,用戶的體驗就是當你家裡不同的人跟若琪在講話的時候,她知道這個人是誰。我的結論是,語音技術裡面的個體認知就像智慧型手機裡的觸屏一樣,將會引發產業的大革命。
第二個是環境的認知,一個AI的硬體或者一個產品,它可以對自己的環境作出認知:我現在是在客廳還是廚房、車上或者在什麼地方。第三是對事務的認知,有的人把它叫意圖的認知,即當我和機器溝通或者交互的時候,機器或者智能大概能知道你要幹什麼,比如我們表達一個任務,說我要從杭州去北京,非常簡單的一句話,涵蓋了多少東西,你可能是要買機票、訂酒店、叫車、預定餐廳,可能要會見朋友……這個叫事務的認知,未來不久也會發生。
2、未來AI會全面上雲端
AI的全面雲端化也是包括幾個方面。首先,所有大家共享的知識都在雲端;第二,個性知識也會上雲端;第三是任務的狀態會上雲端。什麼叫任務的狀態?我這個機器做了一半的事,它會在雲端記住我做到哪了。舉個例子,我在我家的若琪月石上聽了一個故事,長篇故事,大概聽到二十分鐘,下次回來的時候仍然繼續聽。
3、單設備到多設備互動:多機協作——多維交互——多屏互動——任務遷移
未來家裡面肯定不會只有一個AI的設備,他會面臨第一個問題,多機協作。多機協作之後,任務狀態上雲端的需求就產生了。
第二個需求是多維互動,我們現在在用語音跟這個產品互動,未來不僅僅是語音,未來有攝像頭,可以用手勢,甚至未來有更多的傳感器加入到跟人的交互裡面去,產生多維的一個交互。有很多人會說,AI的產品發展未來會是什麼樣,要不要在Rokid上加一塊屏幕。我的想法是,我們不認為現在的家庭裡面還需要另外一塊屏幕,更多的作用是讓你家裡已有的這些屏互動起來。多屏互動將會是一個趨勢。
任務的遷移,舉個簡單的例子,兩臺Rokid之間協作,當我在家裡聽音樂聽到一半要去上班了,打開我的車門,關上車啟動車之後,我叫若琪繼續播放。不僅僅是多個設備之間需要做狀態的遷移跟互動,包括這輛車我進去的時候,它要知道我是誰。所以我們之前提到個性認知上雲端,狀態上雲端,就會有一個質的變化,最後直接導致的是場景的遷移,會導致「無處不在個性的AI」。
無處不在的AI,它不再被拘泥在某一個非常具體的形象裡面。在不久的將來,我們也已經準備好了,會發布一款新產品,可以讓家裡完成無處不在的若琪。有趣的就在於那個設備本身它也可以獨立工作。我們這個計劃就叫「若琪梵星計劃」。同樣我們計劃會把若琪梵星計劃開放給我們的合作者,包括汽車廠,包括電冰箱廠,包括電視廠,未來如果有越來越多的人採用這個方案以後,你真的就可以在任何地方喚醒你的若琪,然後跟她進行對話,完成你交給她的任務,這是我們未來的一個思考。
「有溫度」的機器
有很多技術的突破,一個技術的突破,只有當它融入到產品,融入到場景,並且把這些整個鏈條都連通以後,才有真正的價值。
我過去是不在家聽音樂的,中國人聽音樂,很少有家庭音樂的概念,基本都是耳機。即使我家裡有音箱,我也是在沒人的時候聽。如果要問我智能音箱這個市場有多大,國內的文化和美國是巨大的差別,真的不是那麼大的市場。但為什麼我們要做?我給大家講過了,它只是我們環節裡面的一部分,是不可缺席的一個環節,但我們要把它做到最好,讓一個這樣的產品慢慢被大家所接受。當我們的場景音樂出來的時候,真的有原來不聽音樂的人在聽音樂,因為太方便了。
我們對若琪這個產品的定義,我們最後希望它是伴侶、助手,我對它的定義是年輕的知性的女生,不是耍嗲的、讓人缺少信任感。我對我們技術團隊、研發團隊說,希望我們合成的效果是你聽到這種聲音之後,覺得這個女生很值得信任,是一個知性的年輕女生的聲音。我告訴團隊最重要的並不是一個產品長什麼樣,而是她內在的氣質和性格,我們在很多細節上都給產品注入她自己的性格。產品的具體功能定義完成後,我們團隊問的最多的就是,這個場景的體驗會給用戶帶來什麼樣的感受。月石產品設計一開始就希望用戶能感受到溫度和親切。
若琪跟其他產品,你要問我區別在哪裡?我認為就在這裡,Rokid是人文主義的,是要把冷冰冰的機器關起來的。
但我們怎麼去預測這個未來?就是我們自己去把它做出來。最好的預測未來的方式就是去創造未來。
[本文作者黑智,i黑馬原創。如需轉載請聯繫微信公眾號(ID:iheima)授權,未經授權,轉載必究。]