Rokid發布第二代智能語音機器人,這次它的遠景目標是「讓AI無處不...

2021-01-10 i黑馬

Rokid發布第二代智能語音機器人,這次它的遠景目標是「讓AI無處不在」

2017-06-13 10:11 rokid 智能音箱

智能語音設備終端已經成為科技巨頭競爭的新戰場。日前蘋果的HomePod刷遍了朋友圈,在此之前,微軟聯手哈曼卡頓推出了基於Cortana語音助理的音箱invoke,與亞馬遜Echo和Google Home,展開了同臺競爭。

國內的智能語音交互終端,也早已加入了這場角逐。

6月8日,Rokid在北京宣布,其第二代智能語音機器人「若琪•月石」全渠道上市。同時,Rokid推出了個性化聲紋識別。「若琪」能夠識別20個人以內的聲紋,它會知道當前在下達指令的是「誰」,從而保證使用的安全性和私密性。藉助遠場識音算法,它還能在嘈雜環境下準確分辨出聲音來源,識別距離最遠可達10米。在記住了每個人之後,「若琪」還會記住你的使用習慣進行個性化推薦。

「我們的目標是最終打造『無處不在的AI』。」Rokid創始人Misa說。對於媒體而言,Misa相對而言是個極其低調的創始人,這也是他少數出來面對媒體的活動之一。而這次,他除了談到若琪的技術亮點之外,更是公開了rokid在未來的研發計劃。

也許,一個智能音箱的風口,真的要來到了。

智能語音機器人「若琪•月石」

亞馬遜曾經表示,智能音箱,可以被看作是語音微交互界面的新型計算設備。Gartner也曾預測,到2018年,有30%的人機互動都將通過自然語言完成。智能語音交互的家用終端,以其下一代交互的技術入口,以及其覆蓋了硬體和內容等生態系統的廣度,成為各大巨頭的必爭之地。而對於創業公司而言,若想在其中立足,競爭難度也是巨大的。

相比Google Home和Amazon Echo以及市面上大部分採用第三方語音技術的同類產品,據Rokid北京A-Lab負責人高鵬介紹,Rokid的核心AI語音交互技術均為自主研發。對此,Misa說:「Rokid並不反對用別人的技術,我們也有一些跟其他人合作的東西,但前提是它必須滿足我們對產品的定義。」據Misa介紹,Rokid目前有兩個實驗室,北京的A-lab主要負責AI算法,在美國的R-lab主要負責計算機視覺以及機器人方面的研發。在Rokid團隊中有諸多來自中科院自動化所多年從事語音技術研究的博士,具備足夠的技術積累。

Rokid對自身產品的定位也在目前上市的「若琪•月石」中得到了體現。它的能力包括音樂播放、智能家電控制、講故事、播報新聞、日程提醒、天氣預報、實時翻譯、計算等。但和Echo以及Google Home相比,Rokid產品負責人向文杰表示,他們更希望,若琪是一款「帶有性格」的產品。同時,Misa也表示,若琪和用戶之間,正在建立起自己的「情感」。

「聲紋識別」是若琪本次產品最值得關注的亮點之一。在滑鼠、觸屏之後,語音交互被認為是下一代新的交互方式,而聲紋識別將會提供給機器「認識你」的功能。若琪可以記錄幾十個家庭成員的聲音並進行識別,只要和它說過話,下次打開「若琪」,它都能認出是誰,並且還能準確識別說話的人是在哪個方向。聲紋識別的功能,讓「若琪」可以在多人場景下選擇主人的指令進行完成。「若琪」會知道當前在下達指令的是你而不是別人,因此安全性和私密性要比同類產品高。

同時,該功能也可讓「若琪」完成對家庭各成員的精準服務。認識了你之後,作為具備學習功能的智慧機器人,「若琪」還會在日常接觸中逐步記住你的喜好習慣並形成後臺數據收集整理,在之後的使用中,它會針對性地向你推送內容以及個性化服務。Misa表示,聲紋識別成果近期也將升級給所有若琪用戶。

藉助遠場識音算法,「若琪」還能在嘈雜環境下準確分辨出聲音來源,識別距離最遠可達10米,常見的家庭住宅都在這個範圍之內。

對於智能音箱而言,之所以吸引了巨頭們的目光,主要還在於它開啟了更廣闊的智能家居生態市場的大門。智能語音助手可以控制家居設備,成為各種家用設備的控制中樞入口;以及獲取更多用戶數據,搭載不同的內容、電商、生活類應用,成為新的應用平臺。

Misa表示,若琪現在已聯通絕大部分國內主流廠商的上百種智能家電設備,而且針對目前IOT設備品牌眾多,接口不一的情況,Rokid可以用一套API接口直接打通,實現更多智能家居品牌的跨廠商兼容。據透露,Rokid目前已經跟LifeSmart、歐瑞博、broadlink、小米等達成了合作協議。

同時,除了家電外,Rokid正在打通與「餓了麼」、「滴滴出行」等服務平臺的連接,未來「若琪」將能提供多元化的服務,比如處理叫外賣、叫車等日常瑣事。

而另外值得一提的是,Rokid在音樂內容上下的功夫。據介紹,「若琪•月石」上擁有正版授權的320K品質、6百萬首音樂和其他音頻內容。「全部由我們付費,用戶收聽。」Misa說。

「若琪•月石」現在已經在天貓、京東等線上商城、全國重點省份城市的500多家門店以及國內潮品、機場高鐵等線下店面全渠道上線,定價為1399元人民幣。

但在Misa看來,消費級AI產品,在三年之內,還將有一個更大的升級:從感知到認知,從單設備到多設備互動,以及AI大腦的雲端化。屆時,一個「無處不在的AI」,將是Rokid要去打造的未來。

Rokid創始人Misa

以下為Misa的分享,經黑智編輯整理:

Rokid是一家AI公司,我們主要做兩件事情:AI的大腦,以及AI的交互。現在關於AI的話題已經非常多了,但實際上,AI能做的事情還沒那麼多。它現在主要能做的,第一是幫你做決策,第二則是提升你的各方面體驗。在今天,AI還是偏工具性的。

Rokid成立已經三年多了,差不多同時候,亞馬遜推出了Echo,讓市場開始對語音交互的信心增強了。剛才高鵬也講到了,我們對語音識別不陌生,但是在家庭場景裡面,遠場,有混響,我們能不能做到很好的體驗?很多人心裡沒底,包括我們也探索了很長時間。我們在第一代產品推出的時候,其實也是要給大家一個信心,我們自己也發現,用戶對這個產品接受度開始變得很高。那麼,三年後的今天,Rokid又會怎麼去思考它?

AI的全面升級

1、AI開始從感知到認知的全面升級:個體認知——環境認知——事務認知或意圖認知

我能聽得到你的聲音,同時知道你在講什麼,這屬於感知。認知是什麼概念呢?比如聲紋識別,用戶的體驗就是當你家裡不同的人跟若琪在講話的時候,她知道這個人是誰。我的結論是,語音技術裡面的個體認知就像智慧型手機裡的觸屏一樣,將會引發產業的大革命。

第二個是環境的認知,一個AI的硬體或者一個產品,它可以對自己的環境作出認知:我現在是在客廳還是廚房、車上或者在什麼地方。第三是對事務的認知,有的人把它叫意圖的認知,即當我和機器溝通或者交互的時候,機器或者智能大概能知道你要幹什麼,比如我們表達一個任務,說我要從杭州去北京,非常簡單的一句話,涵蓋了多少東西,你可能是要買機票、訂酒店、叫車、預定餐廳,可能要會見朋友……這個叫事務的認知,未來不久也會發生。

2、未來AI會全面上雲端

AI的全面雲端化也是包括幾個方面。首先,所有大家共享的知識都在雲端;第二,個性知識也會上雲端;第三是任務的狀態會上雲端。什麼叫任務的狀態?我這個機器做了一半的事,它會在雲端記住我做到哪了。舉個例子,我在我家的若琪月石上聽了一個故事,長篇故事,大概聽到二十分鐘,下次回來的時候仍然繼續聽。

3、單設備到多設備互動:多機協作——多維交互——多屏互動——任務遷移

未來家裡面肯定不會只有一個AI的設備,他會面臨第一個問題,多機協作。多機協作之後,任務狀態上雲端的需求就產生了。

第二個需求是多維互動,我們現在在用語音跟這個產品互動,未來不僅僅是語音,未來有攝像頭,可以用手勢,甚至未來有更多的傳感器加入到跟人的交互裡面去,產生多維的一個交互。有很多人會說,AI的產品發展未來會是什麼樣,要不要在Rokid上加一塊屏幕。我的想法是,我們不認為現在的家庭裡面還需要另外一塊屏幕,更多的作用是讓你家裡已有的這些屏互動起來。多屏互動將會是一個趨勢。

任務的遷移,舉個簡單的例子,兩臺Rokid之間協作,當我在家裡聽音樂聽到一半要去上班了,打開我的車門,關上車啟動車之後,我叫若琪繼續播放。不僅僅是多個設備之間需要做狀態的遷移跟互動,包括這輛車我進去的時候,它要知道我是誰。所以我們之前提到個性認知上雲端,狀態上雲端,就會有一個質的變化,最後直接導致的是場景的遷移,會導致「無處不在個性的AI」。

無處不在的AI,它不再被拘泥在某一個非常具體的形象裡面。在不久的將來,我們也已經準備好了,會發布一款新產品,可以讓家裡完成無處不在的若琪。有趣的就在於那個設備本身它也可以獨立工作。我們這個計劃就叫「若琪梵星計劃」。同樣我們計劃會把若琪梵星計劃開放給我們的合作者,包括汽車廠,包括電冰箱廠,包括電視廠,未來如果有越來越多的人採用這個方案以後,你真的就可以在任何地方喚醒你的若琪,然後跟她進行對話,完成你交給她的任務,這是我們未來的一個思考。

「有溫度」的機器

有很多技術的突破,一個技術的突破,只有當它融入到產品,融入到場景,並且把這些整個鏈條都連通以後,才有真正的價值。

我過去是不在家聽音樂的,中國人聽音樂,很少有家庭音樂的概念,基本都是耳機。即使我家裡有音箱,我也是在沒人的時候聽。如果要問我智能音箱這個市場有多大,國內的文化和美國是巨大的差別,真的不是那麼大的市場。但為什麼我們要做?我給大家講過了,它只是我們環節裡面的一部分,是不可缺席的一個環節,但我們要把它做到最好,讓一個這樣的產品慢慢被大家所接受。當我們的場景音樂出來的時候,真的有原來不聽音樂的人在聽音樂,因為太方便了。

我們對若琪這個產品的定義,我們最後希望它是伴侶、助手,我對它的定義是年輕的知性的女生,不是耍嗲的、讓人缺少信任感。我對我們技術團隊、研發團隊說,希望我們合成的效果是你聽到這種聲音之後,覺得這個女生很值得信任,是一個知性的年輕女生的聲音。我告訴團隊最重要的並不是一個產品長什麼樣,而是她內在的氣質和性格,我們在很多細節上都給產品注入她自己的性格。產品的具體功能定義完成後,我們團隊問的最多的就是,這個場景的體驗會給用戶帶來什麼樣的感受。月石產品設計一開始就希望用戶能感受到溫度和親切。

若琪跟其他產品,你要問我區別在哪裡?我認為就在這裡,Rokid是人文主義的,是要把冷冰冰的機器關起來的。

但我們怎麼去預測這個未來?就是我們自己去把它做出來。最好的預測未來的方式就是去創造未來。

 

[本文作者黑智,i黑馬原創。如需轉載請聯繫微信公眾號(ID:iheima)授權,未經授權,轉載必究。]

相關焦點

  • Rokid第二代智能語音機器人上市發售,你需要這樣一個女助理嗎?
    6月8日,國內智能家庭機器人公司Rokid(若琪)舉辦了一場新品上市溝通會,對外公布了旗下第二代智能語音機器人PEBBLE(月石)正式發售的消息以及該產品所具備的聲紋識別能力。相比較Rokid一代售價5280元的機器人產品ALIEN(外星人),若琪·月石沒有保留屏幕和投影的燈效設計,走的是象形、便攜的簡約風,供應鏈成本下降,這是一款外形有逼格酷似鵝卵石的智能語音機器人,售價1399元鎖定千元檔消費市場。
  • 得助智能:智能語音機器人從「傻瓜式強行輸出」到「互動性交流」
    到現在,由於深度學習算法快速的普及發展,出現了實時對話機器人。它能根據用戶的回答進行判斷,來繼續開展下一輪對話。語音機器人發展到今天,已經具備了良好的聽、說、理解能力,能模擬人工客服在一些業務上進行客戶溝通,以減輕人工壓力。今年初,智能語音機器人在進行社區疫情排查和防疫宣傳上就起到了很大作用。
  • 智能音箱、AR眼鏡,人工智慧公司Rokid的終極目標是什麼?
    最初以家庭機器人 Alien 產品示人的人工智慧公司 Rokid,在過去的一段時間裡動態很多。在 2016 年發布智能音箱 Pebble,入局火熱的智能音箱中國戰事後,在 2017 年,它公布過自己的全棧語音解決方案,2018 年初的 CES 會展上,Rokid 還發布了搭載語音識別和 Face ID 的 AR 眼鏡。
  • 語音AI革命十年,不忍看,不敢看!
    過去這10年始於iOS App Store推出的Siri應用,結束於全球逾30億語音助手的用戶。那麼語音AI第二個十年的第一年,其前景又如何?40多名語音行業專家,預測了2020年的發展趨勢。 語音AI革命性的10年:10大裡程碑事件見證了它的飛速發展
  • Ai智能時代丨兒童的好夥伴,朵唯小朵智能陪伴機器人體驗
    隨著網際網路科技的發展,智能兒童玩具類型的產品也是越來越多了,國內知名數碼品牌朵唯之前就發布了首款兒童智能陪伴機器人小朵,它不是一個普通的玩具機器人,而是一個具備AI語音人工智慧、大數據、雲計算等多功能於一身的家庭陪伴機器人,今天帶大家看看真機器人表現如何。
  • 小蟻發布智能攝像機3雲臺版:首款語音識別
    2018年4月20日,小蟻科技將正式發布第三代網際網路智能攝像機——小蟻智能攝像機3雲臺版。這是小蟻第一款採用AI(人工智慧)技術的產品,宣告小蟻邁入人工智慧安防領域!小蟻表示,如果說第一代智能攝像機滿足手機連接功能、第二代智能攝像機滿足用戶對解析度、雲臺轉向之類的性能需求。
  • 機器人也會說方言?度小滿語音機器人能說四川話、河南話
    在當前國際大形勢不明確的時候,這是得以驕傲和自豪的一個點。我們平時在生活中經常會接到銀行打來的各種各樣的電話,其實有很多是語音機器人撥出的,有的我們能聽出是機器人,但有的我們已經辨識不清......就拿金融科技公司度小滿金融的實踐來說,他們提供語音機器人服務,已經讓99%的用戶聽不出是機器人了。他們的機器人甚至還可以說四川普通話、河南話、山東話等中國各地方言。
  • 引領3代智能攝像機 小蟻發布智能攝像機3 雲臺版
    如果說第一代智能攝像機滿足手機連接功能、第二代智能攝像機滿足用戶對解析度、雲臺轉向之類的性能需求。那在IoT時代,第三代的攝像機應該完全承接AI人工智慧的技術優勢,將智能攝像機帶入「腦力」角逐勝負的時代!2018年4月20日,小蟻科技引領行業,正式發布第三代網際網路智能攝像機——小蟻智能攝像機3 雲臺版。
  • 獵豹移動發布2020年Q2財報,新零售AI機器人獲突破
    【天極網IT新聞頻道】8月18日,獵豹移動(代碼:CMCM)發布2020年Q2財報。   2020年第二季度,公司總收入為3.94億元,超過上季度指引。本季度,Non-GAAP歸屬獵豹移動股東淨利潤為2.44億元,公司現金儲備及長期投資52.66億元,保持強勁。
  • 獵豹移動|先聲智能 機器人AI英語陪練時代開啟
    12月5日,全球領先移動網際網路公司獵豹移動機器人家族的新成員——「豹豹龍家教機器人」正式亮相,並在天貓、京東正式開售。這款兒童家教機器人搭載了國內領先人工智慧服務商先聲智能的英語AI系統,支持跟讀、糾正、15大維度測評等,可充當兒童的英語陪練,相當於擁有了一個外教老師,真正做到解決家長無法教兒童英語痛點。
  • AI賦能,儒博正式發布全球首款英語機器人老師
    儒博全新品牌亮相,並正式發布全球首款布丁AI老師解決方案及英語教育機器人布丁豆芽。該解決方案及機器人產品的發布,旨在以AI賦能,為家長和孩子打造「量體裁衣」式的24小時英語教學環境,為教育機構打造個性化、智能化的AI教學解決方案,以智能技術加速推進教育平等並實現「因材施教」。
  • 快手的AI寵物:小快語音助手
    一個吸引人的橙色小精靈,全程活躍在直播頁面上,它就是快手直播間的智能寵物「小快」。直播過程中,柳巖和大鵬可以隨時和小快聊天,小快還能對兩位演員的新電影侃侃而談,獲得了二人的喜愛。在直播裡加花樣,早就不是什麼新鮮事了,各類基於計算機視覺技術的特效、AR效果,已經被直播公司們玩出了花。
  • 別三日刮目相看 布丁S智慧機器人評測
    時隔不到1年的時間,roobo(北京智能管家科技)發布了旗下第二代智慧機器人——布丁S,從外型上來看,兩代布丁機器人差別並不是很明顯,均以呆萌的代表示人,是專門針對兒童設計的集智能對話、習慣培養、教育百科、家長遠程陪伴等功能為一體的智慧機器人。
  • 儒博發布AI英語教育機器人布丁豆芽 售價3600元
    【TechWeb】8月27日,ROOBO品牌今日升級中文品牌「儒博」,並正式發布toB產品布丁AI老師解決方案及toC產品英語教育機器人布丁豆芽。布丁豆芽售價3600元,目前在天貓、京東等平臺已經上線銷售。
  • 衝刺科創板AI語音第一股,雲知聲的底氣何在
    2018 年,雲知聲就率先交付人工智慧語音晶片——「雨燕」。2019 年,推出了車規級晶片「雪豹」和面向家居領域的第二款升級版晶片「蜂鳥」系列,並啟動具備「圖像+語音」多模態交互功能的晶片「海豚」的研發。
  • AI「人工智慧」機器人熊娃娃
    兒童陪伴機器人行業先鋒品牌熊娃娃,最近推出了一款新款機器人--太空人小宇A 5機器人。這款主打陪伴、成長學習,語音人機互動的熊娃娃智慧機器人。熊娃娃太空人小宇智慧機器人不僅外觀形象,功能也毫不遜色。比如:小宇擁有強大的語音識別能力,能夠準確判斷出人的聲音和問題並作出回應,哪怕孩子一直提出同一個問題,小宇也能模仿人類大腦神經網絡,給出具有人性化不一樣的回答,陪著孩子一起成長。
  • 無智能,不營銷!芒果動力開啟AI智能營銷新時代
    在這場主題為「新媒體、新經濟、新未來」的盛會上,芒果團隊憑藉芒果動力電銷機器人在行業中的廣泛認可與讚譽,斬獲「2018世界新媒體大會優秀企業獎」。與此同時,在由中國僑聯和天津高新區聯合主辦的「創新力量」全國創新創業大賽中,芒果電銷機器人更是歷經重重選拔,正式殺入總決賽。世界變化不停,人潮川流不思。科技的迭代和大眾的需求無時無刻不在變化。
  • 聚焦AI+教育 儒博發布布丁AI老師及英語教育機器人
    布丁新品發布環節,儒博CTO雷宇正式對外發布布丁AI老師解決方案。布丁AI老師是儒博依託多年積累的兒童語音資料庫及各項AI技術,通過改造現有課程,打造的一套模擬老師授課系統。布丁AI老師將優質課程AI化、交互擬人化、施教個性化,提供「課堂學、家裡練「的整套方案。
  • 四川話河南話山東話說的溜,揭秘度小滿語音機器人的「真實身份」
    在當前國際大形勢不明確的時候,這是得以驕傲和自豪的一個點。我們平時在生活中經常會接到銀行打來的各種各樣的電話,其實有很多是語音機器人撥出的,有的我們能聽出是機器人,但有的我們已經辨識不清......就拿金融科技公司度小滿金融的實踐來說,他們提供語音機器人服務,已經讓99%的用戶聽不出是機器人了。他們的機器人甚至還可以說四川普通話、河南話、山東話等中國各地方言。
  • 芒果動力推AI防騷擾電話助手,AI語音代接電話是最大賣點
    據悉,「芒小蜜」能夠在用戶「不方便」或「不願意」接聽的情況下進行電話代接,通過多輪語音通話探明來電者意圖,與來電者進行AI溝通後,對來電進行標記整理,以便由用戶根據接聽記錄判斷來電價值,決定是否回撥,從而幫助用戶實現既不漏接電話,又能防騷擾的目的。目前,「芒小蜜」可以支持「急事」、「外賣」、「疑似傳銷」等十餘種標籤分類。