10月12日,闊別阿里三年之久的Rokid創始人兼CEO祝銘明(Misa)作為雲棲大會演講嘉賓再次現身,這個幾乎不參加公開場合的低調CEO在現場宣布了行業重磅消息:Rokid(若琪)將與阿里雲攜手合作,共同推出全棧語音開放平臺(turn key solution),為業界提供一站式語音解決方案。
全棧語音開放平臺(turn key solution)由Rokid提供端到端的全棧技術方案,由阿里雲提供雲端支持,現在正通過這種合作的方式向業內開放。也就是說,音箱提供商、甚至是個人開發者使用這個全棧開放平臺可以快速的複製Rokid智能音箱的全部語音能力。
Misa這個人很Geek,又特別容易打開話匣子,是很典型的加州人風格;多數人的眼中,他對產品細節考究,對團隊要求苛刻,但又在一些無關緊要的小事兒上,他不拘小節,保持了一種獨立個性的風格。多數見過他本人的人,都或多或少會被他的這種個人魅力吸引。
多數有理想的創業公司的目標都是打造一臺「iPhone」,意思是說在產品設計、研究、製作方向上保持極其前沿先進的思維,甚至執拗。在Misa眼中,Rokid Alien、Pebble都是這樣的產品。然而,正式在研發三年、推出兩代「iPhone」產品後,今天它又把Rokid的技術開放的像一個Google Android的一樣。
很多疑問。在這個時間點,為什麼一家創業公司也選擇做開放和平臺?這個全棧語音技術平臺的開放和阿里巴巴本身天貓精靈之間有什麼樣的關係?這種模式和百度DuerOS開放的模式又有怎樣的區別?
開源開放,是投下一個炸彈,也是新興領域的第一時期
不過,先說道開源開放,扔炸彈真是聽了太多次了。
當年我們還玩不起智慧型手機的時候,MTK的開放造就了時下最火熱的山寨機概念,也是通過這樣的方式,MTK幾乎在雜亂無序的手機時代里舖滿了市場;後來來到了Android時代,它也因為開放成了如今唯一可以和iOS較量的手機平臺,現在是我們談論任何新興市場的標杆性生態。
去年我們講VR的時候,我也看到了不少公司再講開源開放,比如HTC Vive和Vavle共同開放Lighthouse的定位技術,來助推6DOF VR頭盔的發展,當時也有不少媒體就說Vavle扔出了重磅炸彈;今年年初,百度陸奇也開放了阿波羅自動駕駛計劃,一些媒體也說陸奇扔下了自動駕駛領域的一顆炸彈。
先把炸彈放一邊,開源開放其實從來就是一件大好事。但側面的理解,開源和開放,其實都只能算是一個領域的不成熟期。
這個時期大家摸著石頭過河,有人喜歡做封閉,有人喜歡做開放,因此這個時期會產生無數的標準和協議制定者;不過,正是在接下來的這場戰爭中,會留下最後幾個標準開放者。而後,才會產生iOS這種封閉標準定義者以及生態內的跟隨者。
對於智能音箱,我一直認為——何時出現封閉標準定義者和跟隨者,這個時間點非常重要。
所以在不成熟期,開源幾乎是培養這個市場持續下去的唯一條件。
我或多或少的在Misa的談話裡也提煉出了類似的觀點。他認為一個新形態的產品,第一時期只能在自己的產品上做功夫,持續打磨體驗,小切口切入;然後第二時期,有可能進一步的形成平臺和入口通路;至於,大家特別愛談論的和其他產品進行交互,產生生態,如何炫酷地和生態交互起來,其實是最後產業成熟期的事兒了。對於智能音箱來說,確實還有一段時日。
而在這個不成熟期,Rokid選擇用已經被打磨好、成熟的技術推動市場前進。Rokid和阿里雲的開放戰略是——提供了一個完整直接可用的硬體開發板,開源了他們全部的語音技術,部分已經寫好的系統代碼。
先來看看這個開發板。在這個黑色的圓形開發板上,集成了CPU、GPU、藍牙、麥克風陣列等所有涉及到語音開發的需求,甚至還設置好了音頻、電源、HDMI視頻接口,它其實就可以理解為Amazon Alexa的Echo Dot,到手插上即用。
而使用這個開發板,就可以結合已有的兩套分別搭載Linux和Android作業系統的開發套件,根據需要選擇阿里雲或Rokid的語音服務,雙方共享海量語音技能,完全開放給開發者及合作夥伴使用。
在Misa這裡,他願意給這些事兒加一個前提或者劃個重點——「全棧真開源、真開放。」
真開源是優勢,其實就是你到底要共享多少的態度問題。在Rokid這裡,除了共享了70%的系統框架代碼,連這個小小開發板的設計圖紙甚至也已經給開發者準備好,另外——
Rokid開放的語音技術包括語音識別、信號分析處理、語音合成、語義理解、自定義喚醒詞、聲紋識別、個性化語音合成、語種識別、自定義對話引擎等等。總之,在整個鏈條上的語音技術會全部開放。
在Rokid自家產品上開發的無版權服務也都將直接免費開放給合作夥伴,而一些需要授權的合作商內容也可以通過Rokid享受合作價格。在生態連接上,開發套件也會與阿里小智、小米、Lifesmart、Broadlink等多家公司的智能家居產品直接連通。
有了這樣一個漂亮的開發板,它完整到甚至直接接上電腦插上耳機,就完成了給你的耳機添加上「語音交互」的動作。
所以,一它是可以連接任何已有的傳統音箱升級為智能對話音箱,享受完整的Rokid產品的技術能力;二它可以作為開發者的開發套件,在Rokid原有生態之上,為它添加更多的技能。
在新聞稿中提到——從此以後,不管是是個人還是公司,都能夠輕鬆打造像若琪一樣優質語音體驗的交互設備,讓身邊電視,冰箱甚至機頂盒,開口說話,為你提供服務。
好了,現在炸彈扔出去了,這個階段到底把誰炸飛了?
首先它絕對不會對一些C端的用戶產生直接影響,對於一個B端開放方案、作為一個全鏈條、端對端的AI公司,被波及的也將會是處於這條鏈路上某個單一環節的公司。
比如說有些公司光訓練和定義一個個性的喚醒詞就收取幾十萬的公司,有些公司會提供一個收費的語音方案,Misa認為這樣的商業模式將會直接被摧毀。畢竟人家也可以自定義喚醒詞了,還開放了語音技術,還不收費…..
不過,那麼多大公司如百度騰訊,都推出了雲業務下的開放平臺,三家公司三種開放,Rokid和阿里雲的優勢在哪?
對比來看,百度騰訊目前都屬於沒有尖刀型產品的公司——對於自己打磨產品,目前還沒有看到他們走完一個完整的鏈條。
對於阿里巴巴本身來說,天貓精靈和Rokid也並沒有形成左右互搏的局面——Rokid更像是一個典型的技術產品特種部隊,優秀的產品提供更好的開源技術;而天貓精靈產品更像是天貓購物的一個補充,兩者的「人設」不同。
對於Misa來說,衡量一個語音產品的唯一標準就是用戶體驗。他認為,這隻有實際打磨硬體產品的過程中,才會懂用戶究竟需要什麼樣的智能語音產品,雖然國內已經存在多家語音開放平臺,但Rokid是國內唯一一家兼具一流產品與平臺實力的人工智慧公司。
正因為如此,Misa堅定認為Rokid也是唯一能夠提供真正全棧方案,並實現真開放的AI公司。
在雲棲大會的現場,Misa談到——AI時代的產品,無法像移動網際網路一樣通過手機這樣的單一產品形態去贏得整個戰場,所以既要專注,把產品軟硬體、端對端的用戶體驗打磨到最好;又要開放,讓有想法的開發者,可以用過你打磨好的技術,去創造出更多品類的智能產品。
本質上,AI時代的產品和手機時代的產品還是有些不同的,他們的發展軌跡可能也不盡相同。
一個Google加Apple的故事
在常人眼中,Rokid像是一家智能音箱公司。但其實在業內,Rokid一直是一家打造全鏈條AI技術的公司,不只是一家智能音箱公司……
Rokid將會繼續推出的新的AI產品,聽說Rokid Pebble系列的新品會更小,在明年CES的時候,還會登陸一個採用先進視覺的AI產品,視覺技術由Rokid美國R-Lab提供。並且,Misa本人還在琢磨造機器人的事兒。
Rokid如今的商業模式可以這樣理解——從前都是按照iPhone的標準造親兒子,賣產品;而現在是尖刀產品和技術開放雙線走,其實成了另外一個Pixel和Google Android的故事。
在這個模式的背後其實是兩個機動部隊,技術開放部門和產品部門。在創立之初,Misa就已經規劃好了這樣的路徑。
Rokid仍然不會出低價產品,自家尖刀型產品的價格會繼續往高端走,他們會通過B端開放戰略覆蓋更低的價位段,讓有一些妥協的公司拿著自己成熟的技術方案去499、599那些區間裡廝殺——從一家用槍打仗的公司,轉變為給行業賣槍的公司,並且自己研究更好的炮。
Misa不滿足Rokid被稱作中國版Echo——「不客氣地說,我們現在更像是Google加Apple。」