Mosaic 劉宿莽:從 Alexa 平臺上的 Skill 到車載語音助手

2020-12-22 雷鋒網


「語音一定是未來,我非常確認。」 Mosaic 聯合創始人劉宿莽說這話時沒有半點猶豫。當時,他正在矽谷辦公室中與雷鋒網新智駕暢聊他的創業故事。

Mosaic 是一家語音助手創業公司。如果一定要類比,這家公司與國內已經上市的科大訊飛,同為創業公司的出門問問、思必馳、雲知聲和驀然認知等從事著非常相似的業務。

劉宿莽並不否認這些競爭對手存在的事實,不過他也表示,「我們真正關注人們在出行過程中所需要的語音交互。」所以更為精準的描述是,Mosaic 做的是「基於地理位置(Location Based)的語音助手」,這也是他所認為的 Mosaic 的最大特色所在。

具體而言,Mosaic 將人們出行過程中的位置信息作為一種語境(Contextual),而語境則是自然語言理解(NLU)中很重要的一部分。語音助手需要明白在什麼樣的狀況下該說什麼樣的話,在什麼樣的場域(Domain)裡該執行什麼樣的操作。

既然是面向出行領域,那麼汽車行業便順勢成為了 Mosaic 最重要的一塊市場。今年上半年,劉宿莽拿到了國內某著名車企在矽谷的風投機構的投資,同時也開始了與一些國內外車企展開接觸與合作,準備將其語音交互技術落地到他們的下一代車型中去。劉宿莽透露,Mosaic 目前對電動車型非常感興趣,已經有兩家電動汽車領軍企業與其成為深度合作夥伴。

實際上,Mosaic 走上開發車載語音助手的道路,並非一蹴而就的。

始於 Alexa 上的一個 Skill

劉宿莽本身是做地圖出身,本科在武漢大學,學的是地理信息科學,畢業時還拿到了地理信息界的著名獎項「王之卓獎」。2010 年赴美進入田納西大學讀碩士,學的依然是地理信息科學,兩年後正式畢業。2012 年 12 月,他加入蘋果公司,在蘋果的 Geo Team 擔任數據科學家,幫助建立了蘋果地圖的後端數據處理流程以及數據質量標準體系。

從這一系列的經歷來看,也難怪他在描述 Mosaic 的最大特色時,特別強調的是「Location Based」。

時間來到 2015 年,劉宿莽當時還在蘋果地圖工作,一次偶然的機會,他在矽谷參加了朋友組織的有真格基金創始人徐小平出席的交流活動。活動結束之後,很多想創業的年輕人團團圍住徐小平,表達自己的訴求,當時劉宿莽就站在邊上看。那晚,等人都走得差不多了,徐小平開始逐個詢問留下來的為數不多的幾個年輕人,了解他們是做什麼的以及想做什麼。問到劉宿莽時,因為他原本就沒什麼訴求,便回答徐小平:「我還沒想好,就不跟你說了。」這勾起了徐小平的好奇,也讓他記住了劉宿莽這個年輕人。 

後來,在另一個酒會,劉宿莽又見到了徐小平,徐小平當時主動向劉宿莽問起,「現在想好(要做什麼)了嗎?」劉宿莽答,「我想了一些東西,我們聊聊吧。」

具體聊了些什麼,劉宿莽並未向雷鋒網新智駕透露太多,但聊完之後的結果是,徐小平決定投錢給他。劉宿莽坦承,那個時候他自己的想法也不完全明確,更沒有想到要聚焦到語音助手這個領域中。「他只是覺得我們比較有意思,而且背景還不錯,就投了我們錢。」

拿著徐小平幾十萬美元的天使投資,劉宿莽與他的合伙人開始摸索創業方向。

那之前的 2014 年,亞馬遜 Echo 智能音箱橫空出世,智能語音助手開始成規模地走向普通家庭。整個 2015 年,Echo 的出貨量達到 250 萬臺,成為現象級的智能硬體,也正是在這一年,在合伙人的強烈推薦下,劉宿莽開始深入體驗 Echo 智能音箱,並且廣泛收集和分析網絡上針對 Echo 的評論。經過長時間的體驗和調研後,那一年的 7、8 月份,他們終於得出結論,認為 Echo 雖然沒有 iPhone 那樣驚豔,但具備 iPad 誕生時那樣的影響力。Echo 從真正的需求層面解決了一些問題,「我自己也感受到了(它的)好處。」劉宿莽說。

這樣的認知給了他和他的合伙人初步的創業方向。

那以後,他們開始在 Echo 音箱的語音服務平臺 Alexa 上開發應用技能(Skills)。Mosaic 作為他們的第一個 Skill 作品,迅速在 Alexa 平臺上俘獲諸多用戶的心,這個 Skill 的精髓在於,允許用戶使用一個語音指令控制多個動作,形成某種連串反應。

Mosaic 作為 Alexa 平臺上的一個 Skill 大獲成功之後,2016 年,作為一個創業團隊和一家創業公司的 Mosaic 也接到了全球知名孵化器 Y Combinator 伸出的橄欖枝。進入 YC 之後,Mosaic 面對的現實環境是,Alexa 平臺上的開發者越來越多,各種各樣的 Skill 也都蜂擁而上,這就導致開發者本身的價值大打折扣,同時金錢的回報方面也得不到任何保障,因為「任何好的東西可能最終都會被變成 Alexa 的一部分」,而這並不是長久之計。

劉宿莽和團隊在 YC 給出的建議的基礎上,開始進行各種各樣的嘗試,最終,他們選擇了語音助手這條道路,因為那時候 Mosaic 團隊已經擁有了一套在自然語言理解(NLU)方面較為成熟的技術。

當然,如果只是做語音助手,很難將其做成大生意,還需要行業的助力。正在發生巨變的汽車行業成為他們看到的大機會,新的語音技術,加上足夠大的汽車行業平臺,劉宿莽期待的獨角獸最有可能誕生。

車載語音助手:從矽谷到中國

從確定做車載語音助手,到拿下國內車企方面的投資,Mosaic 與車企的結合速度,正在不斷加快。劉宿莽表示,他們與車企的合作,車機將是非常重要的合作形態。想得更遠一些,汽車一級供應商也是他們非常好的合作對象,而這要等到與車廠的合作慢慢成熟之後。

遺憾的是,雷鋒網新智駕目前還沒有看到任何 Mosaic 的實車測試 Demo。劉宿莽解釋稱,保持低調的風格是因為他們希望對外保留自己的技術實力,之後針對具體的信息會作統一的發布。

雖然 Mosaic 起源於矽谷,但是其視野絕對不限於矽谷。面對中國這一全球第一大汽車市場,Mosaic 的進入在劉宿莽看來是「必然選擇」。從情懷層面,他是中國人,將企業帶向中國市場無可厚非;而且,Mosaic 還和很多國內車企建立了合作關係。

(預告一下:2018 年 1 月 16 日,雷鋒網(公眾號:雷鋒網)將在美國科技大本營矽谷舉辦 GAIR 矽谷智能駕駛峰會,將有近百家自動駕駛產業鏈公司在現場交流。詳情請訪問 https://gair.leiphone.com/gair/gairsv2018。)

那麼,這也意味著 Mosaic 將面對的是如林般的競爭對手。

不過,在劉宿莽看來,「(國內的競爭對手們)都處於一個狀況,就是在技術層面進行 PK,這不是我們最關注的點,我們關注的是用戶想用(語音助手)幹什麼。」這個問題當然很難,還沒有企業能解決得很好,劉宿莽目前也沒法透露 Mosaic 是如何去做的,但他強調,「並不是說技術不重要,而是某一些技術,其實在某一個時間點上是更重要的,我們比較關注這類技術。」

如前文所述,Location Based 是 Mosaic 語音助手最大的特色,那麼與位置信息有關的技術將會成為其核心能力。而在這一能力的實現上,目前,Mosaic 與很多地圖廠商展開了合作。

當然,要談更遠的未來,現在還不是最好的時機。

現階段,Mosaic 擁有 10 多人的團隊,多數具備蘋果、谷歌、Facebook 的大公司背景,內部實行「一帶一」的人才發展模式,有多年工作經驗的員工帶經驗欠缺的 PhD,團隊還在擴張。而在資金方面,劉宿莽透露,整個天使輪,Mosaic 總共拿到了數百萬美金的投資,而這些資金目前足夠支撐公司的運作。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 從skill到技能,VUI時代已經到來
    目前,在亞馬遜alexa上,語音交互技能的數量已經超過5w,雖然這個數量和質量還沒法和GooglePlay和AppStore提供的620萬款應用媲美,但仍然是一件令語音AI從業者歡欣鼓舞的事,隨著AI平臺的規範化、標準化,
  • 亞馬遜Alexa語音助手是什麼?
    打開APP 亞馬遜Alexa語音助手是什麼?Alexa是預裝在亞馬遜Echo內的個人虛擬助手,可以接收及相應語音命令,Alexa可以被看成是亞馬遜版的Siri語音助手。 Alexa API的分類 亞馬遜在2015年6月開放了Alexa的語音技術,供第三方開發者免費使用,實現了Alexa與開發者的對接。 Alexa Voice Service(AVS) AVS是指可集成Alexa的API到其他嵌入式設備中。
  • Briefly: 一款通過amazon alexa提升轉化率的shopify插件
    上的skill,通過它,你能給你的用戶帶來新奇獨特的體驗,從而提高轉化~ 我們都知道,shopify除了在線商店之後,它還集成了一些三方平臺比如亞馬遜,ebay等,允許賣家把商品同步到自己的平臺店鋪,也集成了一些推廣渠道,比如google,facebook,tiktok等。
  • 鎂佳科技CEO莊莉:從語音助手到全場景語音引擎
    有用的意思是當我們在開車的時候,手和眼睛都非常忙,因此需要能夠通過簡單的語音指令來完成其他的車內功能的使用。我們希望這個功能是非常全面的,只要是車內的功能,都希望能夠通過語音來控制。用戶不希望用很精細的方式跟語音對話,更希望車載語音能夠像一個助手一樣,能夠用平時的交流語言進行交互。
  • Spotify 正在開發語音助手,語音交互在音頻內容平臺上可以大有所為
    去年還在為首款智能硬體 Car Thing 而興奮的流媒體音樂平臺 Spotify近日有了新消息。外媒爆料稱,Spotify 正在開發語音助手,並以「Hey Spotify」作為喚醒詞。考慮到 Spotify 的音樂點播功能,其語音搜索可能會在點播相關的意圖理解上進行優化。是否會增加離線的語音控制指令,以便更快的實現點播,目前還不得而知。Spotify 官方尚未公開有關語音助手計劃的任何信息,也沒有時間表。
  • Yandex推出支持俄語的Alice:類似Alexa的語音助手
    目前Yandex在俄羅斯的市場份額大約為65%,並擴展到幾乎所有其他可以想像的軟體類別。該公司一直在使用某種形式的人工智慧來執行許多不同的任務。而Alice語音助手是其全新的產品。Alice語音助手是類似於俄語版Alexa或Siri,可以執行天氣,新聞,地圖等語音指令。
  • Alexa語音助手Get 一項新技能:不懂就問
    #語音助手#亞馬遜公司(Amazon.com Inc.)本周表示,經過多年的研究,其Alexa語音助手現在可以理解以前從未聽過的請求的含義。專家表示,該公司稱之為交互式教學的升級,可能代表著人工智慧語音助手在解讀和學習日常對話的方式上取得了重大進步。交互式教學由深度學習模型提供動力,它的工作方式是讓Alexa在第一次遇到某個任務相關的短語時進行提問。例如,如果用戶要求Alexa將燈設置為「閱讀模式」,而設備之前沒有聽過這個短語,它會詢問這是什麼意思。
  • 一文看懂 Echo 和 Alexa,亞馬遜如何用蘋果的玩法在玩語音?
    Alexa APP 並未上架到蘋果 Appstore 的中國市場, 如果要體驗,可以瀏覽 Alexa 的 Web APP :http://alexa.amazon.com。    而國內一些語音語義平臺,能讓開發者在平臺上面就看見用戶的聊天記錄,相信很多普通用戶知道了這點,就都不敢再跟智能產品當那種「無話不談」的朋友了。 如果你希望 Alexa 智能設備能控制家裡的電器,也要開啟相應的技能插件才行。
  • 支持全球主流中英文語音平臺 瑞芯微發布AI語音助手方案
    在語音算法上,支持聲源定位、聲源增強、回聲消除、噪音抑制技術。RK3229還是率先支持8路數字I2S數字矽麥直連的晶片方案,不僅大大節約成本,而且兼容不同麥克風陣列算法及平臺。作為語音交互關鍵技術,在麥克風陣列算法上,RK3229可支持科大訊飛、獵豹、思必馳、聲智、捷通華聲麥克陣列算法;RK3036已支持Conexant兩/四麥DSP方案。
  • 賦能全新車載生態,百度Apollo生態大會發布小度助手
    在Apollo智能汽車分論壇上,小度助手重磅發布,通過領先的AI能力及完善的生態體系,再度刷新人機共駕時代的駕乘體驗。作為專為汽車而生的虛擬智能助手,小度助手在使用體驗、商業模式和共贏生態上都呈現出了「領先一代」的全新面貌。基於AI 技術和產品體驗設計方面的強大實力,不僅進一步解鎖全新智駕的廣闊可能,也實現了用戶、車企和開發者等行業各參與角色的共贏。
  • 賦能全新車載生態百度Apollo生態大會發布小度助手
    在Apollo智能汽車分論壇上,小度助手重磅發布,通過領先的AI能力及完善的生態體系,再度刷新人機共駕時代的駕乘體驗。作為專為汽車而生的虛擬智能助手,小度助手在使用體驗、商業模式和共贏生態上都呈現出了「領先一代」的全新面貌。基於AI 技術和產品體驗設計方面的強大實力,不僅進一步解鎖全新智駕的廣闊可能,也實現了用戶、車企和開發者等行業各參與角色的共贏。
  • 華為車載智慧屏的「前身」,70邁行車助手遲到的體驗!
    作為一名5年駕齡的車主,車裡裝過不少車載智能設備,最近華為的車載智慧屏莫名火起來了,看起來既是一個行車記錄儀又像個車機!其實這種產品,70邁早就做過類似的產品了,就是70邁車載行車助手。剛出來那會,也不少人對這個產品吐槽究竟有啥用,不如買個行車記錄儀啥的,我剛開始也是這麼認為的,不過,這幾天剛好看做活動,就入手了一臺,發現70邁的腦洞真是挺大的,其實這個行車助手就是個車機+行車記錄儀,功能其實和70邁的智能後視鏡一樣,但是,有些車子,尤其是上了20萬的車子,原裝後視鏡真的不太方便改裝,原裝後視鏡的功能蠻多的,拆掉了可惜,但是70邁的智能後視鏡是公認的車載設備裡做的非常好用的一款
  • 車機語音助手現身微信表情包 天際汽車「小天」有多智能?
    日前,買車網(Buycar.cn)獲悉,天際汽車車載語音助手「小天」現身現身微信表情包,並通過激萌的形象融入用戶日常社交場景,開啟跨界內容營銷新舉措。作為車載語音助手,本次表情包上線僅僅是副業,事實上小天在車機中不僅可以聽指令實現「控車」、導航、打開本地應用等豐富功能,甚至還可以做一個陪聊者。無論您和家人處在前排還是後排,都可時刻將它呼喚出來,並提供相應服務。
  • 車載語音越來越好用了,原來背後有這些原因
    不把語音當產品,而把語音當平臺。 我們在《奇妙車機情報局》還測過一個產品,是博泰開發的擎 Mobile。當時確實給到我比較舒適的體驗。(這裡不談論它的產品路徑,只談語音功能的實現。) 它的識別速度很快,糾錯能力較好。可以一邊聽,一邊說,一邊執行命令,還可以隨時打斷。我可以說話聲音很小,也可以說很長一段話。
  • 搭載小度語音助手的機皇 OPPO Find X已經把用戶帶到了未來
    OPPO斥巨資請來巴西球星內馬爾代言,並在法國羅浮宮為其舉辦全球新品發布會,而其打破常規的工業設計、強大到爆表的逆天性能,更是讓不少數碼圈內大咖驚呼「等了四年,終於等到你」、「這就是一款來自未來的手機!」6月29日,OPPO Find X正式在國內亮相。
  • 語音助手Siri、Alexa、Google Home遭方言調戲,英語聽力哪家強?
    近年來,智能語音助手的迅速發展給人們的生活帶了諸多便利。隨著蘋果、谷歌、亞馬遜等網際網路巨頭相繼推出自己的語音識別助手,一場智能語音助手大戰拉開了帷幕。為了搶佔中國的語音助手市場,不久前蘋果語音團隊負責人Alex Acero表示:在iOS 10.3版本中,語音助手Siri將支持上海話。網友不禁調侃,Siri真是越來越「機智」了。
  • 能寫詩,會猜拳,還可定製服務:騰訊系語音助手小微來晚了嗎
    在周杰的構想中,一方面,C端用戶可以通過搭載了「小微」的硬體設備,用智能語音對話的方式獲得音樂、新聞、FM和天氣查詢等功能,調取更多騰訊生態下的服務。另一方面,「微信對話開放平臺」的能力,還將開放給更多第三方企業、機構用戶,幫助其打造個性化、定製化的AI對話服務助手。
  • 小米、錘子們都在談手機語音助手,它的春天來了?-虎嗅網
    比如在國外亞馬遜和谷歌圍繞語音入口的爭奪異常激烈,其中手機入口也是一個重要的爭奪之地,目前亞馬遜的Fire Phone 、MOTO、酷派、華為等都有接入Alexa,而谷歌也毫不示弱,如自家的Pixel、LG等手機有有接入Google Assistant。而在國內手機語音入口的布局上,百度的DuerOS可謂布局最快。
  • HYCAN合創推出了語音助手小CAN,太可愛了好想要一個!
    自從2011年Siri語音助手首次出現在蘋果iPhone 4s上以來,這種技術已經從一種噱頭大於實用的創新,變成了智能音箱的基礎技術。2014年,全球的智能語音市場規模為47.9億美元,4年後的2018年,智能語音的市場規模就已經達到了141.1億美元,實現了近3倍的增長。
  • 亞馬遜智能語音助手Alexa偷取隱私:1分鐘鎖定用戶住址
    從2014年Echo推出至今,亞馬遜的Alexa在智能語音助手領域遙遙領先其他企業的相關產品。在很大程度上,這取決於它所擁有的數萬項技能,而且,它的技能還在不斷更新拓展。僅在本月中旬,Alexa的技能庫裡就新增了「測血壓」、「解答護照和銀行假期相關問題」的技能。