出門問問業界首推離線版端到端MeetVoice 持續發力語音合成

2021-01-10 快科技

驅車穿行隧道時,車載導航突然從「志玲姐姐」變成生澀機器人?早高峰的地鐵上,新聞App「播報」著全球新聞資訊,卻因信號中斷突然消音?人人都是自媒體的時代,一部滿載創作欲的優秀作品,卻止步於沒有網絡進行語音合成?

追求卓越的出門問問技術團隊,絕不允許這種情況發生。

360天高效升級 離線版端到端MeetVoice問世

早在2019年8月,出門問問在業界率先推出CPU版本的端到端語音合成系統MeetVoice( (Mobvoi End-to-End TTS Voice)。

端到端語音合成系統MeetVoice

全 CPU 低時延端到端語音合成系統 MeetVoice ,實現了兩方面的新進展:一是上線了基於神經網絡的聲碼器;二是將Meet-Parameter以及Meet-Vocoder全部優化至可以在 CPU 上實時運行,並且達到和 GPU 一樣的性能和效果。

讓合成聲音以假亂真的MeetVoice,兼具「好聲音」、「快感知」、「低成本」的優勢。在正式推向市場後,出門問問將MeetVoice迅速落地應用到新浪新聞語音播報、大眾前裝車載語音助手等產品場景中,收到了眾多客戶及用戶的一致好評。

與此同時,在一年多的探索與實踐中,出門問問也深刻體會到在線語音合成方案的局限性,比如:

部分車型沒有聯網能力,需要提高離線語音合成的效果;

部分產品採用離在線語音合成混合的策略,兼採離線和在線合成的優勢,當網絡不好時,用戶易感知到離線和在線合成的效果差異較大;

在線合成時,偶爾網絡較差,從而播報的時延較大,用戶等待時間長。

部分B端客戶反饋認為,私有化部署比較麻煩,且對成本敏感;

要想儘可能解決這一系列的問題,除了將離線語音合成做到在線合成的效果外,似乎別無他法。但是,相比在線狀態,離線方案能夠提供的計算能力有著量級上的差別。

MeetVoice離線版真的有可能誕生嗎?

出門問問始技術團隊不斷攻堅克難,對神經網絡聲學模型和聲碼器進行了深度優化與迭代,於近期正式推出離線版本的MeetVoice,讓離線合成也能實現端到端引擎帶來的高質量合成效果。

從用戶需求出發 離線版端到端MeetVoice優勢顯著

在線版MeetVoice早已憑藉以下幾大優勢領跑行業:

好聲音

MeetVoice 實現了聲音還原度高,機械感小的語音合成,聲音質感得到顯著提升。簡單的來說,就是聲音聽起來更清脆、更像真人。MOS值達到4.4左右。

快感知

MeetVoice雖然在 CPU 上運行,但是做到了高並發低時延。系統實時率達到 10 倍以上(即 1 秒鐘就可以合成 10 秒以上的語音,在正常的語速下,1 秒可以合成接近 50 個字);端到端合成時延低於 200ms。

低成本

MeetVoice全部跑在 CPU 上,客戶不需要額外配置支持 GPU 的伺服器便可以部署該套系統,大大降低了使用成本。

而離線版的MeetVoice針對用戶需求,更具備顯著優勢:

持續發力語音合成 強勢賦能各行業

相比硬核提升技術實力之外,出門問問也通過一系列實際落地的語音產品,強勢賦能各行各業。

面對一些不具備聯網功能的車輛,離線版MeetVoice可以提供與在線版效果一致的車載導航功能,駕駛者在穿梭隧道等網絡環境不佳的情況下也不會受到導航音質的困擾。對於內容要求更加嚴格的媒體行業,得益於離線版MeetVoice,用戶在沒有網絡的情況下仍舊可以享受AI語音播報功能,第一時間「收聽」全球新聞資訊的煥新體驗。

不僅如此,在離線版MeetVoice的加持下,沒有網絡連接的機器人也能發出優質鮮活的聲音。除了車載導航、新聞播報、高端智能硬體領域之外,出門問問同樣能夠應用全新技術為圖書館、微信讀書等場景增加想像空間。

在過去的一年時間裡,出門問問基於領先的MeetVoice,在語音合成方面持續發力,陸續推出多個熱門產品:

魔音工坊

魔音工坊是AI音頻內容生成的一站式解決方案,獨創性設計多項產品交互,用於解決AI配音中遇到的各種瑕疵問題,比如發音預測不對、斷句不正常等。目前為止,已經有眾多新聞媒體、短視頻創作者、喜馬拉雅平臺主播等使用魔音工坊進行配音。

虛擬主播

以上產品或許僅僅是「聲音的遊戲」,缺少一個看得到摸得著的人物形象。

為此,出門問問近期推出「魔影主播」產品,並聯合中央級黨政媒體光明日報全新定製虛擬主播「小明」。以真人形象風格,通過魔影主播方案,媒體僅需少量數據,就能做到真實生動的效果。

在2020年服貿會期間,主播小明首次登臺亮相,受到了參會觀眾及媒體用戶的高度認可,未來也將在光明日報的欄目中全面落地。

魔音號小程序

為給公眾號進行聲音賦能,出門問問開發了一套小程序。公眾號作者通過註冊小程序,即可結合魔音工坊,將所有的公眾號文章都轉換成音頻形式。魔音工坊製作完音頻後,更支持一鍵發布到小程序上。小程序不僅可以單獨分發,還可以將小程序卡片插入到公眾號中,讓訂閱號讀者多了一種「收聽」文章的閱讀方式,從而讓閱讀場景擴展到廚房做飯、看小孩、開車等適合聽讀的場景中。

聲音復刻

大量用戶通過使用小問秘書(出門問問推出的一款智能代接電話的AI助手),用自己的聲音幫自己處理各種來電。

用戶在手機等常用設備上,通過錄製20句話,等待大概20分鐘,即可克隆完成自己聲音。

此外,出門問問還推出了300-500句話的TTS定製方案。只要用半天時間在專業錄音棚錄製幾百句話,即可完成效果匹敵精品發音人的聲音模型定製。

目前出門問問已經為光明日報主播、甲子光年張一甲、艾問人物艾誠、深圳灣炫姐姐等知名KOL完成聲音定製。

歌唱合成

為了讓更多用戶享受到「玩音樂」的樂趣,出門問問語音團隊開發了一套全新的歌唱合成方案,並上線到「AI魔音」小程序中。

用戶動動嘴,念念歌詞,AI就可以自動幫你合成音樂。除了給五音不全者帶來福音外,擅長唱歌的用戶,也可以藉助「AI魔音」,對歌曲進行歌詞改編,盡享音樂樂趣。

音樂魔力,AI助力,有了「AI魔音」後,你會說話,就會唱歌。

相關焦點

  • 出門問問:一家以語音交互和智能硬體為核心的AI公司
    技術方面,出門問問從2012年開始第一天開發各種算法,自然語言處理算法、語音識別,最近花了很多時間做遠場語音交互及智能喚醒這些語音算法,過去幾年積累了端到端從喚醒到語音識別、自然語言理解、內容對接、語音合成,一整套端到端語音技術方案;在產品方面,2015年第一次發布硬體之後,過去3年不到的時間總共發布4條軟硬結合的產品線,超過10個產品,50多個SKU;商業化方面,TicWatch智能手錶是2015
  • 出門問問2020:夯實內功 磨礪聚變
    對出門問問而言,越是艱難,越是使命必達的時候。回溯2020,出門問問擁抱變化、逆勢奮進。憑藉成立 8 年來在B端與C端積累的軟硬技術能力,出門問問在智能可穿戴、車載語音、TTS產品化、TWS商業落地、科技戰疫等領域,均取得突破性進展,將人工智慧的溫度帶入每個人的美好生活。
  • 出門問問發布AI音頻生產工具「魔音工坊」 加速布局企業級市場
    出門問問CEO李志飛在接受TechWeb採訪時透露,目前,出門問問公司營收主要來自消費級產品,而且公司海外營收佔比超過60%,現在企業級市場也是公司主要發力的一塊。李志飛介紹,儘管受疫情影響,今年前2個季度出門問問的業績受到一定影響,但是銷售業績在第三季已經出現強勢反彈,預計全年營收同比去年仍略有增長。
  • 百度世界2020 百度語音首席架構師賈磊詳解端到端語音交互技術
    (百度世界2020央視新聞直播間)在當天的百度大腦分論壇上,百度語音首席架構師賈磊重點講解了百度端到端語音交互技術。他表示,百度語音交互技術持續迭代升級,已發展成為基於深度學習技術的端到端的語音識別和語音合成技術。
  • 出門問問發布TicWatch Pro 3 售價2199元集成AI錄音筆功能
    DoNews10月21日消息(記者 翟繼茹)21日,出門問問推出新一代旗艦級全智能手錶TicWatch Pro 3,售價2199元,搭載高通驍龍4100可穿戴設備平臺的Wear OS by Google作業系統。
  • 達摩院發布業界首款語音合成算法專用AI FPGA晶片設計Ouroboros...
    阿里巴巴稱,這是業界首款專用於語音合成算法的 AI FPGA晶片結構設計,能將語音生成算法的計算效率提高百倍以上。根據阿里達摩院掃地僧的說法,用AI語音合成算法WaveNet生成1秒語音,CPU和GPU需要50秒的計算時間,但Ouroboros在FPGA環境下只要 0.3秒。
Ouroboros的一大突破,是用端上定製硬體加速技術替代雲端伺服器,避免了對網絡連接和雲端服務的強依賴性。
  • 最懂孩子的AI全智能兒童手錶 出門問問TicWatch Kids上市熱銷
    5月31日消息,人工智慧科技公司出門問問旗下首款AI全智能兒童手錶TicWatch Kids將於6月1日通過出門問問官方商城、天貓、京東、出門問問線下智能體驗店和黑口袋機場店開啟現貨發售,零售價為799元。6月1日兒童節當日,在出門問問線下智能體驗店購買還可享受699元優惠價格。
  • 訊飛翻譯機3.0全新升級:民族語離線翻譯功能上線啦!
    落到產品使用上來說,那就是:實現離線翻譯效果媲美在線,並且本地翻譯速度大幅提升。打開訊飛翻譯機3.0→設置→系統更新→下載→安裝更新→V8.1.4540版本升級成功。溫馨提示:升級前請先檢查翻譯機電量是否充足,請勿斷網。升級過程將持續10-15分鐘,如遇到問題,可通過微信後臺留言諮詢。
  • 出門問問入選「2018年中國獨角獸企業」榜單
    作為獨角獸企業代表,出門問問CTO雷欣受邀就「前沿科技創業」為主題,在圓桌對話環節中講述了出門問問作為AI語音賽道領軍企業如何有效地、規模化地實現營收和盈利。 此前,在2018年3月科技部火炬中心聯合中關村管委會、長城企業戰略研究所、中關村銀行發布的《2017年中國獨角獸企業榜單及趨勢研究報告》中,出門問問上榜。   出門問問是一家以語音交互和軟硬結合為核心的人工智慧公司,擁有自主研發的全棧式AI語音交互技術,並與Google、大眾汽車集團均達成戰略合作夥伴關係。
  • 問問手錶Ticwatch首發體驗獨立可穿戴設備的音樂App網易雲音樂
    這款App現已登陸問問應用商店,問問手錶Ticwatch用戶不妨前往下載體驗。首個獨立的智能手錶音樂App目前大部分音樂軟體都沒有支持可穿戴設備的獨立音樂,它們大多以離線音樂播放、手機音樂控制功能為主,無法為用戶帶來真正獨立的腕上音樂體驗,而此次出門問問Ticwatch與網易雲音樂的合作,將為移動流媒體時代掀開新的篇章。
  • 出門問問推新一代旗艦級全智能手錶TicWatch Pro 3
    北京商報訊(記者 石飛月)10月21日,人工智慧獨角獸公司出門問問面向國內市場正式推出新一代旗艦級全智能手錶TicWatch Pro 3。作為全球首款搭載高通驍龍4100可穿戴設備平臺的Wear OS by Google作業系統的全智能手錶。TicWatch Pro 3售價2199元,並通過出門問問官網、天貓、京東、海爾智家(600690,股吧)、小米有品同步開售。
  • 百度ICML論文:端對端中英文語音識別
    簡介幾十年來手工設計領域積累的知識已經進入最先進的自動語音識別(ASR)等的管道。一個簡單但有效的替代解決方案是訓練出端對端語音自動識別模式,使用深度學習的方法用一個模型來代替大多數模式。如同Hannun et al., 2014a and Graves & Jaitly, 2014b在他們的論文所提及一樣。
  • 出門問問攜手Google 發布TicHome Mini
    8月24日,正式的加入智能音箱戰局的出門問問,相隔7日之後繼續放大招。9月1日,出門問問在柏林電子消費展上發布了全新的智能音箱家居產品TicHome Mini。出門問問介紹,TicHome Mini是首批通過搭載Google Assistant的智能音箱,出門問問希望藉助谷歌完善的生態,為海外用戶帶來本地化的智能體驗。用戶可以通過Google Assistant,查詢天氣、設置鬧鐘、還可以講冷笑話。此外。Google Assistant可以幫用戶管理任務、在谷歌日曆上安排日程、用谷歌音樂播放器播放歌曲等。谷歌正在不斷加大對App應用和服務的集成力度。
  • 出門問問受邀出席極客公園創新大會 以創新使命逼近「終極自由」
    在未來趨勢論壇上,出門問問創始人&CEO李志飛發表了題為《通往人機互動「終極自由」的AI之路》主題演講,分享了何為人機互動的「終極自由」,以及對如何抵達「終極自由」的思考,闡述了出門問問作為一家以「定義下一代人機互動」為使命的公司,基於現實持續作出的創新與努力,為中國極客奉獻了思維升級的盛宴。
  • 搭上大眾的便車,出門問問是否就前途無量了?
    在論壇上我們邀請了出門問問的產品副總裁林宜立來做了一個分享。為什麼邀請這家公司呢?還要從前段時間的一個刷屏事件講起。前段時間大眾汽車集團(中國)投資了出門問問,雙方還成立了合資公司,各自持股 50%。當時我們對於這個新聞從行業角度做過一次解讀,感興趣的或者之前功課沒做到位的小夥伴兒可以再去複習一下。
  • 出門問問發布雙屏智能手錶進軍臺灣市場
    李志飛表示:「出門問問一直堅信語音交互將成為未來主流的人機互動方式之一,並致力於推動AI語音交互的落地應用。未來,智能設備將呈現碎片化、多終端的入口形態,AI語音交互設備將在人們生活中扮演更重要的角色。」
  • 出門問問TicWatch C2 Plus發布 真智能美學煥新而來
    9月20日,中國領先的人工智慧公司出門問問發布全新升級經典智能手錶TicWatch C2+,售價1399元,在天貓、京東、小米有品、得物APP等各大主流電商平臺火爆開售。在此基礎上,出門問問團隊再度加碼,推出了升級Plus版TicWatch C2+。在保留C2時尚個性的外形設計風格基礎上,全新款C2+將內部存儲提升至1GB RAM。在保留原有優勢的同時,最大程度為用戶提供更加順暢的運行速度體驗,也讓智能手錶內搭載的各式各樣功能應用價值最大化。
  • 出門問問發布TicWatch Kids 更智能的兒童AI智能手錶
    【CNMO新聞】5月24日,人工智慧公司出門問問正式發布旗下首款AI智能兒童手錶TicWatch Kids。TicWatch Kids手錶中內置出問問自主研發的中文神經網絡語音合成技術Neural TTS,通過該技術合成童聲,使其內置的AI兒童語音助手具備接近真人童聲的播報聲音。
  • 出門問問發布TicWatch C2 Plus:承襲智慧美學 提升強勁體驗
    9月20日,中國領先的人工智慧公司出門問問發布全新升級經典智能手錶TicWatch C2+,售價1399元,在天貓、京東、小米有品、得物APP等各大主流電商平臺火爆開售。在此基礎上,出門問問團隊再度加碼,推出了升級Plus版TicWatch C2+。在保留C2時尚個性的外形設計風格基礎上,全新款C2+將內部存儲提升至1GB RAM。在保留原有優勢的同時,最大程度為用戶提供更加順暢的運行速度體驗,也讓智能手錶內搭載的各式各樣功能應用價值最大化。配合1G RAM的升級,C2+推出了全新的錶盤形象。
  • 2018夏季達沃斯論壇 出門問問上榜中國AI 50榜單
    其中,AI語音賽道獨角獸公司——出門問問上榜。出門問問Mobvoi上榜【中國AI 50】榜單出門問問是一家以語音交互和智能硬體為核心的人工智慧公司,擁有自主研發的語音識別、語義理解、語音合成、智能搜索、智能推薦、計算機視覺及機器人SLAM等技術。自2012年成立後,出門問問一直致力於推動人工智慧技術在具體場景的應用落地,已成為國內人工智慧語音賽道的獨角獸企業。