文|鄰章
2016年,電影《從你的全世界路過》上映,其中有一個場景頗為令人嚮往——在去稻城亞丁的路上,楊洋飾演的茅十八使用了自己錄製的語音導航包進行導航,強烈融入的個人風格與包含的滿懷愛意,在讓大家收穫歡聲歡笑的同時,也讓無數人開始幻想什麼時候自己也能向電影中的茅十八那樣,為自己心愛的、在意的人錄製屬於專屬語音導航包。當然,嚮往歸嚮往,但大家也都明白,這是百度地圖的電影植入,而身為普羅大眾的我們要像電影中的茅十八那樣在地圖應用中錄製屬於自己的語音導航包,基本屬於不可能事件。
但科技技術的進步卻往往能將過往的不可能變為現在的可能。
9月19日,百度地圖正式發布「語音定製功能」,將此前專注於明星名人的語音定製功能開放給普通用戶群體。這讓三年前看起來怎麼也不可能實現的事情,正式走進普通用戶群體,讓每一個普通人都能錄製屬於自己的語音導航包。
普通用戶如何錄製屬於自己的語音導航包
作為全球首個地圖語音定製產品,據百度地圖介紹,用戶只需在百度地圖App 上錄製20句話,20分鐘左右即可生成個人完整語音包。從個人實際體驗來看,整個語音錄製操作可以說是非常簡單的,基本不存在使用門檻。在百度地圖中,實際上有多個路徑可以實現語音語音導航包的錄製。
首先說最簡單的方法:打開百度地圖App,語音喚醒「小度小度」後說「錄製我的語音」即可直接跳轉到語音錄製選擇界面,然後按照界面提升進行操作即可。個人認為這是最為省步驟的方法。
當然,也還有稍微複雜的方法,具體來說是:
1、打開百度地圖App,擊百度地圖首頁的「路線」、「出行助手」、「個人中心」等按鈕後再選擇「語音定製」,進入相應頁面。
2、進入頁面後,點擊最下方的懸浮按鈕「錄製我的語音」便可進入語音錄製選擇界面,進行錄製選擇。
3、按照規則提升,確認後即可開啟專屬語音定製。
當然,上述兩種方法,均需要用戶在錄入完語音文本後,在等待20分鐘左右的專屬語音包的生成時間。
背後黑科技——說話人韻律遷移技術Meitron
於是,問題隨之而來,百度地圖是如何讓這件三年前看起來怎麼也不可能實現的事情,正式走進普通用戶群體,讓我們普通人都能錄製屬於自己的語音導航包?
其背後離不開百度獨創的說話人韻律遷移技術 Meitron這一黑科技的支撐。這個技術可以將語音中的音色、風格、情感等要素映射到不同的子空間,在使用時,不同要素可以任意組合,靈活的控制合成語音的風格。作為百度大腦5.0在語音技術上交出的成績單之一,事實上,這技術是專門為了解決現階段語音合成技術面臨的風格遷移、音色模擬和情感擬人這三大挑戰而誕生。從相關資料來看,自2016年開始,百度就通過採用深度學習的離線參數合成、全面深度學習的EMPHASIS聲學建模、Tacotron+WaveRNN的聯合訓練等新技術來訓練、提升語音合成產品落地,時至今日已經逐漸取得行業領先的語音合成產品體驗成果。
百度語音首席架構師賈磊介紹:「百度地圖語音定製功能基於百度獨創的風格遷移技術Meitron模型,其特點主要體現在音色轉換、多情感朗讀和韻律遷移三個方面」。具體來說,多情感朗讀是指通過MEITRON技術,合成的語音可以注入不同的情感,韻律遷移是指同一個人的聲音可以講出不同風格的文本,音色轉換是指可以用少量語音就可以合成一個人的專屬音庫。而這三重優勢的加持,也使得語音合成效果變得更加逼真、豐富,用戶體驗也得到了提升。的確,從個人實際體驗來看,此言非虛。
百度為什麼要在百度地圖開放「語音定製功能」?
在此,我們也不得不談一下這樣一個現實問題:百度面向億級用戶開放語音定製功能,讓每一個普通用戶都能通過百度的語音合成技術簡單快捷的生成專屬於自己的語音導航包,目的何在?或者說能夠帶來什麼?個人淺顯看來,大致可能有三重目的。
從用戶的角度來看,百度地圖開放語音定製功能,首先是有助於滿足用戶的個性化需求,實現真正的千人千面。如我們所見,百度地圖作為國民級導航軟體,每天都有億級用戶在使用它進行導航。在此之前,百度地圖為了增添語音導航的人性化與趣味性,邀請了湯唯、楊洋等明星錄製語音導航包,以滿足用戶需求。
但是,明星雖然擁有強大的號召力,能夠吸引愛豆們使用,但卻也有圈層的限制,不可能人人都喜歡某一位明星的語音導航風格,這是現實。
而此番百度面向用戶開放語音定製功能,將定製的權利下放到了用戶的手中,讓每一位用戶都能通過簡單幾步就能擁有自己的語音導航包,對於滿足用戶個性化需求,實現真正的千人千面都大有裨益。
其次,這也是百度踐行科技溫情,以技術賦能用戶的又一體現。百度一直認為,真正的科技不應是冷冰冰的存在,應該有人文關懷融合其中。百度此次在百度地圖上開放的放語音定製功能,個人看來正是如此。
如我們所見,在語音導航定製包中我們不僅可以錄製自己的語音,也可以錄製父母、愛人、孩子的語音導航包。
想像一下,在駕車過程中,聽到的不是明星語音導航,而是自己父母、愛人或是孩子的語音導航,會是怎麼樣的一種心情與體驗?可以說,相對於明星語音導航包,自己錄製的語音導航包,顯然是更能拉近更具人性溫情的存在,而這恐怕才是真正意義上的技術普惠、賦能眾生吧。當然,這也將會進一步拉近用戶與產品之間的距離。
同時,百度地圖放語音定製功能也是自身語音技術對外的一次實力展示。如上所述,語音識別與合成技術,在當下既是業界研究熱點也是科研難點,百度在此領域也是耕耘良久,並斬獲頗豐。
而百度此番在百度地圖這一國民級導航平臺上開放語音定製功能,可以說就是對自家語音合成技術進行的一次前所未有的大練兵,而這顯然離不開技術自信的底氣支撐。試想,如果沒有對自家技術能力的足夠自信,如此大規模地開放給用戶,任誰恐怕也不敢輕易嘗試,畢竟體驗不佳帶來的口碑翻車打的是自己的臉。
透過百度地圖,我們看到了百度獨創的說話人韻律遷移技術Meitron所帶來的科技溫情。在此,我們也不難發現這樣一個現實:基於百度大腦5.0的說話人韻律遷移技術Meitron,不僅可以落地到百度地圖上,還可以落地教育產品、陪伴機器人等在其他產品上,而這無疑為該技術帶來了更大的想像空間。可以說,百度地圖只是開始,未來空間不可估量。
註:文中圖片源自網絡;文章轉載請註明出處。
作者:鄰章【微信號:ZLxgic 公眾號:TMT317】,關注智慧型手機、人工智慧、消費&產業網際網路等。